Globalna Grupa ABD
Globalna Grupa jest jak rynek, na którym możemy się wszyscy spotkać. To tutaj możemy podzielić się... View more
spark – 2 różne wyniki
-
spark – 2 różne wyniki
Siema, są tutaj spece od Sparka? 😀
Mam streaming danych z kafki (która dostaje dane z debezium, ale to chyba nie jest istotne) do formatu Iceberg. No i w zależności od tego jak napiszę zapytanie do zapisanych danych, to dostaję inny wynik. Po plikach widzę, że robi się automatycznie jakaś retencja metadanych, no ale zakładam, że nie powinno mieć to wpływu na same dane. Czy to jest kwestia jakiegoś sparkowego optymalizatora, który próbuje sobie pomóc metadanymi w przetwarzaniu zadania? ( min(offset) jest moją miarką)
Zaloguj się aby odpowiedzieć