Apache Spark: Narrow vs Wide Transformations (/dependencies)

Z grubsza ogarniesz to w: 3 min


Autor: Marek Czuma

Czym są transformacje wąskie i szerokie (narrow/wide)? To jeden z kluczowych elementów Apache Spark. Zaparz swoją ulubioną kawusię, włącz dobrą muzykę, uruchom Intellij i... zapraszam na podróż kodersko-architektoniczną!

Krótka odpowiedź na rozgrzewkę

Krótka odpowiedź: narrow (wąskie) transformations to te, które nie powodują shufflingu, a wide – powodują. Jeśli użyjemy jakiejś wide transformation, to powoduje ona w DAGu krok “exchange”, otwierając nowy stage.

W narrow z 1 partycji wychodzi 1 partycja (upraszczając). W wide dane s . . .

Ta zawartość jest przeznaczona tylko dla uczestników opłacających abonament. Wejdź w ikonę swojego użytkownika w prawym górnym rogu, a następnie "Platności i Konto".