techniczne
- Uprawnienia w Linux (centos, ubuntu)
- Grupy w Linux (centos, ubuntu)
- Tworzenie użytkownika w Linux (centos, ubuntu)
- Jak zbudowany jest Apache Ozone?
- Apache Spark: Jak napisać prosty mechanizm AI porównywania tekstów?
- HBase: jak zbudowany jest model danych?
- Zrozumieć sparka: uruchamianie joba na serwerze (spark submit)
- Zrozumieć Sparka: cache vs persist
- Jak usunąć duplikaty w Sparku? (distinct vs dropDuplicates)
- Spark: Jak “eksplodować” elementy listy na wiele rekordów (explode vs explodeOuter)
- Spark: Jak zmienić nazwę kolumny? (withColumnRenamed, alias, as, name – różnice)
- Zrozumieć Sparka: join
- Spark: Jak zmienić dataframe w dataset tak, żeby to działało?
- Najczęstsze problemy ze starym Sparkiem (1.X) – co warto wiedzieć, zaczynając projekt
- Jak eksportować ścieżki w Linux?
- Jak działa HDFS? [Architektura]
- Jak odzyskać utraconą tabelę w Hive? [Hive + HDFS]
- Spark: czy joby (akcje) mogą iść równolegle?