techniczne
- Uprawnienia w Linux (centos, ubuntu)
- Grupy w Linux (centos, ubuntu)
- Tworzenie użytkownika w Linux (centos, ubuntu)
- Jak zbudowany jest Apache Ozone?
- Apache Spark: Jak napisać prosty mechanizm AI porównywania tekstów?
- HBase: jak zbudowany jest model danych?
- Zrozumieć sparka: uruchamianie joba na serwerze (spark submit)
- Zrozumieć Sparka: cache vs persist
- Jak usunąć duplikaty w Sparku? (distinct vs dropDuplicates)
- Spark: Jak “eksplodować” elementy listy na wiele rekordów (explode vs explodeOuter)
- Spark: Jak zmienić nazwę kolumny? (withColumnRenamed, alias, as, name – różnice)
- Zrozumieć Sparka: join
- Spark: Jak zmienić dataframe w dataset tak, żeby to działało?
- Najczęstsze problemy ze starym Sparkiem (1.X) – co warto wiedzieć, zaczynając projekt
- Jak eksportować ścieżki w Linux?
- Jak działa HDFS? [Architektura]
- Jak odzyskać utraconą tabelę w Hive? [Hive + HDFS]
- Spark: czy joby (akcje) mogą iść równolegle?
- Apache Spark: Jak działają akcje i transformacje?
- Jak działa git? Podstawowe informacje, flow i komendy
- Czym jest Databricks? Ogólny przegląd technologii
- Databricks: jak założyć klucz na kolumnie po jej utworzeniu? (alter)
- Apache Spark: jak przefiltrować dane “po ostatnich X minutach”? (/Structured Streaming)
- Apache Spark: Jak w losowych miejscach DataFrame dodać nulle?
- Jak dokonałem transkrypcji odcinków podcastu z użyciem “Whisper” OpenAI? [podstawowy poradnik]
- Jak wygląda Solr UI i jak z niego korzystać?
- Solr: Core Container is either not initialized or shutting down.
- Czym różnią się struktury Sparkowe? (Dataset vs Dataframe vs RDD)