techniczne
Uprawnienia w Linux (centos, ubuntu)
Grupy w Linux (centos, ubuntu)
Tworzenie użytkownika w Linux (centos, ubuntu)
Jak zbudowany jest Apache Ozone?
Apache Spark: Jak napisać prosty mechanizm AI porównywania tekstów?
HBase: jak zbudowany jest model danych?
Zrozumieć sparka: uruchamianie joba na serwerze (spark submit)
Zrozumieć Sparka: cache vs persist
Jak usunąć duplikaty w Sparku? (distinct vs dropDuplicates)
Spark: Jak “eksplodować” elementy listy na wiele rekordów (explode vs explodeOuter)
Spark: Jak zmienić nazwę kolumny? (withColumnRenamed, alias, as, name – różnice)
Zrozumieć Sparka: join
Spark: Jak zmienić dataframe w dataset tak, żeby to działało?
Najczęstsze problemy ze starym Sparkiem (1.X) – co warto wiedzieć, zaczynając projekt
Jak eksportować ścieżki w Linux?
Jak działa HDFS? [Architektura]
Jak odzyskać utraconą tabelę w Hive? [Hive + HDFS]
Spark: czy joby (akcje) mogą iść równolegle?
Apache Spark: Jak działają akcje i transformacje?
Jak działa git? Podstawowe informacje, flow i komendy
Czym jest Databricks? Ogólny przegląd technologii
Databricks: jak założyć klucz na kolumnie po jej utworzeniu? (alter)
Apache Spark: jak przefiltrować dane “po ostatnich X minutach”? (/Structured Streaming)
Apache Spark: Jak w losowych miejscach DataFrame dodać nulle?
Jak dokonałem transkrypcji odcinków podcastu z użyciem “Whisper” OpenAI? [podstawowy poradnik]
Jak wygląda Solr UI i jak z niego korzystać?
Solr: Core Container is either not initialized or shutting down.
Czym różnią się struktury Sparkowe? (Dataset vs Dataframe vs RDD)
Co to jest Spark UI? Przegląd
Spark Session vs Spark Context – czym się różnią?
Apache Spark: Narrow vs Wide Transformations (/dependencies)
Apache Spark: Jakie są dostępne strategie partycjonowania?
Apache Spark: jak sprawdzić strategię partycjonowania DataFrame?
Spark: Jak ustawić domyślną strefę czasową?
Spark: Jak sprawdzić data skewness w jobie? (+ co to jest data skewness)
Scala: Trait vs Abstract Class
Spark – Struktura pamięci executora
Apache Spark: Czym Jest Query Plan?
Czym jest architektura Master-Slave?
Apache Spark: jak jest zbudowany? (Architektura)
Apache Spark: Co to jest i jak sprawdzić predicate pushdown oraz column pruning?
Czym jest i jak działa Object Storage?
Spark: Jak Rozwiązać problem Data Skewnes przy pomocy Saltingu?
Linux: Najpopularniejsze komendy terminala
Linux: Wszystko, co musisz wiedzieć o katalogach (folderach)
Linux: Najważniejsze narzędzia sieciowe (przegląd)
Linux: Jak sprawdzić adres IP?
Linux: Jak sprawdzić, czy port na serwerze jest otwarty?
Jak sprawdzić, które procesy nasłuchują na jakich portach?
Jak wyświetlić aktywne interfejsy sieciowe?