Umiejętności “webowe” w data engineeringu

  • Umiejętności “webowe” w data engineeringu

    Posted by Marek Czuma on 2026-01-21 at 10:04

    Hej, chciałem was podpytać – jak często zdarza wam się wykorzystywać umiejętności “webowe” w DE? Myślę tu przede wszystkim o łączeniu się z jakimś API – czy to żebyu pobrać, czy żeby wysłać dane.

    Ja mam już kolejny projekt gdzie muszę to wykorzystywać. Tym razem w projekcie pracujemy na tabelach deltowych (databricks) i wynik komunikujemy z zewnętrznym API – ale nie tylko wysyłamy. Musimy też odebrać i obsłużyć odpowiedzi – a wiem ze na kolejnych etapach ta logika ma być jeszcze rozbudowana.

    Ciekawi mnie na ile to akurat moja bańka, a na ile realnie to jest potrzebne. Bo szczerze, mało o tym mówiłem, a może też warto. Wręcz może jakiś mikrokursik dla osób, które nie znają zupełnie api restowego, statusów odpowiedzi itd – dajcie znać jaka jest wasa perspektywa:-)

    Marek Czuma replied 1 week ago 3 Members · 5 Replies
  • 5 Replies
  • Dominik Szcześniak

    Member
    2026-01-21 at 10:25
    214 Exp

    Hej,

    Jak najbardziej korzysta się z API.

    Nawet takie mniej zaawansowane rozwiązania czasem wzbogacają swoje dane przez API (np. w PBI’u samym możesz też sobie wyciągać dane z API, wiem, że ludzie np. często kursy walut sobie tak integrują).

    Także mini- kursik odnośnie odpytywania API jak najbardziej, myślę, że to super pomysł.

    A przy okazji jego tworzenia, możesz wrzucić jakieś urywki/ 1 moduł/ 1 problem na YT, żeby ruch zgarnąć stamtąd 🙂

    Często też przez API można pobierać sobie metadane (vide PBI Service).

    Samo korzystanie z API często jest też w popelinach CI/CD, np. triggerujesz refresh./ jakaś akcje.

    Także uważam, że to dobry pomysł. 🙂

    • Marek Czuma

      Organizer
      2026-01-21 at 10:54
      4087 Exp

      Dzięki za odpowiedź. A czego tam w power bi się używa? Ja z nim nie pracowałem – w pythonie jest bardzo fajna biblioteka requests. Polecam każdemu – łatwo się ogarnia dość:-). I chat gpt też ją ogarnia 😀

      • Dominik Szcześniak

        Member
        2026-01-21 at 20:17
        214 Exp

        Tam jest connector po prostu webowy 🙂 a jak ktoś bardziej kumaty, to sobie w Power Query buduje strukturę payloada np. 🙂 do prostych API spoko, ale jak są jakieś paginacje itp., to Python. 🙂

        Power BI raczej jako ciekawostka, ale też spotykana 🙂

  • Andrzej Tkaczyk

    Member
    2026-02-03 at 08:03
    368 Exp

    Ja na codzień pracuję w web scrapingu, więc dla mnie korzystanie z API i obsługa odpowiedzi to chleb powszedni 🙂 Myślę, że w kontekście szerszego DE też jest to wiedza przydatna: dzięki temu możemy zrobić zasilanie naszego pipeline danymi z jakiegoś API, albo stworzyć jakąś integracje (kurs NBP, pogoda w jakimś miejscu, status zamówienia etc) na dalszym etapie, tak jak Dominik wspominał.

    Uważam, że warto poruszyć w minikursie:

    Rodzaje zapytań GET/POST/HEAD i wspomnieć o innych

    Statusy odpowiedzi 200/301/405 (najpopularniejsze)

    Nagłówki (headers) – co to jest i jakie mają znaczenie

    Rodzaje autentykacji i autoryzacji

    Potencjalne problemy podczas pracy z API, przykładowe błędne odpowiedzi

    Pozdrawiam 🙂

    • Marek Czuma

      Organizer
      2026-02-03 at 10:04
      4087 Exp

      Super Andrzej, dzięki! A czego Ty używasz do profesjonalnego web scrappingu?

Zaloguj się aby odpowiedzieć