- Pięć miejsc na pliki
- 1. Unity Catalog volumes — domyślny wybór
- 2. Workspace files — małe pliki obok notebooków
- 3. Cloud object storage przez URI — bezpośrednio
- 4. DBFS root i DBFS mounts — DEPRECATED 😈
- 5. Ephemeral storage drivera — pamięć ulotna
- Tabelka porównawcza (bo każdy ją chce)
- Dwie pułapki, na które każdy się nadziewa
- Co z tego wynika
Jak ktoś zaczyna z Databricks, to pierwsze pytanie po "jak postawić cluster?" brzmi: "a gdzie ja właściwie wrzucę ten CSV?" 🏗️
Brzmi banalnie ale nie zawsze tak jest. W Databricks masz pięć różnych miejsc, w których może przetrzymywać pliki — i każde działa trochę inaczej. Część jest rekomendowana, część deprecated, część znika po restarcie clustra. Postanowiłem to wszystko poukładać w jednym miejscu, bo sam się kiedyś w tym pogubiłem 😅
Pięć miejsc na pliki
Oto cały katalog opcji, które . . .
Ta zawartość jest przeznaczona tylko dla uczestników opłacających abonament. Wejdź w ikonę swojego użytkownika w prawym górnym rogu, a następnie "Platności i Konto".
