docetl
Build and run LLM-powered data processing pipelines with DocETL. Use when users say \
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Build and run LLM-powered data processing pipelines with DocETL. Use when users say \
How to use
Zainstaluj umiejętność DocETL w swoim środowisku Claude, wskazując repozytorium https://github.com/ucbepic/docetl/tree/main/.claude/skills/docetl.
Rozpocznij od fazy zbierania danych: napisz skrypt, który pobierze lub załaduje dokumenty z Twojego źródła (pliki, API, baza danych). Uruchom go natychmiast i sprawdź wyniki – zobacz liczbę dokumentów, strukturę pól, przykładowe rekordy i rozkład długości tekstu. Jeśli dane wyglądają źle, popraw skrypt i spróbuj ponownie.
Przejdź do fazy rozwoju potoku: przeczytaj kilka przykładowych dokumentów, aby zrozumieć ich format. Napisz plik YAML definiujący potok przetwarzania, dodając parametr
sample: 10-20do testowania na małym zbiorze. Uruchom potok testowy i sprawdź jakość ekstrakcji – czy wyodrębnione dane są poprawne, czy schemat działa.Iteruj nad promptami i schematem na podstawie wyników testowych. Gdy wyniki będą zadowalające, usuń parametr
samplei uruchom potok na pełnym zbiorze danych.W fazie wizualizacji napisz skrypt generujący wykresy i tabele na podstawie rzeczywistej struktury wyjściowej. Uruchom skrypt i pokaż raport użytkownikowi. Jeśli wizualizacja wymaga poprawy, dostosuj wykresy i uruchom ponownie.
Nigdy nie pisz wszystkich skryptów naraz i nie uruchamiaj ich razem – pracuj fazami, walidując każdą przed przejściem do następnej. To podejście pozwala szybko wykryć problemy i iterować efektywnie.