docetl

Name: docetl
Author: ucbepic

by ucbepic

Build and run LLM-powered data processing pipelines with DocETL. Use when users say \

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author: ucbepic
Category: DevOps
Views: 8

GitHub repo

About this skill

Build and run LLM-powered data processing pipelines with DocETL. Use when users say \

How to use

Zainstaluj umiejętność DocETL w swoim środowisku Claude, wskazując repozytorium https://github.com/ucbepic/docetl/tree/main/.claude/skills/docetl.
Rozpocznij od fazy zbierania danych: napisz skrypt, który pobierze lub załaduje dokumenty z Twojego źródła (pliki, API, baza danych). Uruchom go natychmiast i sprawdź wyniki – zobacz liczbę dokumentów, strukturę pól, przykładowe rekordy i rozkład długości tekstu. Jeśli dane wyglądają źle, popraw skrypt i spróbuj ponownie.
Przejdź do fazy rozwoju potoku: przeczytaj kilka przykładowych dokumentów, aby zrozumieć ich format. Napisz plik YAML definiujący potok przetwarzania, dodając parametr sample: 10-20 do testowania na małym zbiorze. Uruchom potok testowy i sprawdź jakość ekstrakcji – czy wyodrębnione dane są poprawne, czy schemat działa.
Iteruj nad promptami i schematem na podstawie wyników testowych. Gdy wyniki będą zadowalające, usuń parametr sample i uruchom potok na pełnym zbiorze danych.
W fazie wizualizacji napisz skrypt generujący wykresy i tabele na podstawie rzeczywistej struktury wyjściowej. Uruchom skrypt i pokaż raport użytkownikowi. Jeśli wizualizacja wymaga poprawy, dostosuj wykresy i uruchom ponownie.
Nigdy nie pisz wszystkich skryptów naraz i nie uruchamiaj ich razem – pracuj fazami, walidując każdą przed przejściem do następnej. To podejście pozwala szybko wykryć problemy i iterować efektywnie.

Related skills

senior-computer-vision

by davila7

World-class computer vision skill for image/video processing, object detection, segmentation, and visual AI systems. Expertise in PyTorch, OpenCV, YOLO, SAM, diffusion models, and vision transformers. Includes 3D vision, video analysis, real-time processing, and production

DevOps

1044

grafana-dashboards

by wshobson

Create and manage production Grafana dashboards for real-time visualization of system and application metrics. Use when building monitoring dashboards, visualizing metrics, or creating operational observability interfaces.

DevOps

92262

pmbok-project-management

by jgtolentino

Comprehensive PMP/PMBOK project management methodologies and best practices. Use this skill when users need guidance on project management processes, templates, knowledge areas, process groups, tools, techniques, or certification preparation. Covers all 10 PMBOK Knowledge Areas

DevOps

21133

unity-developer

by sickn33

Build Unity games with optimized C# scripts, efficient rendering, and proper asset management. Masters Unity 6 LTS, URP/HDRP pipelines, and cross-platform deployment. Handles gameplay systems, UI implementation, and platform optimization. Use PROACTIVELY for Unity performance

DevOps

66164

clawhub

by openclaw

Use the ClawHub CLI to search, install, update, and publish agent skills from clawhub.com. Use when you need to fetch new skills on the fly, sync installed skills to latest or a specific version, or publish new/updated skill folders with the npm-installed clawhub CLI.

DevOps

14106

file-organizer

by ComposioHQ

Intelligently organizes your files and folders across your computer by understanding context, finding duplicates, suggesting better structures, and automating cleanup tasks. Reduces cognitive load and keeps your digital workspace tidy without manual effort.

DevOps

1399