data-extractor
Extract structured data from any document format using unstructured - unified document processing
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Extract structured data from any document format using unstructured - unified document processing
How to use
Przygotuj dokument do przetworzenia — obsługiwane są PDF, dokumenty Word, arkusze Excel, emaile, strony HTML, obrazy i wiele innych formatów.
Przekaż dokument umiejętności wraz z opcjonalnym opisem, co chcesz wyciągnąć. Na przykład: "Wyciągnij wszystkie tabele z tego PDF-a", "Sparsuj tego emaila i zwróć treść oraz załączniki" lub "Przekonwertuj tę stronę HTML na strukturalne elementy".
Umiejętność automatycznie wykryje format dokumentu i zastosuje odpowiednią funkcję przetwarzania z biblioteki unstructured.
Otrzymasz wyodrębnionych elementy z metadanymi — każdy element zawiera typ, tekst i informacje o pochodzeniu. Dane są już ustrukturyzowane i gotowe do dalszego użytku.
Możesz przetwarzać wiele dokumentów naraz, mieszając różne formaty w jednym żądaniu — umiejętność obsługuje je jednakowo.