pdf-ocr-extraction
Extract text from scanned PDFs using optical character recognition
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Extract text from scanned PDFs using optical character recognition
How to use
Zainstaluj skill PDF OCR Extraction w swoim środowisku Claude'a, wybierając wersję claude-sonnet-4 lub claude-opus-4 jako model bazowy. Skill wymaga dostępu do narzędzi operacji na plikach i komputera.
Przygotuj dokument do przetworzenia — może to być skan PDF, zdjęcie dokumentu lub plik PDF oparty na obrazach. Upewnij się, że dokument jest czytelny i dobrze oświetlony, aby uzyskać najlepsze wyniki rozpoznawania.
Użyj podstawowego polecenia OCR, na przykład: "Wyciągnij tekst z tego skanowanego PDF" lub "Uczyń ten dokument przeszukiwalnym". Skill automatycznie wykryje język i przeliczy całą zawartość.
Jeśli chcesz przetwarzać tylko wybrane strony lub potrzebujesz określonego formatu wyjścia, dodaj opcje do polecenia, takie jak: "Wyciągnij tekst ze stron 1-10" lub "Wyciągnij i zwróć jako dane strukturalne".
Przejrzyj wynik ekstrakcji — skill zwraca tekst z informacją o liczbie przetworzonych stron, wykrytym języku i poziomie pewności. W przypadku tekstu ręcznie pisanego lub złożonych tabel sprawdź wynik i dokonaj ewentualnych poprawek ręcznych.
Dla przetwarzania wielu dokumentów powtórz proces dla każdego pliku lub użyj funkcji przetwarzania wsadowego, jeśli przetwarzasz większą liczbę dokumentów naraz.