Comprehensive PDF manipulation toolkit for extracting text and tables, creating new PDFs, merging/splitting documents, and handling forms. When Claude needs to fill in a PDF form or programmatically process, generate, or analyze PDF documents at scale.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Comprehensive PDF manipulation toolkit for extracting text and tables, creating new PDFs, merging/splitting documents, and handling forms. When Claude needs to fill in a PDF form or programmatically process, generate, or analyze PDF documents at scale.
How to use
Zainstaluj bibliotekę pypdf, która stanowi podstawę tego zestawu narzędzi:
pip install pypdf. Biblioteka ta obsługuje wszystkie podstawowe operacje na plikach PDF.Aby wyodrębnić tekst z dokumentu, wczytaj plik za pomocą PdfReader, przejdź przez wszystkie strony i zbierz tekst: dla każdej strony użyj metody extract_text(), a wyniki połącz w jeden ciąg znaków.
Do scalenia kilku plików PDF utwórz nowy PdfWriter, wczytaj każdy dokument źródłowy za pomocą PdfReader, dodaj wszystkie strony z każdego pliku do writera, a następnie zapisz wynik w nowym pliku.
Aby podzielić dokument na osobne pliki, wczytaj PDF, iteruj po każdej stronie, utwórz dla niej nowy PdfWriter, dodaj stronę i zapisz jako oddzielny plik (np. page_1.pdf, page_2.pdf).
Jeśli potrzebujesz wypełnić formularz PDF, zapoznaj się z dokumentacją forms.md dostępną w repozytorium – zawiera ona szczegółowe instrukcje i przykłady dla tej zaawansowanej operacji.
Do bardziej złożonych zadań, takich jak ekstrakcja tabel lub zaawansowana analiza, rozważ użycie biblioteki pdfplumber – dokumentacja reference.md zawiera przykłady i porównanie dostępnych bibliotek.