mineru-pdf
Parse PDFs locally (CPU) into Markdown/JSON using MinerU. Assumes MinerU creates per‑doc output folders; supports table/image extraction.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Parse PDFs locally (CPU) into Markdown/JSON using MinerU. Assumes MinerU creates per‑doc output folders; supports table/image extraction.
How to use
Upewnij się, że MinerU jest zainstalowany na twoim systemie oraz że umiejętność mineru-pdf jest dostępna w twoim środowisku agenta.
Przygotuj ścieżkę do pliku PDF, który chcesz przetworzyć. Plik musi być dostępny lokalnie na dysku.
Uruchom skrypt parsowania z katalogu umiejętności, podając ścieżkę do pliku:
./scripts/mineru_parse.sh /ścieżka/do/pliku.pdf. Domyślnie wynik zostanie zapisany w formacie Markdown w folderze./mineru-output/.Jeśli chcesz zmienić format wyjścia na JSON, dodaj flagę
--format json:./scripts/mineru_parse.sh /ścieżka/do/pliku.pdf --format json.Aby ekstrahować tabele i obrazy z dokumentu, użyj flag
--tables --images:./scripts/mineru_parse.sh /ścieżka/do/pliku.pdf --tables --images. Możesz połączyć te flagi z wyborem formatu.Sprawdź folder wyjściowy – MinerU automatycznie utworzy podfolder o nazwie opartej na nazwie dokumentu (np.
./mineru-output/nazwa_pliku/), w którym znajdziesz przetworzony plik Markdown lub JSON oraz ekstrahowane zasoby.