markdown-converter
Convert documents and files to Markdown using markitdown. Use when converting PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx, .xls), HTML, CSV, JSON, XML, images (with EXIF/OCR), audio (with transcription), ZIP archives, YouTube URLs, or EPubs to Markdown format for LLM
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Convert documents and files to Markdown using markitdown. Use when converting PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx, .xls), HTML, CSV, JSON, XML, images (with EXIF/OCR), audio (with transcription), ZIP archives, YouTube URLs, or EPubs to Markdown format for LLM processing or text analysis.
How to use
Otwórz terminal i przejdź do folderu z plikiem, który chcesz skonwertować. Upewnij się, że masz zainstalowany Python i dostęp do polecenia uvx (część ekosystemu Python).
Aby skonwertować plik do Markdown i wyświetlić wynik w terminalu, wpisz: uvx markitdown nazwa_pliku.pdf (zastąp .pdf rozszerzeniem swojego pliku — obsługiwane są .docx, .xlsx, .pptx, .html i wiele innych).
Aby zapisać wynik do pliku, dodaj flagę -o: uvx markitdown dokument.docx -o dokument.md. Plik wyjściowy pojawi się w tym samym folderze.
Jeśli konwertujesz plik ze stdin (na przykład z potoku), możesz podać wskazówkę o typie pliku flagą -x: cat plik | uvx markitdown -x .pdf -o wynik.md.
Dla skomplikowanych plików PDF z trudną do wyodrębnienia zawartością użyj Azure Document Intelligence, dodając flagi -d i -e z adresem URL Twojego zasobu: uvx markitdown scan.pdf -d -e https://twoj-zasob.cognitiveservices.azure.com/.
Pierwsza konwersja pobierze zależności i będzie trwać dłużej; kolejne uruchomienia będą szybsze dzięki cache'owaniu.