Toolverse
All skills

markdown-converter

by steipete

Convert documents and files to Markdown using markitdown. Use when converting PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx, .xls), HTML, CSV, JSON, XML, images (with EXIF/OCR), audio (with transcription), ZIP archives, YouTube URLs, or EPubs to Markdown format for LLM

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author
steipete
Category
Data Science
Views
24

About this skill

Convert documents and files to Markdown using markitdown. Use when converting PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx, .xls), HTML, CSV, JSON, XML, images (with EXIF/OCR), audio (with transcription), ZIP archives, YouTube URLs, or EPubs to Markdown format for LLM processing or text analysis.

How to use

  1. Otwórz terminal i przejdź do folderu z plikiem, który chcesz skonwertować. Upewnij się, że masz zainstalowany Python i dostęp do polecenia uvx (część ekosystemu Python).

  2. Aby skonwertować plik do Markdown i wyświetlić wynik w terminalu, wpisz: uvx markitdown nazwa_pliku.pdf (zastąp .pdf rozszerzeniem swojego pliku — obsługiwane są .docx, .xlsx, .pptx, .html i wiele innych).

  3. Aby zapisać wynik do pliku, dodaj flagę -o: uvx markitdown dokument.docx -o dokument.md. Plik wyjściowy pojawi się w tym samym folderze.

  4. Jeśli konwertujesz plik ze stdin (na przykład z potoku), możesz podać wskazówkę o typie pliku flagą -x: cat plik | uvx markitdown -x .pdf -o wynik.md.

  5. Dla skomplikowanych plików PDF z trudną do wyodrębnienia zawartością użyj Azure Document Intelligence, dodając flagi -d i -e z adresem URL Twojego zasobu: uvx markitdown scan.pdf -d -e https://twoj-zasob.cognitiveservices.azure.com/.

  6. Pierwsza konwersja pobierze zależności i będzie trwać dłużej; kolejne uruchomienia będą szybsze dzięki cache'owaniu.

Related skills