markitdown
Convert various file formats (PDF, Office documents, images, audio, web content, structured data) to Markdown optimized for LLM processing. Use when converting documents to markdown, extracting text from PDFs/Office files, transcribing audio, performing OCR on images, extracting
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Convert various file formats (PDF, Office documents, images, audio, web content, structured data) to Markdown optimized for LLM processing. Use when converting documents to markdown, extracting text from PDFs/Office files, transcribing audio, performing OCR on images, extracting YouTube transcripts, or processing batches of files. Supports 20+ formats including DOCX, XLSX, PPTX, PDF, HTML, EPUB, CSV, JSON, images with OCR, and audio with transcription.
How to use
- Zainstaluj MarkItDown jako zależność w swoim projekcie Python. Narzędzie wymaga Pythona 3.8+ i jest dostępne w repozytorium GitHub (microsoft/markitdown). 2. Przygotuj plik do konwersji — może to być dokument Office (DOCX, XLSX, PPTX), PDF, obraz (PNG, JPG, GIF), plik audio (MP3, WAV), HTML, CSV, JSON, XML, EPUB lub link do YouTube'a. 3. Uruchom konwersję za pomocą skryptu lub API MarkItDown, podając ścieżkę do pliku wejściowego. Narzędzie automatycznie wykryje format i zastosuje odpowiednią metodę przetwarzania. 4. Dla obrazów zawierających tekst lub skanów dokumentów aktywuj OCR — MarkItDown wyodrębni tekst i strukturę. Dla plików audio narzędzie przeprowadzi transkrypcję do tekstu. 5. Otrzymasz wynik w formacie Markdown, gotowy do bezpośredniego użytku w promptach dla modeli AI lub jako źródło do dalszej edycji. 6. W przypadku przetwarzania wielu plików możesz zautomatyzować proces, przetwarzając całe foldery lub archiwa ZIP — MarkItDown obsługuje przetwarzanie wsadowe.