pdf-ocr-extraction

Name: pdf-ocr-extraction
Author: openclaw

by openclaw

Extract text from scanned PDFs using optical character recognition

Installation

Pick a client and clone the repository into its skills directory.

Installation

Quick info

Author: openclaw
Category: Security
Views: 24

GitHub repo

About this skill

Extract text from scanned PDFs using optical character recognition

How to use

Zainstaluj skill PDF OCR Extraction w swoim środowisku Claude'a, wybierając wersję claude-sonnet-4 lub claude-opus-4 jako model bazowy. Skill wymaga dostępu do narzędzi operacji na plikach i komputera.
Przygotuj dokument do przetworzenia — może to być skan PDF, zdjęcie dokumentu lub plik PDF oparty na obrazach. Upewnij się, że dokument jest czytelny i dobrze oświetlony, aby uzyskać najlepsze wyniki rozpoznawania.
Użyj podstawowego polecenia OCR, na przykład: "Wyciągnij tekst z tego skanowanego PDF" lub "Uczyń ten dokument przeszukiwalnym". Skill automatycznie wykryje język i przeliczy całą zawartość.
Jeśli chcesz przetwarzać tylko wybrane strony lub potrzebujesz określonego formatu wyjścia, dodaj opcje do polecenia, takie jak: "Wyciągnij tekst ze stron 1-10" lub "Wyciągnij i zwróć jako dane strukturalne".
Przejrzyj wynik ekstrakcji — skill zwraca tekst z informacją o liczbie przetworzonych stron, wykrytym języku i poziomie pewności. W przypadku tekstu ręcznie pisanego lub złożonych tabel sprawdź wynik i dokonaj ewentualnych poprawek ręcznych.
Dla przetwarzania wielu dokumentów powtórz proces dla każdego pliku lub użyj funkcji przetwarzania wsadowego, jeśli przetwarzasz większą liczbę dokumentów naraz.

Related skills

qmd

by tobi

Search personal markdown knowledge bases, notes, meeting transcripts, and documentation using QMD - a local hybrid search engine. Combines BM25 keyword search, vector semantic search, and LLM re-ranking. Use when users ask to search notes, find documents, look up information in

Security

1951

obsidian

by gapmiss

Comprehensive guidelines for Obsidian.md plugin development including all 27 ESLint rules, TypeScript best practices, memory management, API usage (requestUrl vs fetch), UI/UX standards, and submission requirements. Use when working with Obsidian plugins, main.ts files,

Security

14111

reviewing-code

by CaptainCrouton89

Systematically evaluate code changes for security, correctness, performance, and spec alignment. Use when reviewing PRs, assessing code quality, or verifying implementation against requirements.

Security

1493

manim

by davila7

Comprehensive guide for Manim Community - Python framework for creating mathematical animations and educational videos with programmatic control

Security

1588

ui-audit

by openclaw

AI skill for automated UI audits. Evaluate interfaces against proven UX principles for visual hierarchy, accessibility, cognitive load, navigation, and more. Based on Making UX Decisions by Tommy Geoco.

Security

1223

typescript-review

by metabase

Review TypeScript and JavaScript code changes for compliance with Metabase coding standards, style violations, and code quality issues. Use when reviewing pull requests or diffs containing TypeScript/JavaScript code.

Security

17133