Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Extract text from images using Tesseract OCR
How to use
Zainstaluj wymagane zależności: Python 3.8 lub nowszy, bibliotekę pytesseract, Pillow (PIL) oraz tesseract-ocr dla systemu operacyjnego. Na większości systemów Linux wystarczy zainstalować pakiet tesseract-ocr przez menedżer pakietów, na macOS użyj Homebrew, a na Windows pobierz instalator z oficjalnej strony projektu Tesseract.
Przygotuj obraz do przetworzenia. Umiejętność obsługuje formaty PNG, JPG, JPEG, GIF, BMP, TIFF i WEBP. Możesz pracować z plikami lokalnymi lub podać URL do obrazu w internecie.
Uruchom skrypt OCR z podstawowymi parametrami: python3 scripts/ocr.py ścieżka_do_obrazu.png plik_wyjściowy.txt. Domyślnie rozpoznawanie odbywa się w języku angielskim, a wynik zapisywany jest jako zwykły tekst.
Jeśli obraz zawiera tekst w innym języku, dodaj parametr --lang z kodem języka, na przykład --lang chi_sim dla chińskiego uproszczonego lub --lang jpn dla japońskiego. Możesz również połączyć wiele kodów języków znakiem plus: --lang eng+chi_sim.
Aby poprawić dokładność rozpoznawania słabej jakości obrazów, dodaj flagę --preprocess, która automatycznie zastosuje przetwarzanie wstępne takie jak konwersja do skali szarości i progowanie.
Jeśli potrzebujesz wyniku w formacie JSON z wynikami pewności dla każdego słowa, dodaj parametr --format json. Dla obrazów z URL-i użyj skryptu ocr_url.py zamiast ocr.py i podaj pełny adres URL jako pierwszy parametr.