transcribee
Transcribe YouTube videos and local audio/video files with speaker diarization. Use when user asks to transcribe a YouTube URL, podcast, video, or audio file. Outputs clean speaker-labeled transcripts ready for LLM analysis.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Transcribe YouTube videos and local audio/video files with speaker diarization. Use when user asks to transcribe a YouTube URL, podcast, video, or audio file. Outputs clean speaker-labeled transcripts ready for LLM analysis.
How to use
Zainstaluj wymagane zależności: yt-dlp i ffmpeg. Na macOS uruchom w terminalu: brew install yt-dlp ffmpeg. Te narzędzia umożliwiają pobieranie filmów z YouTube i konwersję formatów mediów.
Przygotuj źródło do transkrypcji. Możesz użyć linku do filmu YouTube (np. https://www.youtube.com/watch?v=...), ścieżki do lokalnego pliku wideo (mp4, mkv, webm, mov, avi) lub pliku audio (mp3, m4a, wav, ogg, flac).
Uruchom transkrypcję poleceniem transcribee. Dla linku YouTube: transcribee "https://www.youtube.com/watch?v=...". Dla pliku lokalnego: transcribee ~/ścieżka/do/pliku.mp4 lub transcribee ~/ścieżka/do/pliku.mp3. Pamiętaj, aby ująć adresy URL w cudzysłów, jeśli zawierają znaki specjalne.
Czekaj na zakończenie przetwarzania. Narzędzie pobierze plik (jeśli to YouTube), przekonwertuje go w razie potrzeby i przepuści przez system transkrypcji z identyfikacją mówców.
Znajdź wyniki w folderze ~/Documents/transcripts/. Transkrypty zapisywane są w strukturze {kategoria}/{tytuł}-{data}/. Otrzymasz cztery pliki: transcription.txt (transkrypt z etykietami mówców), transcription-raw.txt (czysty tekst bez mówców), transcription-raw.json (wyrazy z czasowaniem) i metadata.json (informacje o wideo, języku i kategorii).
Jeśli napotkasz błędy, sprawdź czy yt-dlp i ffmpeg są zainstalowane (polecenia: which yt-dlp, which ffmpeg). Jeśli pojawią się błędy API, zweryfikuj plik .env w katalogu transcribee.