deepgram-core-workflow-b
Implement real-time streaming transcription with Deepgram.\nUse when building live transcription, voice interfaces,\nor real-time audio processing applications.\nTrigger with phrases like \
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Implement real-time streaming transcription with Deepgram.\nUse when building live transcription, voice interfaces,\nor real-time audio processing applications.\nTrigger with phrases like \
How to use
Zainstaluj pakiet SDK Deepgram: npm install @deepgram/sdk. Upewnij się, że masz ustawioną zmienną środowiskową DEEPGRAM_API_KEY z Twoim kluczem API.
Jeśli chcesz przechwytywać audio z mikrofonu, zainstaluj narzędzie Sox: apt install sox (Linux) lub brew install sox (macOS).
Zaimportuj createClient i LiveTranscriptionEvents z @deepgram/sdk, a następnie utwórz połączenie WebSocket za pomocą deepgram.listen.live() z parametrami: model 'nova-3', language 'en', smart_format: true, interim_results: true (wyświetla wyniki w trakcie mówienia), utterance_end_ms: 1000 (próg ciszy), encoding: 'linear16', sample_rate: 16000, channels: 1.
Nasłuchuj zdarzeń połączenia: Open (połączenie nawiązane), Close (zamknięte), Transcript (wyniki transkrypcji), UtteranceEnd (koniec wypowiedzi), Error (błędy). Obsługuj wyniki pośrednie i ostateczne osobno.
Podłącz źródło audio: mikrofon przez Sox (rec), strumień pliku lub WebSocket z przeglądarki. Skill automatycznie zarządza ponownym połączeniem w przypadku przerwania.
Dla klientów przeglądarki zbuduj endpoint SSE, który przekazuje zdarzenia transkrypcji do frontendu w czasie rzeczywistym.