add-voice-transcription
Add voice message transcription to NanoClaw using OpenAI's Whisper API. Automatically transcribes WhatsApp voice notes so the agent can read and respond to them.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Add voice message transcription to NanoClaw using OpenAI's Whisper API. Automatically transcribes WhatsApp voice notes so the agent can read and respond to them.
How to use
Sprawdź, czy plik
src/transcription.tsjuż istnieje w projekcie. Jeśli tak, przejdź do kroku 5. Jeśli nie, kontynuuj instalację.Upewnij się, że masz klucz API OpenAI dla usługi Whisper. Jeśli go nie masz, przejdź na https://platform.openai.com/api-keys i utwórz nowy klucz. Przechowaj go bezpiecznie — będzie potrzebny w dalszych krokach.
Dodaj zdalne repozytorium WhatsApp do projektu, jeśli jeszcze go nie masz:
git remote add whatsapp https://github.com/qwibitai/nanoclaw-whatsapp.git. Następnie pobierz gałąź z umiejętnością transkrypcji:git fetch whatsapp skill/voice-transcriptioni scal ją:git merge whatsapp/skill/voice-transcription. Jeśli pojawią się konflikty w plikupackage-lock.json, zaakceptuj wersję ze scalenia:git checkout --theirs package-lock.json && git add package-lock.json && git merge --continue.Zainstaluj zależności i zbuduj projekt:
npm install --legacy-peer-depsoraznpm run build. Uruchom testy, aby upewnić się, że wszystko działa:npx vitest.Dodaj swój klucz API OpenAI do pliku
.env:OPENAI_API_KEY=twoj_klucz_tutaj. Od tego momentu wiadomości głosowe przesyłane przez WhatsApp będą automatycznie transkrybowane i dostarczone agentowi jako tekst.