whatsapp-voice-talk
Real-time WhatsApp voice message processing. Transcribe voice notes to text via Whisper, detect intent, execute handlers, and send responses. Use when building conversational voice interfaces for WhatsApp. Supports English and Hindi, customizable intents (weather, status,
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Real-time WhatsApp voice message processing. Transcribe voice notes to text via Whisper, detect intent, execute handlers, and send responses. Use when building conversational voice interfaces for WhatsApp. Supports English and Hindi, customizable intents (weather, status, commands), automatic language detection, and streaming responses via TTS.
How to use
Zainstaluj wymagane zależności: pip install openai-whisper soundfile numpy — to przygotuje środowisko do transkrypcji i przetwarzania plików audio.
Przygotuj plik wiadomości głosowej w formacie OGG, WAV lub MP3 i zapisz go w projekcie.
Załaduj moduł processVoiceNote z pliku scripts/voice-processor.js i wczytaj plik audio jako bufor danych.
Uruchom funkcję processVoiceNote(buffer) — zwróci ona wynik zawierający transkrypcję, rozpoznaną intencję (np. weather, status, commands), wykryty język i wygenerowaną odpowiedź.
Aby automatycznie przetwarzać przychodzące wiadomości WhatsApp, uruchom demon nasłuchujący: node scripts/voice-listener-daemon.js — będzie on monitorować folder ~/.clawdbot/media/inbound/ co 5 sekund i automatycznie przetwarzać nowe pliki głosowe.
Skill automatycznie transkrybuje głos, rozpozna intencję, wykonuje odpowiedni handler i wysyła odpowiedź z powrotem na WhatsApp.