telegram-voice-to-voice-macos
Telegram voice-to-voice workflow (macOS Apple Silicon only): handle incoming Telegram voice notes (.ogg), transcribe locally with yap (Speech.framework), generate a reply, and send back a Telegram voice note using local TTS (macOS say + ffmpeg). Also support /audio on and /audio
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Telegram voice-to-voice workflow (macOS Apple Silicon only): handle incoming Telegram voice notes (.ogg), transcribe locally with yap (Speech.framework), generate a reply, and send back a Telegram voice note using local TTS (macOS say + ffmpeg). Also support /audio on and /audio off toggles with persistent per-user state. Use when you want voice-to-voice chat on Telegram without cloud transcription/TTS.
How to use
- Upewnij się, że używasz macOS na Apple Silicon — skill nie będzie działać na Linuksie ani Windows. 2. Zainstaluj wymagane narzędzia: yap (https://github.com/finnvoor/yap) do transkrypcji, ffmpeg do konwersji audio oraz say (wbudowany w macOS). Wszystkie muszą być dostępne w PATH. 3. Dodaj skill do swojego agenta OpenClaw — system automatycznie będzie przechwytywać przychodzące wiadomości głosowe z Telegrama. 4. Kiedy otrzymasz notatkę głosową, skill transkrybuje ją lokalnie, generuje odpowiedź i wysyła ją z powrotem jako wiadomość głosową. Domyślnie odpowiada głosem. 5. Aby zmienić tryb na odpowiedzi tekstowe, wyślij wiadomość tekstową zawierającą dokładnie /audio off — skill potwierdzi zmianę. Aby wrócić do odpowiedzi głosowych, wyślij /audio on. Preferencje są przechowywane osobno dla każdego użytkownika. 6. Opcjonalnie ustaw zmienną środowiskową YAP_LOCALE (np. it-IT, en-US), aby zmienić język transkrypcji — domyślnie używany jest język systemowy macOS.