inworld-tts
Text-to-speech via Inworld.ai API. Use when generating voice audio from text, creating spoken responses, or converting text to MP3/audio files. Supports multiple voices, speaking rates, and streaming for long text.
Installation
Pick a client and clone the repository into its skills directory.
Installation
About this skill
Text-to-speech via Inworld.ai API. Use when generating voice audio from text, creating spoken responses, or converting text to MP3/audio files. Supports multiple voices, speaking rates, and streaming for long text.
How to use
Przejdź na https://platform.inworld.ai i utwórz nowy klucz API z uprawnieniami "Voices: Read". Skopiuj wygenerowany klucz w formacie Base64.
Ustaw zmienną środowiskową INWORLD_API_KEY, dodając do pliku ~/.bashrc lub ~/.clawdbot/.env linię: export INWORLD_API_KEY="twój-klucz-base64". Załaduj zmienne poleceniem source ~/.bashrc.
Skopiuj folder inworld-tts do katalogu ze swoimi skillami, a następnie nadaj uprawnienia wykonywania skryptowi: chmod +x /ścieżka/do/inworld-tts/scripts/tts.sh. Opcjonalnie utwórz dowiązanie symboliczne w /usr/local/bin dla globalnego dostępu.
Uruchom skill z tekstem i nazwą pliku wyjściowego: ./scripts/tts.sh "Twój tekst" output.mp3. Domyślnie używany jest głos Dennis z normalnym tempem (1.0).
Aby dostosować głos lub tempo, dodaj flagi: ./scripts/tts.sh "Tekst" output.mp3 --voice Dennis --rate 1.2. Tempo można ustawiać od 0.5 do 2.0, a temperaturę od 0.1 do 2.0.
Dla tekstów dłuższych niż 4000 znaków użyj flagi --stream: ./scripts/tts.sh "Bardzo długi tekst..." output.mp3 --stream. Wygenerowany plik audio odtwórz dowolnym odtwarzaczem, np. mpv output.mp3.