Spaces:

elevenlabs
/

tts

Running

flavioschneider commited on May 15, 2023

Commit

5bd7020

•

1 Parent(s): 7779a3f

fix: buffer padding, default text

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,6 +3,14 @@ import gradio as gr
 import numpy as np
 from elevenlabs import voices, generate, set_api_key, UnauthenticatedRateLimitError
 def generate_voice(text, voice_name, model_name, api_key):
     try:
         audio = generate(text, voice=voice_name, model=model_name, api_key=api_key)
@@ -10,7 +18,7 @@ def generate_voice(text, voice_name, model_name, api_key):
         raise gr.Error("Thanks for trying out ElevenLabs TTS! You've reached the free tier limit. Please provide an API key to continue.")
     except Exception as e:
         raise gr.Error(e)
-    return (44100, np.frombuffer(audio, dtype=np.int16))
 badges = """
 <div style="display: flex">
@@ -44,14 +52,14 @@ with gr.Blocks() as block:
     input_text = gr.Textbox(
         label="Input Text",
         lines=2,
-        value="Hi! I'm Eleven, the worlds most advanced TTS system.",
         elem_id="input_text"
     )
     all_voices = voices()
     input_voice = gr.Dropdown(
         [ voice.name for voice in all_voices ],
-        value=random.choice(all_voices).name,
         label="Voice",
         elem_id="input_voice"
     )
@@ -59,7 +67,7 @@ with gr.Blocks() as block:
     input_model = gr.Radio(
         ["eleven_monolingual_v1", "eleven_multilingual_v1"],
         label="Model",
-        value="eleven_multilingual_v1",
         elem_id="input_model",
     )

 import numpy as np
 from elevenlabs import voices, generate, set_api_key, UnauthenticatedRateLimitError
+def pad_buffer(audio):
+    # Pad buffer to multiple of 2 bytes
+    buffer_size = len(audio)
+    element_size = np.dtype(np.int16).itemsize
+    if buffer_size % element_size != 0:
+        audio = audio + b'\0' * (element_size - (buffer_size % element_size))
+    return audio
 def generate_voice(text, voice_name, model_name, api_key):
     try:
         audio = generate(text, voice=voice_name, model=model_name, api_key=api_key)
         raise gr.Error("Thanks for trying out ElevenLabs TTS! You've reached the free tier limit. Please provide an API key to continue.")
     except Exception as e:
         raise gr.Error(e)
+    return (44100, np.frombuffer(pad_buffer(audio), dtype=np.int16))
 badges = """
 <div style="display: flex">
     input_text = gr.Textbox(
         label="Input Text",
         lines=2,
+        value="Hahaha OHH MY GOD! This is SOOO funny, I-I am Eleven and-and I am a text to speech system!!",
         elem_id="input_text"
     )
     all_voices = voices()
     input_voice = gr.Dropdown(
         [ voice.name for voice in all_voices ],
+        value="Arnold",
         label="Voice",
         elem_id="input_voice"
     )
     input_model = gr.Radio(
         ["eleven_monolingual_v1", "eleven_multilingual_v1"],
         label="Model",
+        value="eleven_monolingual_v1",
         elem_id="input_model",
     )