mms-tts-guj-train / run_vits_inference.py
Cossale's picture
Create run_vits_inference.py
16894bd verified
from transformers import pipeline
import scipy
model_id = "tmp/vits_finetuned_guj"
synthesiser = pipeline("text-to-speech", model_id, device=0) # remove device=0 if you want to use cpu
texts = [
"કોલકાતા રેપ-હત્યાની ઘટનાના વિરોધ વચ્ચે અમદાવાદમાં ડોક્ટર પર હુમલો:LG હોસ્પિટલમાં દર્દીના પરિવારજને ડોક્ટરનું ગળું દબાવ્યું, કહ્યું- તું મને ઓળખતો નથી, હું તને જોઈ લઈશ",
"કેદીઓને રાખડી બાંધતાં બહેનો ધ્રુસકે ધ્રુસકે રડી પડી:વડોદરા સેન્ટ્રલ જેલમાં બહેને કહ્યું-ભાઈને જેલમાં જોઈ ખૂબ દુઃખ થાય છે, અગ્નિકાંડના આરોપી સાગઠિયાએ મોં છુપાવ્યું",
"ડ્રેગનની દાદાગીરી નહીં ચાલે, ફિલિપાઈન્સે ચીનના જહાજને ટક્કર મારતા સુપરપાવર દેશો એલર્ટ"
]
for i, text in enumerate(texts):
speech = synthesiser(text)
scipy.io.wavfile.write(f"finetuned_output_{i}.wav", rate=speech["sampling_rate"], data=speech["audio"][0])