Create run_vits_inference.py
Browse files- run_vits_inference.py +15 -0
run_vits_inference.py
ADDED
@@ -0,0 +1,15 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
from transformers import pipeline
|
2 |
+
import scipy
|
3 |
+
|
4 |
+
model_id = "tmp/vits_finetuned_guj"
|
5 |
+
synthesiser = pipeline("text-to-speech", model_id, device=0) # remove device=0 if you want to use cpu
|
6 |
+
|
7 |
+
texts = [
|
8 |
+
"કોલકાતા રેપ-હત્યાની ઘટનાના વિરોધ વચ્ચે અમદાવાદમાં ડોક્ટર પર હુમલો:LG હોસ્પિટલમાં દર્દીના પરિવારજને ડોક્ટરનું ગળું દબાવ્યું, કહ્યું- તું મને ઓળખતો નથી, હું તને જોઈ લઈશ",
|
9 |
+
"કેદીઓને રાખડી બાંધતાં બહેનો ધ્રુસકે ધ્રુસકે રડી પડી:વડોદરા સેન્ટ્રલ જેલમાં બહેને કહ્યું-ભાઈને જેલમાં જોઈ ખૂબ દુઃખ થાય છે, અગ્નિકાંડના આરોપી સાગઠિયાએ મોં છુપાવ્યું",
|
10 |
+
"ડ્રેગનની દાદાગીરી નહીં ચાલે, ફિલિપાઈન્સે ચીનના જહાજને ટક્કર મારતા સુપરપાવર દેશો એલર્ટ"
|
11 |
+
]
|
12 |
+
|
13 |
+
for i, text in enumerate(texts):
|
14 |
+
speech = synthesiser(text)
|
15 |
+
scipy.io.wavfile.write(f"finetuned_output_{i}.wav", rate=speech["sampling_rate"], data=speech["audio"][0])
|