Spaces:

omkar334
/

agentic_rag

Runtime error

App Files Files Community

agentic_rag / sarvam.py

omkar334

audio history

c525e42 about 1 month ago

raw

history blame

2.26 kB

	import os

	import aiohttp
	from dotenv import load_dotenv

	load_dotenv()

	code_map = {
	"hindi": "hi-IN",
	"bengali": "bn-IN",
	"kannada": "kn-IN",
	"malayalam": "ml-IN",
	"marathi": "mr-IN",
	"odia": "od-IN",
	"punjabi": "pa-IN",
	"tamil": "ta-IN",
	"telugu": "te-IN",
	"english": "en-IN",
	"gujarati": "gu-IN",
	}


	async def translator(text, src, dest):
	async with aiohttp.ClientSession() as session:
	url = "https://api.sarvam.ai/translate"

	payload = {
	"input": text,
	"source_language_code": code_map[src],
	"target_language_code": code_map[dest],
	"speaker_gender": "Male",
	"mode": "formal",
	"model": "mayura:v1",
	"enable_preprocessing": True,
	}
	headers = {"Content-Type": "application/json", "api-subscription-key": os.getenv("SARVAM_API_KEY")}
	async with session.post(url, headers=headers, json=payload) as response:
	if response.status == 200:
	output = await response.json()
	return {"text": output["translated_text"]}


	async def speaker(text, src="hindi"):
	async with aiohttp.ClientSession() as session:
	url = "https://api.sarvam.ai/text-to-speech"

	payload = {
	"inputs": [text],
	"target_language_code": code_map[src],
	"speaker": "meera",
	"pitch": 0,
	"pace": 1.25,
	"loudness": 1.5,
	"speech_sample_rate": 8000,
	"enable_preprocessing": True,
	"model": "bulbul:v1",
	}
	headers = {"Content-Type": "application/json", "api-subscription-key": os.getenv("SARVAM_API_KEY")}
	async with session.post(url, headers=headers, json=payload) as response:
	if response.status == 200:
	output = await response.json()
	return output
	else:
	print(response.status)


	def save_audio(audio_data):
	os.makedirs("audio_files", exist_ok=True)
	file_count = len(os.listdir("audio_files"))
	file_path = f"audio_files/audio_{file_count + 1}.wav"
	with open(file_path, "wb") as audiofile:
	audiofile.write(audio_data)
	return file_path