nllb-ensi-v1

Running

zaanind commited on Jul 23

Commit

0e54b5e

•

1 Parent(s): db1cb23

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,23 +1,19 @@
 import gradio
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
-import ctranslate2
 model_name = "zaanind/nllb-ensi-v1-tuning-subs"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = ctranslate2.Translator(model_name)
-#model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
 tokenizer.src_lang = "eng_Latn"
 def translate(text):
-    source = tokenizer.convert_ids_to_tokens(tokenizer.encode(text))
-    target_prefix = ["sin_Sinh"]
-    results = translator.translate_batch([source], target_prefix=[target_prefix])
-    target = results[0].hypotheses[0][1:]
-    translation = tokenizer.decode(tokenizer.convert_tokens_to_ids(target))
     return translation

 import gradio
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 model_name = "zaanind/nllb-ensi-v1-tuning-subs"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
 tokenizer.src_lang = "eng_Latn"
 def translate(text):
+    inputs = tokenizer(text=text, return_tensors="pt")
+    translated_tokens = model.generate(
+        **inputs, forced_bos_token_id=tokenizer.lang_code_to_id["sin_Sinh"]
+    )
+    translation = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
     return translation