Spaces:

kimmeoungjun
/

test-nlp-study

Runtime error

App Files Files Community

kimmeoungjun commited on Nov 11, 2023

Commit

277c222

•

1 Parent(s): abd383d

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -38

app.py CHANGED Viewed

@@ -1,50 +1,27 @@
 import torch
 import gradio as gr
-from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 from peft import PeftModel, PeftConfig
 device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
 peft_model_id = "kimmeoungjun/qlora-koalpaca"
 config = PeftConfig.from_pretrained(peft_model_id)
-model = AutoModelForSeq2SeqLM.from_pretrained(config.base_model_name_or_path)
 model = PeftModel.from_pretrained(model, peft_model_id).to(device)
 tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
-def my_split(s, seps):
-    res = [s]
-    for sep in seps:
-        s, res = res, []
-        for seq in s:
-            res += seq.split(sep)
-    return res
-def chat_base(input):
-  p = input
-  input_ids = tokenizer(p, return_tensors="pt").input_ids.to(device)
-  gen_tokens = model.generate(input_ids, do_sample=True, early_stopping=True, eos_token_id=2,)
-  gen_text = tokenizer.batch_decode(gen_tokens)[0]
-  # print(gen_text)
-  result = gen_text[len(p):]
-  # print(">", result)
-  result = my_split(result, [']', '\n'])[1]
-  # print(">>", result)
-  # print(">>>", result)
-  return result
-def chat(message):
-    history = gr.get_state() or []
-    print(history)
-    response = chat_base(message)
-    history.append((message, response))
-    gr.set_state(history)
-    html = "<div class='chatbot'>"
-    for user_msg, resp_msg in history:
-        html += f"<div class='user_msg'>{user_msg}</div>"
-        html += f"<div class='resp_msg'>{resp_msg}</div>"
-    html += "</div>"
-    return response
-iface = gr.Interface(chat_base, gr.inputs.Textbox(label="물어보세요"), "text", allow_screenshot=False, allow_flagging=False)
-iface.launch()

 import torch
 import gradio as gr
 from peft import PeftModel, PeftConfig
+from transformers import AutoModelForCausalLM, AutoTokenizer
 device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
 peft_model_id = "kimmeoungjun/qlora-koalpaca"
 config = PeftConfig.from_pretrained(peft_model_id)
+model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path)
 model = PeftModel.from_pretrained(model, peft_model_id).to(device)
 tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
+def generate(q):
+    inputs = tokenizer(f"### 질문: {q}\n\n### 답변:", return_tensors='pt', return_token_type_ids=False)
+    outputs = model.generate(
+        **{k: v.to(device) for k, v in inputs.items()},
+        max_new_tokens=256,
+        do_sample=True,
+        eos_token_id=2,
+    )
+    result = tokenizer.decode(outputs[0])
+    answer_idx = result.find("### 답변:")
+    answer = result[answer_idx + 7:].strip()
+    return answer
+gr.Interface(generate, "text", "text").launch(share=True)