Mistral-lab

Running on Zero

vilarin commited on Jul 3

Commit

ae90620

•

1 Parent(s): 6bc1674

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import os
-import threading
 import time
-import subprocess
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import gradio as gr
@@ -43,8 +43,8 @@ tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, trust_remote_code=True)
 model = model.eval()
-def stream_chat(message: str, history: list, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):
     conversation = []
     for prompt, answer in history:
         conversation.extend([

 import os
+import threading as Thread
 import time
+import spaces
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import gradio as gr
 model = model.eval()
+@spaces.GPU()
+def stream_chat(message: str, history: list, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):
     conversation = []
     for prompt, answer in history:
         conversation.extend([