Spaces:

alfonsovelp
/

mistral-lynk

Runtime error

alfonsovelp commited on Apr 22

Commit

4208f3e

•

1 Parent(s): ba5b63f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,18 +1,22 @@
 import gradio as gr
-from transformers import AutoModelForCausalLM, AutoTokenizer
 from huggingface_hub import InferenceClient
 import os
 # Environment variable for HF token
 hf_token = os.environ.get("HF_TOKEN")
 # Your model ID
-model_id = "mistralai/Mistral-7B-Instruct-v0.1"
-tokenizer = AutoTokenizer.from_pretrained(model_id, token=hf_token)
-# Load the model
-model = AutoModelForCausalLM.from_pretrained(model_id, token=hf_token, device_map="auto")
 def format_prompt(message, history):
   prompt = "<s>"

 import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 from huggingface_hub import InferenceClient
 import os
 # Environment variable for HF token
 hf_token = os.environ.get("HF_TOKEN")
 # Your model ID
+model_id = "mistralai/Mistral-7B-Instruct-v0.2"
+quantization_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_quant_type="nf4",
+    bnb_4bit_compute_dtype="torch.float16",
+)
+model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=True, device_map="auto", token=hf_token)
+tokenizer = AutoTokenizer.from_pretrained(model_id, token=hf_token)
 def format_prompt(message, history):
   prompt = "<s>"