Spaces:

vaugheu
/

vau_lama

Sleeping

App Files Files Community

vaugheu commited on Jun 24

Commit

57a93d6

•

1 Parent(s): 5fcb534

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -27

app.py CHANGED Viewed

@@ -1,29 +1,27 @@
 from huggingface_hub import InferenceClient
 import gradio as gr
-# Define the initial model
-initial_model_name = "mistralai/Mixtral-8x7B-Instruct-v0.1"
 def format_prompt(message, history):
-    prompt = "<s>"
-    for user_prompt, bot_response in history:
-        prompt += f"[INST] {user_prompt} [/INST]"
-        prompt += f" {bot_response}</s> "
-    prompt += f"[INST] {message} [/INST]"
-    return prompt
 def generate(
     prompt, history, temperature=0.9, max_new_tokens=1024, top_p=0.95, repetition_penalty=1.0,
-    model_name=None
 ):
     temperature = float(temperature)
     if temperature < 1e-2:
         temperature = 1e-2
     top_p = float(top_p)
-    # Initialize the InferenceClient with the selected model
-    client = InferenceClient(model_name)
     generate_kwargs = dict(
         temperature=temperature,
         max_new_tokens=max_new_tokens,
@@ -43,8 +41,8 @@ def generate(
         yield output
     return output
 additional_inputs=[
-    gr.Textbox(label="Model Name", value=initial_model_name, placeholder="Enter model name here"),
     gr.Slider(
         label="Temperature",
         value=0.9,
@@ -83,18 +81,9 @@ additional_inputs=[
     )
 ]
-gr.Interface(
     fn=generate,
-    inputs=dict(
-        Message=gr.components.Textbox(lines=1, placeholer='Your message'),
-        History=gr.components.State(value=[(current_context['assistant']['last'], current_context['human']['last'])]),
-        Temperature=additional_inputs[0],
-        MaxNewTokens=additional_inputs[1],
-        TopP=additional_inputs[2],
-        RepetitionPenalty=additional_inputs[3],
-        ModelName=additional_inputs[4],
-    ),
-    outputs="text",
-    title="Interactive Chat with AI Models",
-    description="Type a message and see the AI's response. Adjust parameters to change the behavior.",
-).launch()

 from huggingface_hub import InferenceClient
 import gradio as gr
+client = InferenceClient(
+    'pthornton614/CodeLama-7b-Instruct'
+)
 def format_prompt(message, history):
+  prompt = "<s>"
+  for user_prompt, bot_response in history:
+    prompt += f"[INST] {user_prompt} [/INST]"
+    prompt += f" {bot_response}</s> "
+  prompt += f"[INST] {message} [/INST]"
+  return prompt
 def generate(
     prompt, history, temperature=0.9, max_new_tokens=1024, top_p=0.95, repetition_penalty=1.0,
 ):
     temperature = float(temperature)
     if temperature < 1e-2:
         temperature = 1e-2
     top_p = float(top_p)
     generate_kwargs = dict(
         temperature=temperature,
         max_new_tokens=max_new_tokens,
         yield output
     return output
 additional_inputs=[
     gr.Slider(
         label="Temperature",
         value=0.9,
     )
 ]
+gr.ChatInterface(
     fn=generate,
+    chatbot=gr.Chatbot(show_label=False, show_share_button=False, show_copy_button=True, layout="panel"),
+    additional_inputs=additional_inputs,
+    title="""Mixtral-8x7B"""
+).queue().launch(show_api=True)