Spaces:

0x7o
/

Aeonium-Chat-Demo-4B

Runtime error

App Files Files Community

0x7o commited on Jul 5

Commit

933ec2b

•

1 Parent(s): d57f720

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -42

app.py CHANGED Viewed

@@ -1,58 +1,60 @@
 import gradio as gr
-from huggingface_hub import InferenceClient
-# Инициализация клиента для модели Aeonium
-client = InferenceClient("aeonium/Aeonium-v1.1-Chat-4B")
-def respond(
-    message,
-    history: list[tuple[str, str]],
-    system_message,
-    max_tokens,
-    temperature,
-    top_p,
-):
-    # Формирование сообщений для чата
-    messages = [{"role": "system", "content": system_message}]
-    for user_msg, assistant_msg in history:
-        if user_msg:
-            messages.append({"role": "user", "content": user_msg})
-        if assistant_msg:
-            messages.append({"role": "assistant", "content": assistant_msg})
-    messages.append({"role": "user", "content": message})
-    response = ""
-    # Генерация ответа с использованием Inference API
-    for chunk in client.text_generation(
-        prompt=client.tokenizer.apply_chat_template(messages, tokenize=False),
-        max_new_tokens=max_tokens,
-        stream=True,
-        temperature=temperature,
-        top_p=top_p,
-    ):
-        response += chunk.token.text
-        yield response
 # Настройка интерфейса Gradio
-demo = gr.ChatInterface(
-    respond,
-    additional_inputs=[
-        gr.Textbox(value="Ты дружелюбный ассистент, созданный компанией Aeonium.", label="Системное сообщение"),
-        gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Максимальное количество новых токенов"),
-        gr.Slider(minimum=0.1, maximum=2.0, value=0.7, step=0.1, label="Температура"),
-        gr.Slider(minimum=0.1, maximum=1.0, value=0.95, step=0.05, label="Top-p (nucleus sampling)"),
-    ],
     title="Чат с Aeonium v1.1",
     description="Это чат-интерфейс для модели Aeonium v1.1 Chat 4B. Задавайте вопросы и получайте ответы!",
     examples=[
         "Привет! Как дела?",
         "Расскажи мне о квантовой физике",
         "Какие интересные книги ты можешь порекомендовать?",
     ],
 )
-if __name__ == "__main__":
-    demo.launch()

 import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
+model_id = "aeonium/Aeonium-v1.1-Chat-4B"
+# Загрузка токенизатора и модели
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForCausalLM.from_pretrained(
+    model_id,
+    device_map="auto",
+    torch_dtype=torch.bfloat16,
+)
+def predict(message, history):
+    # Формирование чата из истории и нового сообщения
+    chat = [{"role": "user" if i % 2 == 0 else "assistant", "content": m}
+            for i, (m, _) in enumerate(history)] + [{"role": "user", "content": message}]
+    # Применение шаблона чата
+    prompt = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)
+    # Кодирование входных данных
+    inputs = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt").to(model.device)
+    # Генерация ответа
+    outputs = model.generate(
+        input_ids=inputs,
+        max_new_tokens=256,  # Увеличено для более длинных ответов
+        do_sample=True,
+        temperature=0.7,
+        top_p=0.95,
+    )
+    # Декодирование результата
+    response = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
+    return response.strip()
 # Настройка интерфейса Gradio
+iface = gr.ChatInterface(
+    predict,
+    chatbot=gr.Chatbot(height=600),
+    textbox=gr.Textbox(placeholder="Введите ваше сообщение здесь...", container=False, scale=7),
     title="Чат с Aeonium v1.1",
     description="Это чат-интерфейс для модели Aeonium v1.1 Chat 4B. Задавайте вопросы и получайте ответы!",
+    theme="soft",
     examples=[
         "Привет! Как дела?",
         "Расскажи мне о квантовой физике",
         "Какие интересные книги ты можешь порекомендовать?",
     ],
+    cache_examples=True,
+    retry_btn="Повторить",
+    undo_btn="Отменить последнее",
+    clear_btn="Очистить",
 )
+# Запуск интерфейса
+iface.launch()