Spaces:

cantuncok
/

meta-Llama-3.2-11B-Vision-Instruct

Running

cantuncok commited on Sep 26

Commit

f660379

•

1 Parent(s): b1fd6cc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,3 +1,28 @@
 import gradio as gr
-gr.load("models/meta-llama/Llama-3.2-90B-Vision-Instruct").launch()

 import gradio as gr
+from transformers import AutoProcessor, AutoModelForCausalLM
+import torch
+# Model ve işlemciyi yükleyin
+model_name = "meta-llama/Llama-3.2-90B-Vision-Instruct"
+processor = AutoProcessor.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name)
+def predict(image, text):
+    # Girdileri işleyin
+    inputs = processor(images=image, text=text, return_tensors="pt")
+    # Modelden yanıt alın
+    outputs = model.generate(**inputs)
+    # Çıktıyı çözümleyin
+    response = processor.decode(outputs[0], skip_special_tokens=True)
+    return response
+# Gradio arayüzünü tanımlayın
+interface = gr.Interface(
+    fn=predict,
+    inputs=["image", "text"],
+    outputs="text",
+    title="Llama 3.2 90B Vision Instruct Demo",
+    description="Bir görüntü ve metin girdisi alarak yanıt üreten model."
+)
+interface.launch()