--- license: cc-by-4.0 --- LLaVa 1.5 eğitim çerçevesi ve Trendyol Mistral v1.0 Chat modeli kullanılarak eğitilmiş bir büyük görüntü dil modelidir. VQA, image captioning, visual grounding ve visual reasoning görevleri için eğitilmiştir. **Kurulum:** ``` git clone https://github.com/SkunkworksAI/BakLLaVA.git cd BakLLaVA conda create -n llava python=3.10 -y conda activate llava pip install --upgrade pip # enable PEP 660 support pip install -e . pip install numpy==1.26.4 pip install transformers==4.34.1 conda install chardet ``` **Kullanım:** ``` python -m llava.serve.cli \ --model-path 99eren99/Turkish-LLaVa1.5-Mistral \ --image-file "resim için relative path veya url" \ --conv-mode llava_llama_2 ``` **Prompt Şablonları** Lütfen bu bölge için kısa bir açıklama yapınız: [x1, y1, x2, y2].
-Lütfen bu bölge için kısa bir açıklama yapınız: [0. 62, 0. 65, 0. 66, 0. 8].
-BBox koordinatları 0-1 aralığında x1,y1,x2,y2 koordinatlarını temsil ediyor. Resmin sol üst köşesi (0,0).
Lütfen bu cümlenin tanımladığı bölgenin sınırlayıcı kutu koordinatını sağlayın: {cümle}.
-Lütfen bu cümlenin tanımladığı bölgenin sınırlayıcı kutu koordinatını sağlayın: plajda duran kişi. Verilen resmin öğeleri hakkında ayrıntılı bilgi verebilir misiniz? Verilen görsel için tek cümlelik bir başlık girin. Resmin görsel içeriğini çok ayrıntılı olarak açıklayın. {soru}?\nA. {seçenek}\nB. {seçenek}\nC. {seçenek}\nD. {seçenek}\nVerilen seçeneklerden doğru olanıyla cevap verin.
-Lambanın üzerinde ne tür bir abajur var?\nA. temiz cam\nB. saçak\nC. kumaş\nD. tiffany tarzı\nVerilen seçeneklerden doğru olanıyla cevap verin.