Spaces:

davanstrien
/

ColPali-Query-Generator

Running on Zero

davanstrien HF staff commited on 5 days ago

Commit

38576ff

•

1 Parent(s): 9e7d682

return text

Files changed (1) hide show

app.py CHANGED Viewed

@@ -87,7 +87,7 @@ def _prep_data_for_input(image):
         text=prompt
     )
-@spaces.GPU
 def generate_response(image):
     inputs = _prep_data_for_input(image)
     inputs = {k: v.to(model.device).unsqueeze(0) for k, v in inputs.items()}
@@ -100,10 +100,10 @@ def generate_response(image):
     output_text = processor.tokenizer.decode(generated_tokens, skip_special_tokens=True)
     try:
-        return json.loads(output_text)
     except Exception:
         gr.Warning("Failed to parse JSON from output")
-        return {}
 title = "ColPali fine-tuning Query Generator"
 description = """[ColPali](https://huggingface.co/papers/2407.01449) is a very exciting new approach to multimodal document retrieval which aims to replace existing document retrievers which often rely on an OCR step with an end-to-end multimodal approach.
@@ -129,7 +129,7 @@ examples = [
 demo = gr.Interface(
     fn=generate_response,
     inputs=gr.Image(type="pil"),
-    outputs=gr.Json(),
     title=title,
     description=description,
     examples=examples,

         text=prompt
     )
+@spaces.GPU(duration=120)
 def generate_response(image):
     inputs = _prep_data_for_input(image)
     inputs = {k: v.to(model.device).unsqueeze(0) for k, v in inputs.items()}
     output_text = processor.tokenizer.decode(generated_tokens, skip_special_tokens=True)
     try:
+        return str(json.loads(output_text))
     except Exception:
         gr.Warning("Failed to parse JSON from output")
+        return output_text
 title = "ColPali fine-tuning Query Generator"
 description = """[ColPali](https://huggingface.co/papers/2407.01449) is a very exciting new approach to multimodal document retrieval which aims to replace existing document retrievers which often rely on an OCR step with an end-to-end multimodal approach.
 demo = gr.Interface(
     fn=generate_response,
     inputs=gr.Image(type="pil"),
+    outputs=gr.Text(),
     title=title,
     description=description,
     examples=examples,