Spaces:

mikeee
/

multilingual-dokugpt

Runtime error

App Files Files Community

ffreemt commited on Jun 18, 2023

Commit

3e124e7

•

1 Parent(s): 58d404e

Update embed_files

Browse files

Files changed (4) hide show

app.py +75 -78
main.py +43 -8
requirements-dev.txt +5 -1
run-main.sh +1 -0

app.py CHANGED Viewed

@@ -47,21 +47,24 @@ CPU times: user 1min 27s, sys: 8.09 s, total: 1min 35s
 Wall time: 1min 37s
 """
-# pylint: disable=broad-exception-caught, unused-import, invalid-name, line-too-long, too-many-return-statements, import-outside-toplevel, no-name-in-module, no-member, too-many-branches, unused-variable, too-many-arguments, global-statement
 import os
 import time
 from copy import deepcopy
 from math import ceil
 from pathlib import Path
-from tempfile import _TemporaryFileWrapper
 from textwrap import dedent
 from types import SimpleNamespace
 from typing import List
 import gradio as gr
 import more_itertools as mit
 import torch
-from about_time import about_time
 from charset_normalizer import detect
 from chromadb.config import Settings
@@ -77,9 +80,8 @@ from langchain.document_loaders import (
     TextLoader,
 )
 from langchain.embeddings import (
-    HuggingFaceInstructEmbeddings,
     SentenceTransformerEmbeddings,
-)
 from langchain.llms import HuggingFacePipeline, OpenAI
 from langchain.memory import ConversationBufferMemory
 from langchain.text_splitter import (
@@ -112,6 +114,14 @@ if api_key is not None:
         os.environ.setdefault("OPENAI_API_BASE", sk_base)
     elif api_key.startswith("pk-"):
         os.environ.setdefault("OPENAI_API_BASE", pk_base)
 ROOT_DIRECTORY = Path(__file__).parent
 PERSIST_DIRECTORY = f"{ROOT_DIRECTORY}/db"
@@ -128,6 +138,7 @@ DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 ns_initial = SimpleNamespace(
     db=None,
     qa=None,
     ingest_done=None,
     files_info=None,
     files_uploaded=[],
@@ -140,7 +151,7 @@ ns = deepcopy(ns_initial)
 def load_single_document(file_path: str | Path) -> List[Document]:
-    """Loads a single document from a file path."""
     try:
         _ = Path(file_path).read_bytes()
         encoding = detect(_).get("encoding")
@@ -350,6 +361,28 @@ def process_files(
     logger.info(f"Loaded {len(documents)} document(s) ")
     logger.info(f"Split into {len(texts)} chunk(s) of text")
     # initialize if necessary
     if ns.db is None:
         logger.info(f"loading {ns.model_name:}")
@@ -366,19 +399,21 @@ def process_files(
             )
         logger.info("done creating vectorstore")
-    total = ceil(len(texts) / 101)
     if progress is None:
         # for text in progress.tqdm(
-        for idx, text in enumerate(mit.chunked_even(texts, 101)):
             logger.debug(f"-{idx + 1} of {total}")
             ns.db.add_documents(documents=text)
     else:
         # for text in progress.tqdm(
-        for idx, text in enumerate(progress.tqdm(
-            mit.chunked_even(texts, 101),
-            total=total,
-            desc="Processing docs",
-        )):
             logger.debug(f"{idx + 1} of {total}")
             ns.db.add_documents(documents=text)
     logger.debug(f" done all {total}")
@@ -394,15 +429,15 @@ def process_files(
         # return_source_documents=True,
     )
-    ns.ingest_done = True
-    _ = [
-        [Path(doc.metadata.get("source")).name, len(doc.page_content)]
-        for doc in documents
-    ]
-    ns.files_info = _
     logger.debug(f"{ns.ingest_done=}, exit process_files")
-    return f"done file(s): {dict(ns.files_info)}"
 def respond(message, chat_history):
@@ -445,6 +480,8 @@ def respond(message, chat_history):
     except Exception as exc:
         logger.error(exc)
         bot_message = f"bummer! {exc}"
     chat_history.append((message, bot_message))
@@ -571,17 +608,20 @@ def gen_local_llm(model_id="TheBloke/vicuna-7B-1.1-HF"):
     else:
         model = LlamaForCausalLM.from_pretrained(model_id)
-    pipe = pipeline(
-        "text-generation",
-        model=model,
-        tokenizer=tokenizer,
-        max_length=2048,
-        temperature=0,
-        top_p=0.95,
-        repetition_penalty=1.15,
-    )
-    local_llm = HuggingFacePipeline(pipeline=pipe)
     return local_llm
@@ -666,7 +706,9 @@ def main1():
 logger.info(f"ROOT_DIRECTORY: {ROOT_DIRECTORY}")
 openai_api_key = os.getenv("OPENAI_API_KEY")
 logger.info(f"openai_api_key (env var/hf space SECRETS): {openai_api_key}")
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
     # name = gr.Textbox(label="Name")
@@ -724,57 +766,12 @@ with gr.Blocks(theme=gr.themes.Soft()) as demo:
     upload_button.upload(upload_files, upload_button, file_output)
     process_btn.click(process_files, [], text2)
-    def respond(message, chat_history):
-        """Gen response."""
-        logger.info(f"{ns.ingest_done=}")
-        if ns.ingest_done is None:  # no files processed yet
-            bot_message = "Upload some file(s) for processing first."
-            chat_history.append((message, bot_message))
-            return "", chat_history
-        logger.info(f"{ns.ingest_done=}")
-        if not ns.ingest_done:  # embedding database not doen yet
-            bot_message = (
-                "Waiting for ingest (embedding) to finish, "
-                f"({ns.ingest_done=})"
-                "be patient... You can switch the 'Upload files' "
-                "Tab to check"
-            )
-            chat_history.append((message, bot_message))
-            return "", chat_history
-        _ = """
-        if ns.qa is None:  # load qa one time
-            logger.info("Loading qa, need to do just one time.")
-            ns.qa = load_qa()
-            logger.info("Done loading qa, need to do just one time.")
-        # """
-        if ns.qa is None:
-            bot_message = "Looks like the bot is not ready. Try again later..."
-            chat_history.append((message, bot_message))
-            return "", chat_history
-        try:
-            res = ns.qa(message)
-            answer = res.get("result")
-            docs = res.get("source_documents")
-            if docs:
-                bot_message = f"{answer}\n({docs})"
-            else:
-                bot_message = f"{answer}"
-        except Exception as exc:
-            logger.error(exc)
-            bot_message = f"bummer! {exc}"
-        chat_history.append((message, bot_message))
-        return "", chat_history
     msg.submit(respond, [msg, chatbot], [msg, chatbot])
     clear.click(lambda: None, None, chatbot, queue=False)
 if __name__ == "__main__":
-    demo.queue(concurrency_count=20).launch(share=share)
 _ = """
 run_localgpt

 Wall time: 1min 37s
 """
+# pylint: disable=broad-except, unused-import, invalid-name, line-too-long, too-many-return-statements, import-outside-toplevel, no-name-in-module, no-member, too-many-branches, unused-variable, too-many-arguments, global-statement
 import os
 import time
 from copy import deepcopy
 from math import ceil
 from pathlib import Path
+# from tempfile import _TemporaryFileWrapper
 from textwrap import dedent
 from types import SimpleNamespace
 from typing import List
 import gradio as gr
+import httpx
 import more_itertools as mit
 import torch
+# from about_time import about_time
 from charset_normalizer import detect
 from chromadb.config import Settings
     TextLoader,
 )
 from langchain.embeddings import (
     SentenceTransformerEmbeddings,
+)  # HuggingFaceInstructEmbeddings,
 from langchain.llms import HuggingFacePipeline, OpenAI
 from langchain.memory import ConversationBufferMemory
 from langchain.text_splitter import (
         os.environ.setdefault("OPENAI_API_BASE", sk_base)
     elif api_key.startswith("pk-"):
         os.environ.setdefault("OPENAI_API_BASE", pk_base)
+        # resetip
+        try:
+            url = "https://api.pawan.krd/resetip"
+            headers = {"Authorization": f"{api_key}"}
+            httpx.post(url, headers=headers)
+        except Exception as exc_:
+            logger.error(exc_)
+            raise
 ROOT_DIRECTORY = Path(__file__).parent
 PERSIST_DIRECTORY = f"{ROOT_DIRECTORY}/db"
 ns_initial = SimpleNamespace(
     db=None,
     qa=None,
+    texts=[],
     ingest_done=None,
     files_info=None,
     files_uploaded=[],
 def load_single_document(file_path: str | Path) -> List[Document]:
+    """Load a single document from a file path."""
     try:
         _ = Path(file_path).read_bytes()
         encoding = detect(_).get("encoding")
     logger.info(f"Loaded {len(documents)} document(s) ")
     logger.info(f"Split into {len(texts)} chunk(s) of text")
+    total = ceil(len(texts) / 101)
+    ns.texts = texts
+    ns.ingest_done = True
+    _ = [
+        [Path(doc.metadata.get("source")).name, len(doc.page_content)]
+        for doc in documents
+    ]
+    ns.files_info = _
+    _ = (
+        f"done file(s): {dict(ns.files_info)}, splitted to "
+        f"{total} chunks. \n\nThe following embedding takes "
+        f"step 0-{total - 1}. (Each step lasts about 18 secs "
+        " on a free tier instance on huggingface space.)"
+    )
+    return _
+def embed_files(progress=gr.Progress()):
+    """Embded ns.files_uploaded."""
     # initialize if necessary
     if ns.db is None:
         logger.info(f"loading {ns.model_name:}")
             )
         logger.info("done creating vectorstore")
+    total = ceil(len(ns.texts) / 101)
     if progress is None:
         # for text in progress.tqdm(
+        for idx, text in enumerate(mit.chunked_even(ns.texts, 101)):
             logger.debug(f"-{idx + 1} of {total}")
             ns.db.add_documents(documents=text)
     else:
         # for text in progress.tqdm(
+        for idx, text in enumerate(
+            progress.tqdm(
+                mit.chunked_even(ns.texts, 101),
+                total=total,
+                desc="Processing docs",
+            )
+        ):
             logger.debug(f"{idx + 1} of {total}")
             ns.db.add_documents(documents=text)
     logger.debug(f" done all {total}")
         # return_source_documents=True,
     )
     logger.debug(f"{ns.ingest_done=}, exit process_files")
+    _ = (
+        f"Done {total} chunks. You can now "
+        "switch to Query Docs Tab to chat. "
+        "You can chat in a language you prefer, "
+        "independent of the document language. Have fun."
+    )
+    return _
 def respond(message, chat_history):
     except Exception as exc:
         logger.error(exc)
         bot_message = f"bummer! {exc}"
+        if "empty" in str(exc):
+            bot_message = f"{bot_message} (probably invalid apikey)"
     chat_history.append((message, bot_message))
     else:
         model = LlamaForCausalLM.from_pretrained(model_id)
+    local_llm = None
+    if model is not None:  # to please pyright
+        pipe = pipeline(
+            "text-generation",
+            model=model,  # type: ignore
+            tokenizer=tokenizer,
+            max_length=2048,
+            temperature=0,
+            top_p=0.95,
+            repetition_penalty=1.15,
+        )
+        local_llm = HuggingFacePipeline(pipeline=pipe)
     return local_llm
 logger.info(f"ROOT_DIRECTORY: {ROOT_DIRECTORY}")
 openai_api_key = os.getenv("OPENAI_API_KEY")
+openai_api_base = os.getenv("OPENAI_API_BASE")
 logger.info(f"openai_api_key (env var/hf space SECRETS): {openai_api_key}")
+logger.info(f"openai_api_base: {openai_api_base}")
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
     # name = gr.Textbox(label="Name")
     upload_button.upload(upload_files, upload_button, file_output)
     process_btn.click(process_files, [], text2)
+    # Query docs TAB
     msg.submit(respond, [msg, chatbot], [msg, chatbot])
     clear.click(lambda: None, None, chatbot, queue=False)
 if __name__ == "__main__":
+    demo.queue(concurrency_count=20).launch()
 _ = """
 run_localgpt

main.py CHANGED Viewed

@@ -2,13 +2,43 @@
 # pylint: disable=invalid-name, unused-import, broad-except,
 from copy import deepcopy
 import gradio as gr
-from app import ingest, ns, ns_initial, process_files, upload_files, respond
-from load_api_key import load_api_key, pk_base, sk_base
 from loguru import logger
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
-    with gr.Tab("Upload files"):
         # Upload files and generate vectorstore
         with gr.Row():
             file_output = gr.File()
@@ -20,12 +50,15 @@ with gr.Blocks(theme=gr.themes.Soft()) as demo:
                 file_count="multiple",
             )
         with gr.Row():
-            text2 = gr.Textbox("Gen embedding")
-            process_btn = gr.Button("Click to embed")
         reset_btn = gr.Button("Reset everything", visible=False)
-    with gr.Tab("Query docs"):
         # interactive chat
         chatbot = gr.Chatbot()
         msg = gr.Textbox(label="Query")
@@ -38,11 +71,13 @@ with gr.Blocks(theme=gr.themes.Soft()) as demo:
         globals().update(**{"ns": deepcopy(ns_initial)})
         return f"reset done: ns={ns}"
-    reset_btn.click(reset_all, [], text2)
     upload_button.upload(upload_files, upload_button, file_output)
     process_btn.click(process_files, [], text2)
     msg.submit(respond, [msg, chatbot], [msg, chatbot])
     clear.click(lambda: None, None, chatbot, queue=False)

 # pylint: disable=invalid-name, unused-import, broad-except,
 from copy import deepcopy
+from textwrap import dedent
 import gradio as gr
 from loguru import logger
+from app import (
+    embed_files,
+    ingest,
+    ns,
+    ns_initial,
+    process_files,
+    respond,
+    upload_files,
+)
+from load_api_key import load_api_key, pk_base, sk_base
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    with gr.Tab("Upload files"):  # Tab1
+        with gr.Accordion("Info", open=False):
+            _ = """
+                # multilingual dokugpt/多语dokugpt
+                和你的文件对话： 可用中文向外语文件提问或用外语向中文文件提问
+                Talk to your docs (.pdf, .docx, .epub, .txt .md and
+                other text docs): You can ask questions in a language you prefer, independent of the document language.
+                It
+                takes quite a while to ingest docs (5-30 min. depending
+                on net, RAM, CPU etc.).
+                Send empty query (hit Enter) to check embedding status and files info ([filename, numb of chars])
+                Homepage: https://huggingface.co/spaces/mikeee/localgpt
+                """
+            gr.Markdown(dedent(_))
         # Upload files and generate vectorstore
         with gr.Row():
             file_output = gr.File()
                 file_count="multiple",
             )
         with gr.Row():
+            text2 = gr.Textbox("Process docs")
+            process_btn = gr.Button("Click to process")
+        with gr.Row():
+            text_embed = gr.Textbox("Generate embeddings")
+            embed_btn = gr.Button("Click to embed")
         reset_btn = gr.Button("Reset everything", visible=False)
+    with gr.Tab("Query docs"):  # Tab1
         # interactive chat
         chatbot = gr.Chatbot()
         msg = gr.Textbox(label="Query")
         globals().update(**{"ns": deepcopy(ns_initial)})
         return f"reset done: ns={ns}"
+    # Tab1
     upload_button.upload(upload_files, upload_button, file_output)
     process_btn.click(process_files, [], text2)
+    embed_btn.click(embed_files, [], text_embed)
+    reset_btn.click(reset_all, [], text2)
+    # Tab2
     msg.submit(respond, [msg, chatbot], [msg, chatbot])
     clear.click(lambda: None, None, chatbot, queue=False)

requirements-dev.txt CHANGED Viewed

@@ -1,2 +1,6 @@
 ipython
-pylint

 ipython
+isort
+black
+pydocstyle
+pyright
+pylint

run-main.sh ADDED Viewed

	@@ -0,0 +1 @@


1	+ nodemon -w app.py -w main.py -x python main.py