LumiOpen/Poro-34B-chat · Problem with random output and RAG usage and

8 days ago

•

Hi, we have two separate issues.

for some Finnish inputs we get some random EU (?) texts as output:

<|user|>Käännä suomeksi: The Commission shall be empowered to adopt delegated acts in accordance with Article 21 to supplement this Regulation by establishing the detailed rules for the application of the provisions of this Chapter. <|assistant|>Siirretään komissiolle valta antaa 21 artiklan mukaisesti delegoituja säädöksiä, joilla täydennetään tätä asetusta vahvistamalla tämän luvun säännösten soveltamista koskevat yksityiskohtaiset säännöt.

Osakkaalla on lähtökohtaisesti oikeus tehdä muutostöitä hallitsemallaan parvekkeella. Muutostyöoikeus on kuitenkin käytännössä rajoitetumpi kuin huoneiston sisäpuolella. Muutostyötä rajoittaa ensinnäkin se, että muutoksesta ei saa aiheutua haittaa tai vahinkoa muille osakkeenomistajille tai yhtiölle.

Toiseksi muutos ei saa haitata rakennuksen julkisivun esteettistä ilmettä tai tuottaa naapureille haittaa, vaikka samat asennukset huoneiston sisälle toteutettuina eivät haittaisikaan. Osakkaalla ei automaattisesti ole oikeutta esimerkiksi asentaa isoa lautasantennia parvekkeen kaiteelle, koska se vaikuttaa rakennuksen julkisivun ilmeeseen. Sama koskee myös osakkaan asentamia markiiseja tai vastaavia.

Osakas voi kuitenkin tehdä välttämättömiä kunnossapitotöitä parvekkeella ilman muiden osakkeenomistajien suostumusta. Lisäksi yhtiöjärjestyksessä voidaan määrätä toisin parvekehallintaoikeudesta ja -kunnossapitovastuusta.

for RAG, we are trying to instruct the model to only use information in the context, but that is ignored. Exactly same system works with Llama3.1 in Finnish, for example. One version of system prompts we have tried in Finnish and English also:
Olet avulias assistentti.

Vastaa kysymyksiin lyhyesti.
Käytä vain tägien ja sisällä olevaa tietoa vastaamiseen.
Älä koskaan keksi vastausta.
Jos tietoa ei löydy, sano, että et tiedä vastausta.

We have tried different quentized versions of the model with Ollama (GGUF & minimal modelfile) and transformers library.

jonabur

LumiOpen org 8 days ago

for #1 are you using the chatml formatting to prompt the model? can you provide more information here on exactly what you're sending?

for #2 unfortunately Poro's instruction tuning is pretty basic compared to Llama 3.1. you might have more luck using a few shot prompting approach if that's possible for your use case.

pesonen

7 days ago

•

edited 7 days ago

Sorry now I see that this "random" output is some very old history from our previous experiments. I'll have to check what is going on with Ollama & Open WebUI combo.
Thanks we'll try giving some examples