yhavinga
/

Boreas-7B-chat

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

yhavinga commited on May 4

Commit

c53f305

•

1 Parent(s): 76608f5

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -99,7 +99,7 @@ De keuze voor deze mix is gebaseerd op zowel beschikbaarheid van data als de vol
   de vertalingen of generaties van een slechte kwaliteit zijn. Daarom is gekozen voor datasets waarvan de brondata
   pre ChatGPT tijdperk zijn, (dus voor November 2022).
 * mc4_nl_cleaned - de bron van deze dataset is mC4 - deduplicated data van Common
-  Crawl, en gefiltered op bad-words en andere bewerkingen volgens het recept van de T5 auteurs voor de Engelse C4 dataset. In diverse ablations blijkt C4 een goede pre-train dataset, daarom is mc4_nl_cleaned ook voor dit model gebruikt.
 * Er is geen sourcecode in gemixt - ik verwacht niet dat een 7B model ooit code kan genereren dat bruikbaar is.
   Misschien helpt het bij logisch redeneer-puzzels, maar ook daarvoor verwacht ik dat een 7B model dit nooit zo goed
   zal kunnen of generaliseren als grotere modellen.

   de vertalingen of generaties van een slechte kwaliteit zijn. Daarom is gekozen voor datasets waarvan de brondata
   pre ChatGPT tijdperk zijn, (dus voor November 2022).
 * mc4_nl_cleaned - de bron van deze dataset is mC4 - deduplicated data van Common
+  Crawl, en gefiltered op bad-words en andere bewerkingen volgens het recept van de T5 auteurs voor de Engelse C4 dataset. In diverse vergelijkingen blijkt C4 een goede pre-train dataset, daarom is mc4_nl_cleaned ook voor dit model gebruikt.
 * Er is geen sourcecode in gemixt - ik verwacht niet dat een 7B model ooit code kan genereren dat bruikbaar is.
   Misschien helpt het bij logisch redeneer-puzzels, maar ook daarvoor verwacht ik dat een 7B model dit nooit zo goed
   zal kunnen of generaliseren als grotere modellen.