Update README.md
Browse files
README.md
CHANGED
@@ -53,6 +53,8 @@ base_model:
|
|
53 |
|
54 |
#### Результаты на бенчмарке RAG
|
55 |
|
|
|
|
|
56 |
Тут для оценки качества модель-судья gpt-4o была проинструктирована учитывать релеватность и фактологичкскую полноту ответов исходя из документов и реферсного ответа от gpt-4-1106-preview.
|
57 |
|
58 |
Подробности промптов и оценок смотрите в коде бенчмарка на [коллабе](https://colab.research.google.com/drive/16730rWQ4-yGqWoooLs0Ece_16frmOniP?usp=sharing)
|
|
|
53 |
|
54 |
#### Результаты на бенчмарке RAG
|
55 |
|
56 |
+
Общий размер тестового сета - 200 примеров, 100 для in_domain вопросов и 100 для out_of_domain.
|
57 |
+
|
58 |
Тут для оценки качества модель-судья gpt-4o была проинструктирована учитывать релеватность и фактологичкскую полноту ответов исходя из документов и реферсного ответа от gpt-4-1106-preview.
|
59 |
|
60 |
Подробности промптов и оценок смотрите в коде бенчмарка на [коллабе](https://colab.research.google.com/drive/16730rWQ4-yGqWoooLs0Ece_16frmOniP?usp=sharing)
|