Update README.md
Browse files
README.md
CHANGED
@@ -1,4 +1,9 @@
|
|
1 |
-
|
|
|
|
|
|
|
|
|
|
|
2 |
ChatYuan-7B是一个支持中英双语的功能型对话语言大模型。它是基于LLama-7B模型上继续进行三阶段训练的模型。
|
3 |
三阶段如下:
|
4 |
1. 在中文通用语料上继续预训练500亿中文token
|
@@ -42,3 +47,14 @@ print(response)
|
|
42 |
```
|
43 |
|
44 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language:
|
3 |
+
- en
|
4 |
+
- zh
|
5 |
+
license: gpl-3.0
|
6 |
+
---
|
7 |
ChatYuan-7B是一个支持中英双语的功能型对话语言大模型。它是基于LLama-7B模型上继续进行三阶段训练的模型。
|
8 |
三阶段如下:
|
9 |
1. 在中文通用语料上继续预训练500亿中文token
|
|
|
47 |
```
|
48 |
|
49 |
|
50 |
+
## 限制
|
51 |
+
|
52 |
+
在当前基础模型和数据训练的模型中仍存在一些问题:
|
53 |
+
|
54 |
+
1. 当要求遵循与事实相关的指令时,模型可能会生成事实错误。
|
55 |
+
|
56 |
+
2. 由于模型仍然难以识别潜在的有害指令,偶尔会生成有害的回应。
|
57 |
+
|
58 |
+
3. 在推理和编码方面仍然需要改进
|
59 |
+
|
60 |
+
由于模型仍然存在限制,我们要求开发者只能将开源代码、数据、模型以及通过该项目生成的其他任何成果用于研究目的。不允许商业用途和其他潜在有害的使用场景。
|