|
--- |
|
license: agpl-3.0 |
|
language: |
|
- zh |
|
base_model: |
|
- Qwen/Qwen1.5-32B |
|
tags: |
|
- reflection |
|
--- |
|
|
|
# Reflection-Chinese-32B · Reflection-中文-32B |
|
|
|
本模型使用[Reflection-Chinese-Dataset](https://huggingface.co/datasets/stvlynn/Reflection-Chinese-Dataset)微调,底模为Qwen1.5-32B |
|
|
|
通过Reflection格式(think-reflect-output)的数据集引导模型形成特定的思维方式,提高正确率 |
|
|
|
## Demo |
|
|
|
1. ✅3.11和3.8哪个大 |
|
|
|
![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-15-13.22.23.33upadngk6m0.webp) |
|
|
|
2. ✅鲁迅为什么打周树人 |
|
|
|
![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-12-13.18.02.3eowy8bgbma0.webp) |
|
|
|
3. 树上几只鸟 |
|
|
|
![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-12-10.17.59.6c0dbu9ls880.webp) |
|
|
|
4. ❌strawberry(未完全通过,因为复现成功率低) |
|
|
|
![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/IMG_2685.6gunge0hf5s0.webp) |
|
|
|
## 存在的问题 |
|
|
|
1. [Reflection-llama3.1-70B](https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B)在真实性上存在很多疑问,本项目使用的数据集是基于该项目的,所以本项目不保证可用性 |
|
|
|
2. 虽然本项目的数据集严格使用<think><reflection><output>标签用来分割内容,但是实际输出并没有这样的效果 |