stvlynn's picture
Update README.md
504621b verified
|
raw
history blame
1.47 kB
---
license: agpl-3.0
language:
- zh
base_model:
- Qwen/Qwen1.5-32B
tags:
- reflection
---
# Reflection-Chinese-32B · Reflection-中文-32B
本模型使用[Reflection-Chinese-Dataset](https://huggingface.co/datasets/stvlynn/Reflection-Chinese-Dataset)微调,底模为Qwen1.5-32B
通过Reflection格式(think-reflect-output)的数据集引导模型形成特定的思维方式,提高正确率
## Usage
下载[Q8量化文件](https://huggingface.co/stvlynn/Reflection-Chinese-32B-Q8_0-gguf)
使用ollama运行
## Demo
1. ✅3.11和3.8哪个大
![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-15-13.22.23.33upadngk6m0.webp)
2. ✅鲁迅为什么打周树人
![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-12-13.18.02.3eowy8bgbma0.webp)
3. 树上几只鸟
![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-12-10.17.59.6c0dbu9ls880.webp)
4. ❌strawberry(未完全通过,因为复现成功率低)
![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/IMG_2685.6gunge0hf5s0.webp)
## 存在的问题
1. [Reflection-llama3.1-70B](https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B)在真实性上存在很多疑问,本项目使用的数据集是基于该项目的,所以本项目不保证可用性
2. 虽然本项目的数据集严格使用<think><reflection><output>标签用来分割内容,但是实际输出并没有这样的效果