stvlynn
/

Reflection-Chinese-32B

Model card Files Files and versions Community

Reflection-Chinese-32B / README.md

stvlynn's picture

Update README.md

b3be673 verified about 2 months ago

|

1.36 kB

	---
	license: agpl-3.0
	language:
	- zh
	base_model:
	- Qwen/Qwen1.5-32B
	tags:
	- reflection
	---

	# Reflection-Chinese-32B · Reflection-中文-32B

	本模型使用[Reflection-Chinese-Dataset](https://huggingface.co/datasets/stvlynn/Reflection-Chinese-Dataset)微调，底模为Qwen1.5-32B

	通过Reflection格式(think-reflect-output)的数据集引导模型形成特定的思维方式，提高正确率

	## Demo

	1. ✅3.11和3.8哪个大

	![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-15-13.22.23.33upadngk6m0.webp)

	2. ✅鲁迅为什么打周树人

	![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-12-13.18.02.3eowy8bgbma0.webp)

	3. 树上几只鸟

	![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/截屏2024-09-12-10.17.59.6c0dbu9ls880.webp)

	4. ❌strawberry(未完全通过，因为复现成功率低)

	![](https://cdn.statically.io/gh/stvlynn/cloudimg@master/blog/2310/IMG_2685.6gunge0hf5s0.webp)

	## 存在的问题

	1. [Reflection-llama3.1-70B](https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B)在真实性上存在很多疑问，本项目使用的数据集是基于该项目的，所以本项目不保证可用性

	2. 虽然本项目的数据集严格使用<think><reflection><output>标签用来分割内容，但是实际输出并没有这样的效果