chinese_chitchat / README.md
qgyd2021's picture
Update README.md
83fe105
|
raw
history blame
934 Bytes
metadata
base_model: qgyd2021/chinese_chitchat
tags:
  - generated_from_trainer
model-index:
  - name: chinese_chitchat
    results: []

chinese_chitchat

这个模型是基于 uer/gpt2-chinese-cluecorpussmallqgyd2021/chinese_chitchat 数据集的 xiaohuangji 子集上进行微调的。

由于该数据集(xiaohuangji)中问答不相关(答非所问)的样本很多,噪音大,因此虽然有45万样本,但感觉效果并不太好。

训练了 2 次,第一次 26000 步,第二次 8000 步,总共大约是 10 个 epoch 的样子。