使用spicy中的unalign类型的数据集,然后人使用google翻译又做了一份中文的。两份数据跑了3个epoch。 这个LoRA主要是想测试unalign 183条数据集是否就能搞定模型去对齐的能力。
-