jiazhengli
/

Mixtral-8x7B-Instruct-v0.1-QLoRA-Assessment-Rationale-dpo

Generated from Trainer

Model card Files Files and versions Community

Mixtral-8x7B-Instruct-v0.1-QLoRA-Assessment-Rationale-dpo / training_eval_loss.png

Jiazheng Li

init push

0ffb2d3 4 months ago

history contribute delete

45.5 kB