XiaoY1
/

Qwen2-7B-Instruct-DPO-novel-beta0.5

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-7B-Instruct-DPO-novel-beta0.5 / trainer_state.json

Commit History

Upload trainer_state.json with huggingface_hub

c57690f
verified

XiaoY1 commited on Sep 9