YYYYYYibo
/

two_agent_1_epoch_2_dpo_iter_6

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

two_agent_1_epoch_2_dpo_iter_6 / all_results.json

Commit History

Model save

f8e7726
verified

YYYYYYibo commited on Sep 1