RyanYr
/

reward-judge_iter-dpo-genRM_pilot-exp_iter2

Generated from Trainer

Model card Files Files and versions Community

reward-judge_iter-dpo-genRM_pilot-exp_iter2 / .gitattributes

Commit History

initial commit

23e7a99
verified

RyanYr commited on Sep 13