YYYYYYibo
/

nash_dpo_doff_no_golden_iter_1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_doff_no_golden_iter_1

Commit History

DPO-7b-beta0.01

45e2643
verified

YYYYYYibo commited on May 8

Model save

f9aa23f
verified

YYYYYYibo commited on May 8

DPO-7b-beta0.01

773cf21
verified

YYYYYYibo commited on May 7

Model save

5bc0031
verified

YYYYYYibo commited on May 7

Training in progress, epoch 0

f710c83
verified

YYYYYYibo commited on May 7

initial commit

6a72262
verified

YYYYYYibo commited on May 7