DUAL-GPO
/

zephyr-7b-dpo-0k-15k-0.001-i1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-0k-15k-0.001-i1 / runs

1 contributor

History: 1 commit

BraylonDash's picture

Training in progress, step 20

f1fb5da verified about 2 months ago

Sep19_19-27-21_gpu4-119-5
Training in progress, step 20 about 2 months ago