DUAL-GPO
/

zephyr-7b-dpo-0k-15k-i1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-0k-15k-i1

1 contributor

History: 2 commits

BraylonDash's picture

Training in progress, step 20

901fc5f verified about 2 months ago