Yaxin1992
/

llama3.1-8b-dpo-1000-hq

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

llama3.1-8b-dpo-1000-hq / adapter_model.safetensors

Commit History

Training in progress, step 1000

2a9c03a
verified

Yaxin1992 commited on Aug 16

Training in progress, step 800

6eee832
verified

Yaxin1992 commited on Aug 16

Training in progress, step 600

b6c0d30
verified

Yaxin1992 commited on Aug 16

Training in progress, step 400

4d68e20
verified

Yaxin1992 commited on Aug 16

Training in progress, step 200

dde32d3
verified

Yaxin1992 commited on Aug 16