fenguhao
/

llama-8b-dpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llama-8b-dpo-full

Commit History

End of training

ca44aef
verified

fenguhao commited on Jul 12

Model save

b002b79
verified

fenguhao commited on Jul 12

initial commit

ed803ed
verified

fenguhao commited on Jul 12