RyanYr
/

self-correct_mistral-small-it_mMQA_dpo_iter1_beta.05

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_mistral-small-it_mMQA_dpo_iter1_beta.05 / README.md

Commit History

Model save

fb8cc25
verified

RyanYr commited on 3 days ago

Training in progress, step 36

2dfe419
verified

RyanYr commited on 3 days ago