RyanYr
/

self-correct_mistral-small-it_mMQA_dpo_iter1_beta.05

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_mistral-small-it_mMQA_dpo_iter1_beta.05 / model-00005-of-00009.safetensors

Commit History

Training in progress, step 36

2dfe419
verified

RyanYr commited on 2 days ago