RyanYr
/

reward-judge_iter-sft-genRM_pilot-exp_iter2

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

reward-judge_iter-sft-genRM_pilot-exp_iter2

Commit History

Model save

0da472c
verified

RyanYr commited on Sep 15

Training in progress, step 80

96dc7f2
verified

RyanYr commited on Sep 15

initial commit

a738215
verified

RyanYr commited on Sep 15