NicholasCorrado
/

tinyllama-1.1b-chat-v1.0-ui-math-dpo-2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

tinyllama-1.1b-chat-v1.0-ui-math-dpo-2 / model.safetensors

Commit History

Training in progress, step 882

0b96062
verified

NicholasCorrado commited on Sep 3

Training in progress, step 800

beb34b4
verified

NicholasCorrado commited on Sep 3

Training in progress, step 700

cf8f1e6
verified

NicholasCorrado commited on Sep 3

Training in progress, step 600

4572e8a
verified

NicholasCorrado commited on Sep 3

Training in progress, step 500

0490bda
verified

NicholasCorrado commited on Sep 3

Training in progress, step 400

52d9af5
verified

NicholasCorrado commited on Sep 3

Training in progress, step 300

e745d18
verified

NicholasCorrado commited on Sep 3

Training in progress, step 200

76b7c4e
verified

NicholasCorrado commited on Sep 3

Training in progress, step 100

c3e076c
verified

NicholasCorrado commited on Sep 3