martimfasantos
/

tinyllama-1.1b-sum-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

tinyllama-1.1b-sum-dpo-qlora / adapter_model.safetensors

Commit History

Training in progress, step 1900

c94f870
verified

martimfasantos commited on May 9

Training in progress, step 1800

ca497d9
verified

martimfasantos commited on May 9

Training in progress, step 1700

1c754a3
verified

martimfasantos commited on May 9

Training in progress, step 1600

add2755
verified

martimfasantos commited on May 9

Training in progress, step 1500

73b5871
verified

martimfasantos commited on May 9

Training in progress, step 1400

a00a811
verified

martimfasantos commited on May 9

Training in progress, step 1300

685c0fd
verified

martimfasantos commited on May 9

Training in progress, step 1200

a8aea1a
verified

martimfasantos commited on May 9

Training in progress, step 1100

caa400d
verified

martimfasantos commited on May 9

Training in progress, step 1000

28b023f
verified

martimfasantos commited on May 9

Training in progress, step 900

f637d86
verified

martimfasantos commited on May 9

Training in progress, step 800

5254e6a
verified

martimfasantos commited on May 9

Training in progress, step 700

07a752d
verified

martimfasantos commited on May 9

Training in progress, step 600

8945cbd
verified

martimfasantos commited on May 9

Training in progress, step 500

731e704
verified

martimfasantos commited on May 9

Training in progress, step 400

1db3fd4
verified

martimfasantos commited on May 9

Training in progress, step 300

53c90f2
verified

martimfasantos commited on May 9

Training in progress, step 200

3b70df4
verified

martimfasantos commited on May 9

Training in progress, step 100

fe47e4b
verified

martimfasantos commited on May 9