LaoRay
/

zephyr-7b-dpo-lora-r16-20k

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-dpo-lora-r16-20k / train_results.json

LaoRay's picture

Model save

58e71f4 verified 3 months ago

210 Bytes

	{
	"epoch": 1.0,
	"total_flos": 0.0,
	"train_loss": 0.0,
	"train_runtime": 0.0105,
	"train_samples": 20000,
	"train_samples_per_second": 1898476.441,
	"train_steps_per_second": 118654.778
	}