stance-detection-t5 / trainer_state.json

Alex Spangher

updated

4ce7ed9 11 months ago

111 kB

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 4.0,
	"eval_steps": 100,
	"global_step": 24404,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.02,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 2.032832145690918,
	"eval_runtime": 62.2478,
	"eval_samples_per_second": 82.541,
	"eval_steps_per_second": 3.454,
	"step": 100
	},
	{
	"epoch": 0.03,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 1.4367562532424927,
	"eval_runtime": 63.0927,
	"eval_samples_per_second": 81.436,
	"eval_steps_per_second": 3.408,
	"step": 200
	},
	{
	"epoch": 0.05,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 1.2640273571014404,
	"eval_runtime": 61.4349,
	"eval_samples_per_second": 83.633,
	"eval_steps_per_second": 3.5,
	"step": 300
	},
	{
	"epoch": 0.07,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 1.173414707183838,
	"eval_runtime": 64.7986,
	"eval_samples_per_second": 79.292,
	"eval_steps_per_second": 3.318,
	"step": 400
	},
	{
	"epoch": 0.08,
	"learning_rate": 4.897557777413539e-05,
	"loss": 2.7729,
	"step": 500
	},
	{
	"epoch": 0.08,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 1.1171976327896118,
	"eval_runtime": 62.4514,
	"eval_samples_per_second": 82.272,
	"eval_steps_per_second": 3.443,
	"step": 500
	},
	{
	"epoch": 0.1,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 1.0716122388839722,
	"eval_runtime": 62.3679,
	"eval_samples_per_second": 82.382,
	"eval_steps_per_second": 3.447,
	"step": 600
	},
	{
	"epoch": 0.11,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 1.0408052206039429,
	"eval_runtime": 62.3699,
	"eval_samples_per_second": 82.379,
	"eval_steps_per_second": 3.447,
	"step": 700
	},
	{
	"epoch": 0.13,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 1.0002268552780151,
	"eval_runtime": 60.9857,
	"eval_samples_per_second": 84.249,
	"eval_steps_per_second": 3.525,
	"step": 800
	},
	{
	"epoch": 0.15,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 0.9761040806770325,
	"eval_runtime": 63.3879,
	"eval_samples_per_second": 81.057,
	"eval_steps_per_second": 3.392,
	"step": 900
	},
	{
	"epoch": 0.16,
	"learning_rate": 4.795115554827078e-05,
	"loss": 1.1066,
	"step": 1000
	},
	{
	"epoch": 0.16,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 0.9439008831977844,
	"eval_runtime": 60.9997,
	"eval_samples_per_second": 84.23,
	"eval_steps_per_second": 3.525,
	"step": 1000
	},
	{
	"epoch": 0.18,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 0.921099841594696,
	"eval_runtime": 61.9171,
	"eval_samples_per_second": 82.982,
	"eval_steps_per_second": 3.472,
	"step": 1100
	},
	{
	"epoch": 0.2,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 0.89990234375,
	"eval_runtime": 66.001,
	"eval_samples_per_second": 77.847,
	"eval_steps_per_second": 3.258,
	"step": 1200
	},
	{
	"epoch": 0.21,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 0.879767656326294,
	"eval_runtime": 65.3826,
	"eval_samples_per_second": 78.584,
	"eval_steps_per_second": 3.288,
	"step": 1300
	},
	{
	"epoch": 0.23,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 0.8532700538635254,
	"eval_runtime": 66.1288,
	"eval_samples_per_second": 77.697,
	"eval_steps_per_second": 3.251,
	"step": 1400
	},
	{
	"epoch": 0.25,
	"learning_rate": 4.692673332240616e-05,
	"loss": 0.9358,
	"step": 1500
	},
	{
	"epoch": 0.25,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 0.8349987864494324,
	"eval_runtime": 64.1308,
	"eval_samples_per_second": 80.118,
	"eval_steps_per_second": 3.353,
	"step": 1500
	},
	{
	"epoch": 0.26,
	"eval_label_accuracy": {
	"accuracy": 0.4388867263526664
	},
	"eval_label_f1_macro": {
	"f1": 0.1525091302583525
	},
	"eval_label_f1_micro": {
	"f1": 0.4388867263526664
	},
	"eval_loss": 0.8146479725837708,
	"eval_runtime": 65.0686,
	"eval_samples_per_second": 78.963,
	"eval_steps_per_second": 3.304,
	"step": 1600
	},
	{
	"epoch": 0.28,
	"eval_label_accuracy": {
	"accuracy": 0.4534838458544181
	},
	"eval_label_f1_macro": {
	"f1": 0.21174904672848718
	},
	"eval_label_f1_micro": {
	"f1": 0.4534838458544181
	},
	"eval_loss": 0.7984741926193237,
	"eval_runtime": 64.3594,
	"eval_samples_per_second": 79.833,
	"eval_steps_per_second": 3.341,
	"step": 1700
	},
	{
	"epoch": 0.3,
	"eval_label_accuracy": {
	"accuracy": 0.4560140132347217
	},
	"eval_label_f1_macro": {
	"f1": 0.24178290688684612
	},
	"eval_label_f1_micro": {
	"f1": 0.4560140132347217
	},
	"eval_loss": 0.7780113816261292,
	"eval_runtime": 66.3431,
	"eval_samples_per_second": 77.446,
	"eval_steps_per_second": 3.241,
	"step": 1800
	},
	{
	"epoch": 0.31,
	"eval_label_accuracy": {
	"accuracy": 0.46321525885558584
	},
	"eval_label_f1_macro": {
	"f1": 0.24751285219162994
	},
	"eval_label_f1_micro": {
	"f1": 0.4632152588555859
	},
	"eval_loss": 0.7548134326934814,
	"eval_runtime": 65.2338,
	"eval_samples_per_second": 78.763,
	"eval_steps_per_second": 3.296,
	"step": 1900
	},
	{
	"epoch": 0.33,
	"learning_rate": 4.590231109654155e-05,
	"loss": 0.8298,
	"step": 2000
	},
	{
	"epoch": 0.33,
	"eval_label_accuracy": {
	"accuracy": 0.46924873491630986
	},
	"eval_label_f1_macro": {
	"f1": 0.2464816382147299
	},
	"eval_label_f1_micro": {
	"f1": 0.46924873491630986
	},
	"eval_loss": 0.7355437874794006,
	"eval_runtime": 66.2105,
	"eval_samples_per_second": 77.601,
	"eval_steps_per_second": 3.247,
	"step": 2000
	},
	{
	"epoch": 0.34,
	"eval_label_accuracy": {
	"accuracy": 0.43557804593226934
	},
	"eval_label_f1_macro": {
	"f1": 0.24962525654931594
	},
	"eval_label_f1_micro": {
	"f1": 0.43557804593226934
	},
	"eval_loss": 0.7379868626594543,
	"eval_runtime": 66.543,
	"eval_samples_per_second": 77.213,
	"eval_steps_per_second": 3.231,
	"step": 2100
	},
	{
	"epoch": 0.36,
	"eval_label_accuracy": {
	"accuracy": 0.46555079797586607
	},
	"eval_label_f1_macro": {
	"f1": 0.2992369280869709
	},
	"eval_label_f1_micro": {
	"f1": 0.46555079797586607
	},
	"eval_loss": 0.7291679978370667,
	"eval_runtime": 65.5998,
	"eval_samples_per_second": 78.323,
	"eval_steps_per_second": 3.277,
	"step": 2200
	},
	{
	"epoch": 0.38,
	"eval_label_accuracy": {
	"accuracy": 0.49202024133904243
	},
	"eval_label_f1_macro": {
	"f1": 0.3141049709544147
	},
	"eval_label_f1_micro": {
	"f1": 0.49202024133904243
	},
	"eval_loss": 0.6944931149482727,
	"eval_runtime": 65.8926,
	"eval_samples_per_second": 77.975,
	"eval_steps_per_second": 3.263,
	"step": 2300
	},
	{
	"epoch": 0.39,
	"eval_label_accuracy": {
	"accuracy": 0.502724795640327
	},
	"eval_label_f1_macro": {
	"f1": 0.3701433983343189
	},
	"eval_label_f1_micro": {
	"f1": 0.502724795640327
	},
	"eval_loss": 0.6872398257255554,
	"eval_runtime": 64.1033,
	"eval_samples_per_second": 80.152,
	"eval_steps_per_second": 3.354,
	"step": 2400
	},
	{
	"epoch": 0.41,
	"learning_rate": 4.4877888870676944e-05,
	"loss": 0.7424,
	"step": 2500
	},
	{
	"epoch": 0.41,
	"eval_label_accuracy": {
	"accuracy": 0.49883223043985986
	},
	"eval_label_f1_macro": {
	"f1": 0.37174762565152936
	},
	"eval_label_f1_micro": {
	"f1": 0.49883223043985986
	},
	"eval_loss": 0.6769503951072693,
	"eval_runtime": 65.8998,
	"eval_samples_per_second": 77.967,
	"eval_steps_per_second": 3.263,
	"step": 2500
	},
	{
	"epoch": 0.43,
	"eval_label_accuracy": {
	"accuracy": 0.503308680420397
	},
	"eval_label_f1_macro": {
	"f1": 0.3680796226372295
	},
	"eval_label_f1_micro": {
	"f1": 0.503308680420397
	},
	"eval_loss": 0.6723325848579407,
	"eval_runtime": 64.9642,
	"eval_samples_per_second": 79.09,
	"eval_steps_per_second": 3.31,
	"step": 2600
	},
	{
	"epoch": 0.44,
	"eval_label_accuracy": {
	"accuracy": 0.5101206695212145
	},
	"eval_label_f1_macro": {
	"f1": 0.37785590629881227
	},
	"eval_label_f1_micro": {
	"f1": 0.5101206695212145
	},
	"eval_loss": 0.6622567772865295,
	"eval_runtime": 67.697,
	"eval_samples_per_second": 75.897,
	"eval_steps_per_second": 3.176,
	"step": 2700
	},
	{
	"epoch": 0.46,
	"eval_label_accuracy": {
	"accuracy": 0.5058388478007007
	},
	"eval_label_f1_macro": {
	"f1": 0.37480207390602494
	},
	"eval_label_f1_micro": {
	"f1": 0.5058388478007007
	},
	"eval_loss": 0.6581109166145325,
	"eval_runtime": 65.1127,
	"eval_samples_per_second": 78.909,
	"eval_steps_per_second": 3.302,
	"step": 2800
	},
	{
	"epoch": 0.48,
	"eval_label_accuracy": {
	"accuracy": 0.5081743869209809
	},
	"eval_label_f1_macro": {
	"f1": 0.35256174805106155
	},
	"eval_label_f1_micro": {
	"f1": 0.5081743869209809
	},
	"eval_loss": 0.6534283757209778,
	"eval_runtime": 66.7769,
	"eval_samples_per_second": 76.943,
	"eval_steps_per_second": 3.22,
	"step": 2900
	},
	{
	"epoch": 0.49,
	"learning_rate": 4.385346664481233e-05,
	"loss": 0.6892,
	"step": 3000
	},
	{
	"epoch": 0.49,
	"eval_label_accuracy": {
	"accuracy": 0.4706111327364733
	},
	"eval_label_f1_macro": {
	"f1": 0.372103581749401
	},
	"eval_label_f1_micro": {
	"f1": 0.4706111327364733
	},
	"eval_loss": 0.6582987308502197,
	"eval_runtime": 65.0583,
	"eval_samples_per_second": 78.975,
	"eval_steps_per_second": 3.305,
	"step": 3000
	},
	{
	"epoch": 0.51,
	"eval_label_accuracy": {
	"accuracy": 0.5044764499805372
	},
	"eval_label_f1_macro": {
	"f1": 0.37031807042249487
	},
	"eval_label_f1_micro": {
	"f1": 0.5044764499805372
	},
	"eval_loss": 0.6426356434822083,
	"eval_runtime": 65.2533,
	"eval_samples_per_second": 78.739,
	"eval_steps_per_second": 3.295,
	"step": 3100
	},
	{
	"epoch": 0.52,
	"eval_label_accuracy": {
	"accuracy": 0.5058388478007007
	},
	"eval_label_f1_macro": {
	"f1": 0.38279117822149433
	},
	"eval_label_f1_micro": {
	"f1": 0.5058388478007007
	},
	"eval_loss": 0.6383734941482544,
	"eval_runtime": 66.5881,
	"eval_samples_per_second": 77.161,
	"eval_steps_per_second": 3.229,
	"step": 3200
	},
	{
	"epoch": 0.54,
	"eval_label_accuracy": {
	"accuracy": 0.49727520435967304
	},
	"eval_label_f1_macro": {
	"f1": 0.352874833319086
	},
	"eval_label_f1_micro": {
	"f1": 0.49727520435967304
	},
	"eval_loss": 0.6387777328491211,
	"eval_runtime": 65.3478,
	"eval_samples_per_second": 78.625,
	"eval_steps_per_second": 3.29,
	"step": 3300
	},
	{
	"epoch": 0.56,
	"eval_label_accuracy": {
	"accuracy": 0.494550408719346
	},
	"eval_label_f1_macro": {
	"f1": 0.3715541356743288
	},
	"eval_label_f1_micro": {
	"f1": 0.494550408719346
	},
	"eval_loss": 0.6494720578193665,
	"eval_runtime": 65.2886,
	"eval_samples_per_second": 78.697,
	"eval_steps_per_second": 3.293,
	"step": 3400
	},
	{
	"epoch": 0.57,
	"learning_rate": 4.282904441894772e-05,
	"loss": 0.6377,
	"step": 3500
	},
	{
	"epoch": 0.57,
	"eval_label_accuracy": {
	"accuracy": 0.506033476060724
	},
	"eval_label_f1_macro": {
	"f1": 0.38420420926210797
	},
	"eval_label_f1_micro": {
	"f1": 0.506033476060724
	},
	"eval_loss": 0.6222317218780518,
	"eval_runtime": 64.502,
	"eval_samples_per_second": 79.656,
	"eval_steps_per_second": 3.333,
	"step": 3500
	},
	{
	"epoch": 0.59,
	"eval_label_accuracy": {
	"accuracy": 0.5064227325807708
	},
	"eval_label_f1_macro": {
	"f1": 0.3885026107563052
	},
	"eval_label_f1_micro": {
	"f1": 0.5064227325807708
	},
	"eval_loss": 0.6216300129890442,
	"eval_runtime": 65.7001,
	"eval_samples_per_second": 78.204,
	"eval_steps_per_second": 3.272,
	"step": 3600
	},
	{
	"epoch": 0.61,
	"eval_label_accuracy": {
	"accuracy": 0.5105099260412612
	},
	"eval_label_f1_macro": {
	"f1": 0.35318161489739225
	},
	"eval_label_f1_micro": {
	"f1": 0.5105099260412612
	},
	"eval_loss": 0.6235440373420715,
	"eval_runtime": 65.6641,
	"eval_samples_per_second": 78.247,
	"eval_steps_per_second": 3.274,
	"step": 3700
	},
	{
	"epoch": 0.62,
	"eval_label_accuracy": {
	"accuracy": 0.5062281043207474
	},
	"eval_label_f1_macro": {
	"f1": 0.37238647965373683
	},
	"eval_label_f1_micro": {
	"f1": 0.5062281043207474
	},
	"eval_loss": 0.6188907623291016,
	"eval_runtime": 65.7244,
	"eval_samples_per_second": 78.175,
	"eval_steps_per_second": 3.271,
	"step": 3800
	},
	{
	"epoch": 0.64,
	"eval_label_accuracy": {
	"accuracy": 0.49980537173997663
	},
	"eval_label_f1_macro": {
	"f1": 0.38651240866909087
	},
	"eval_label_f1_micro": {
	"f1": 0.49980537173997663
	},
	"eval_loss": 0.6195840239524841,
	"eval_runtime": 65.3321,
	"eval_samples_per_second": 78.644,
	"eval_steps_per_second": 3.291,
	"step": 3900
	},
	{
	"epoch": 0.66,
	"learning_rate": 4.18046221930831e-05,
	"loss": 0.6149,
	"step": 4000
	},
	{
	"epoch": 0.66,
	"eval_label_accuracy": {
	"accuracy": 0.5075905021409108
	},
	"eval_label_f1_macro": {
	"f1": 0.37502556996910846
	},
	"eval_label_f1_micro": {
	"f1": 0.5075905021409108
	},
	"eval_loss": 0.6072418093681335,
	"eval_runtime": 67.6156,
	"eval_samples_per_second": 75.988,
	"eval_steps_per_second": 3.18,
	"step": 4000
	},
	{
	"epoch": 0.67,
	"eval_label_accuracy": {
	"accuracy": 0.5145971195017517
	},
	"eval_label_f1_macro": {
	"f1": 0.38615080427173776
	},
	"eval_label_f1_micro": {
	"f1": 0.5145971195017517
	},
	"eval_loss": 0.6034330725669861,
	"eval_runtime": 65.7798,
	"eval_samples_per_second": 78.109,
	"eval_steps_per_second": 3.268,
	"step": 4100
	},
	{
	"epoch": 0.69,
	"eval_label_accuracy": {
	"accuracy": 0.5165434021019852
	},
	"eval_label_f1_macro": {
	"f1": 0.3732389735757712
	},
	"eval_label_f1_micro": {
	"f1": 0.5165434021019852
	},
	"eval_loss": 0.6042677760124207,
	"eval_runtime": 65.3392,
	"eval_samples_per_second": 78.636,
	"eval_steps_per_second": 3.291,
	"step": 4200
	},
	{
	"epoch": 0.7,
	"eval_label_accuracy": {
	"accuracy": 0.5029194239003504
	},
	"eval_label_f1_macro": {
	"f1": 0.38007459621604844
	},
	"eval_label_f1_micro": {
	"f1": 0.5029194239003504
	},
	"eval_loss": 0.6064484119415283,
	"eval_runtime": 64.1308,
	"eval_samples_per_second": 80.117,
	"eval_steps_per_second": 3.353,
	"step": 4300
	},
	{
	"epoch": 0.72,
	"eval_label_accuracy": {
	"accuracy": 0.5095367847411444
	},
	"eval_label_f1_macro": {
	"f1": 0.3946719741195423
	},
	"eval_label_f1_micro": {
	"f1": 0.5095367847411444
	},
	"eval_loss": 0.5933734774589539,
	"eval_runtime": 65.6434,
	"eval_samples_per_second": 78.271,
	"eval_steps_per_second": 3.275,
	"step": 4400
	},
	{
	"epoch": 0.74,
	"learning_rate": 4.078019996721849e-05,
	"loss": 0.5971,
	"step": 4500
	},
	{
	"epoch": 0.74,
	"eval_label_accuracy": {
	"accuracy": 0.5167380303620086
	},
	"eval_label_f1_macro": {
	"f1": 0.37773378306197386
	},
	"eval_label_f1_micro": {
	"f1": 0.5167380303620086
	},
	"eval_loss": 0.5919108390808105,
	"eval_runtime": 63.9287,
	"eval_samples_per_second": 80.371,
	"eval_steps_per_second": 3.363,
	"step": 4500
	},
	{
	"epoch": 0.75,
	"eval_label_accuracy": {
	"accuracy": 0.5179057999221487
	},
	"eval_label_f1_macro": {
	"f1": 0.38732144074331154
	},
	"eval_label_f1_micro": {
	"f1": 0.5179057999221487
	},
	"eval_loss": 0.6021246910095215,
	"eval_runtime": 67.8323,
	"eval_samples_per_second": 75.746,
	"eval_steps_per_second": 3.17,
	"step": 4600
	},
	{
	"epoch": 0.77,
	"eval_label_accuracy": {
	"accuracy": 0.522966134682756
	},
	"eval_label_f1_macro": {
	"f1": 0.38578529254016203
	},
	"eval_label_f1_micro": {
	"f1": 0.522966134682756
	},
	"eval_loss": 0.5902037620544434,
	"eval_runtime": 65.8164,
	"eval_samples_per_second": 78.066,
	"eval_steps_per_second": 3.267,
	"step": 4700
	},
	{
	"epoch": 0.79,
	"eval_label_accuracy": {
	"accuracy": 0.5052549630206306
	},
	"eval_label_f1_macro": {
	"f1": 0.3881510615594995
	},
	"eval_label_f1_micro": {
	"f1": 0.5052549630206306
	},
	"eval_loss": 0.6161624789237976,
	"eval_runtime": 66.7087,
	"eval_samples_per_second": 77.021,
	"eval_steps_per_second": 3.223,
	"step": 4800
	},
	{
	"epoch": 0.8,
	"eval_label_accuracy": {
	"accuracy": 0.5223822499026859
	},
	"eval_label_f1_macro": {
	"f1": 0.3790400980761349
	},
	"eval_label_f1_micro": {
	"f1": 0.5223822499026859
	},
	"eval_loss": 0.5835235714912415,
	"eval_runtime": 67.5779,
	"eval_samples_per_second": 76.031,
	"eval_steps_per_second": 3.182,
	"step": 4900
	},
	{
	"epoch": 0.82,
	"learning_rate": 3.975577774135388e-05,
	"loss": 0.5745,
	"step": 5000
	},
	{
	"epoch": 0.82,
	"eval_label_accuracy": {
	"accuracy": 0.5241339042428961
	},
	"eval_label_f1_macro": {
	"f1": 0.38287080754019076
	},
	"eval_label_f1_micro": {
	"f1": 0.5241339042428961
	},
	"eval_loss": 0.5865485668182373,
	"eval_runtime": 67.9881,
	"eval_samples_per_second": 75.572,
	"eval_steps_per_second": 3.162,
	"step": 5000
	},
	{
	"epoch": 0.84,
	"eval_label_accuracy": {
	"accuracy": 0.514791747761775
	},
	"eval_label_f1_macro": {
	"f1": 0.3932066438681785
	},
	"eval_label_f1_micro": {
	"f1": 0.514791747761775
	},
	"eval_loss": 0.582242488861084,
	"eval_runtime": 65.5261,
	"eval_samples_per_second": 78.412,
	"eval_steps_per_second": 3.281,
	"step": 5100
	},
	{
	"epoch": 0.85,
	"eval_label_accuracy": {
	"accuracy": 0.5266640716231997
	},
	"eval_label_f1_macro": {
	"f1": 0.3948337517276894
	},
	"eval_label_f1_micro": {
	"f1": 0.5266640716231997
	},
	"eval_loss": 0.5757012963294983,
	"eval_runtime": 66.1312,
	"eval_samples_per_second": 77.694,
	"eval_steps_per_second": 3.251,
	"step": 5200
	},
	{
	"epoch": 0.87,
	"eval_label_accuracy": {
	"accuracy": 0.5192681977423121
	},
	"eval_label_f1_macro": {
	"f1": 0.38846154581250647
	},
	"eval_label_f1_micro": {
	"f1": 0.5192681977423121
	},
	"eval_loss": 0.580342173576355,
	"eval_runtime": 66.5531,
	"eval_samples_per_second": 77.202,
	"eval_steps_per_second": 3.231,
	"step": 5300
	},
	{
	"epoch": 0.89,
	"eval_label_accuracy": {
	"accuracy": 0.5278318411833398
	},
	"eval_label_f1_macro": {
	"f1": 0.3917793049565631
	},
	"eval_label_f1_micro": {
	"f1": 0.5278318411833398
	},
	"eval_loss": 0.5737766623497009,
	"eval_runtime": 68.6161,
	"eval_samples_per_second": 74.88,
	"eval_steps_per_second": 3.133,
	"step": 5400
	},
	{
	"epoch": 0.9,
	"learning_rate": 3.8731355515489266e-05,
	"loss": 0.5605,
	"step": 5500
	},
	{
	"epoch": 0.9,
	"eval_label_accuracy": {
	"accuracy": 0.5299727520435967
	},
	"eval_label_f1_macro": {
	"f1": 0.4000572874943932
	},
	"eval_label_f1_micro": {
	"f1": 0.5299727520435967
	},
	"eval_loss": 0.5729739665985107,
	"eval_runtime": 65.0276,
	"eval_samples_per_second": 79.013,
	"eval_steps_per_second": 3.306,
	"step": 5500
	},
	{
	"epoch": 0.92,
	"eval_label_accuracy": {
	"accuracy": 0.5266640716231997
	},
	"eval_label_f1_macro": {
	"f1": 0.3871595405264875
	},
	"eval_label_f1_micro": {
	"f1": 0.5266640716231997
	},
	"eval_loss": 0.5737924575805664,
	"eval_runtime": 67.4714,
	"eval_samples_per_second": 76.151,
	"eval_steps_per_second": 3.187,
	"step": 5600
	},
	{
	"epoch": 0.93,
	"eval_label_accuracy": {
	"accuracy": 0.5278318411833398
	},
	"eval_label_f1_macro": {
	"f1": 0.3912636643655603
	},
	"eval_label_f1_micro": {
	"f1": 0.5278318411833398
	},
	"eval_loss": 0.5748183131217957,
	"eval_runtime": 66.8019,
	"eval_samples_per_second": 76.914,
	"eval_steps_per_second": 3.218,
	"step": 5700
	},
	{
	"epoch": 0.95,
	"eval_label_accuracy": {
	"accuracy": 0.5212144803425457
	},
	"eval_label_f1_macro": {
	"f1": 0.3655456567099176
	},
	"eval_label_f1_micro": {
	"f1": 0.5212144803425457
	},
	"eval_loss": 0.5782448649406433,
	"eval_runtime": 65.8052,
	"eval_samples_per_second": 78.079,
	"eval_steps_per_second": 3.267,
	"step": 5800
	},
	{
	"epoch": 0.97,
	"eval_label_accuracy": {
	"accuracy": 0.5124562086414948
	},
	"eval_label_f1_macro": {
	"f1": 0.3896713760808098
	},
	"eval_label_f1_micro": {
	"f1": 0.5124562086414948
	},
	"eval_loss": 0.5811282396316528,
	"eval_runtime": 65.8997,
	"eval_samples_per_second": 77.967,
	"eval_steps_per_second": 3.263,
	"step": 5900
	},
	{
	"epoch": 0.98,
	"learning_rate": 3.7706933289624654e-05,
	"loss": 0.553,
	"step": 6000
	},
	{
	"epoch": 0.98,
	"eval_label_accuracy": {
	"accuracy": 0.5241339042428961
	},
	"eval_label_f1_macro": {
	"f1": 0.3927065112402536
	},
	"eval_label_f1_micro": {
	"f1": 0.5241339042428961
	},
	"eval_loss": 0.5662025809288025,
	"eval_runtime": 65.5268,
	"eval_samples_per_second": 78.411,
	"eval_steps_per_second": 3.281,
	"step": 6000
	},
	{
	"epoch": 1.0,
	"eval_label_accuracy": {
	"accuracy": 0.5161541455819385
	},
	"eval_label_f1_macro": {
	"f1": 0.3924416598143773
	},
	"eval_label_f1_micro": {
	"f1": 0.5161541455819385
	},
	"eval_loss": 0.5739487409591675,
	"eval_runtime": 65.309,
	"eval_samples_per_second": 78.672,
	"eval_steps_per_second": 3.292,
	"step": 6100
	},
	{
	"epoch": 1.02,
	"eval_label_accuracy": {
	"accuracy": 0.5190735694822888
	},
	"eval_label_f1_macro": {
	"f1": 0.39288818567242456
	},
	"eval_label_f1_micro": {
	"f1": 0.5190735694822888
	},
	"eval_loss": 0.5729976892471313,
	"eval_runtime": 65.1321,
	"eval_samples_per_second": 78.886,
	"eval_steps_per_second": 3.301,
	"step": 6200
	},
	{
	"epoch": 1.03,
	"eval_label_accuracy": {
	"accuracy": 0.5128454651615415
	},
	"eval_label_f1_macro": {
	"f1": 0.3945008643429393
	},
	"eval_label_f1_micro": {
	"f1": 0.5128454651615415
	},
	"eval_loss": 0.5891692042350769,
	"eval_runtime": 66.1687,
	"eval_samples_per_second": 77.65,
	"eval_steps_per_second": 3.249,
	"step": 6300
	},
	{
	"epoch": 1.05,
	"eval_label_accuracy": {
	"accuracy": 0.5179057999221487
	},
	"eval_label_f1_macro": {
	"f1": 0.40357563770843996
	},
	"eval_label_f1_micro": {
	"f1": 0.5179057999221487
	},
	"eval_loss": 0.5842686891555786,
	"eval_runtime": 64.3545,
	"eval_samples_per_second": 79.839,
	"eval_steps_per_second": 3.341,
	"step": 6400
	},
	{
	"epoch": 1.07,
	"learning_rate": 3.6682511063760036e-05,
	"loss": 0.5254,
	"step": 6500
	},
	{
	"epoch": 1.07,
	"eval_label_accuracy": {
	"accuracy": 0.5219929933826392
	},
	"eval_label_f1_macro": {
	"f1": 0.39726071722075873
	},
	"eval_label_f1_micro": {
	"f1": 0.5219929933826392
	},
	"eval_loss": 0.5762518048286438,
	"eval_runtime": 66.0739,
	"eval_samples_per_second": 77.761,
	"eval_steps_per_second": 3.254,
	"step": 6500
	},
	{
	"epoch": 1.08,
	"eval_label_accuracy": {
	"accuracy": 0.5184896847022188
	},
	"eval_label_f1_macro": {
	"f1": 0.3883086023616811
	},
	"eval_label_f1_micro": {
	"f1": 0.5184896847022188
	},
	"eval_loss": 0.5790498852729797,
	"eval_runtime": 65.3688,
	"eval_samples_per_second": 78.6,
	"eval_steps_per_second": 3.289,
	"step": 6600
	},
	{
	"epoch": 1.1,
	"eval_label_accuracy": {
	"accuracy": 0.5260801868431296
	},
	"eval_label_f1_macro": {
	"f1": 0.39154498796599124
	},
	"eval_label_f1_micro": {
	"f1": 0.5260801868431296
	},
	"eval_loss": 0.5696905851364136,
	"eval_runtime": 65.5045,
	"eval_samples_per_second": 78.437,
	"eval_steps_per_second": 3.282,
	"step": 6700
	},
	{
	"epoch": 1.11,
	"eval_label_accuracy": {
	"accuracy": 0.5171272868820552
	},
	"eval_label_f1_macro": {
	"f1": 0.39755561359688063
	},
	"eval_label_f1_micro": {
	"f1": 0.5171272868820552
	},
	"eval_loss": 0.5722245573997498,
	"eval_runtime": 65.5097,
	"eval_samples_per_second": 78.431,
	"eval_steps_per_second": 3.282,
	"step": 6800
	},
	{
	"epoch": 1.13,
	"eval_label_accuracy": {
	"accuracy": 0.5231607629427792
	},
	"eval_label_f1_macro": {
	"f1": 0.3999224263889678
	},
	"eval_label_f1_micro": {
	"f1": 0.5231607629427792
	},
	"eval_loss": 0.5762615203857422,
	"eval_runtime": 67.2536,
	"eval_samples_per_second": 76.397,
	"eval_steps_per_second": 3.197,
	"step": 6900
	},
	{
	"epoch": 1.15,
	"learning_rate": 3.565808883789543e-05,
	"loss": 0.5282,
	"step": 7000
	},
	{
	"epoch": 1.15,
	"eval_label_accuracy": {
	"accuracy": 0.5239392759828727
	},
	"eval_label_f1_macro": {
	"f1": 0.40076468903176177
	},
	"eval_label_f1_micro": {
	"f1": 0.5239392759828727
	},
	"eval_loss": 0.5675185918807983,
	"eval_runtime": 65.953,
	"eval_samples_per_second": 77.904,
	"eval_steps_per_second": 3.26,
	"step": 7000
	},
	{
	"epoch": 1.16,
	"eval_label_accuracy": {
	"accuracy": 0.5291942390035033
	},
	"eval_label_f1_macro": {
	"f1": 0.3977209221647911
	},
	"eval_label_f1_micro": {
	"f1": 0.5291942390035033
	},
	"eval_loss": 0.578584611415863,
	"eval_runtime": 66.5476,
	"eval_samples_per_second": 77.208,
	"eval_steps_per_second": 3.231,
	"step": 7100
	},
	{
	"epoch": 1.18,
	"eval_label_accuracy": {
	"accuracy": 0.5286103542234333
	},
	"eval_label_f1_macro": {
	"f1": 0.3972971376121283
	},
	"eval_label_f1_micro": {
	"f1": 0.5286103542234333
	},
	"eval_loss": 0.5829901099205017,
	"eval_runtime": 64.4078,
	"eval_samples_per_second": 79.773,
	"eval_steps_per_second": 3.338,
	"step": 7200
	},
	{
	"epoch": 1.2,
	"eval_label_accuracy": {
	"accuracy": 0.5332814324639937
	},
	"eval_label_f1_macro": {
	"f1": 0.4020714398207229
	},
	"eval_label_f1_micro": {
	"f1": 0.5332814324639937
	},
	"eval_loss": 0.5793033242225647,
	"eval_runtime": 66.9158,
	"eval_samples_per_second": 76.783,
	"eval_steps_per_second": 3.213,
	"step": 7300
	},
	{
	"epoch": 1.21,
	"eval_label_accuracy": {
	"accuracy": 0.5251070455430128
	},
	"eval_label_f1_macro": {
	"f1": 0.40305870728099247
	},
	"eval_label_f1_micro": {
	"f1": 0.5251070455430128
	},
	"eval_loss": 0.5735189318656921,
	"eval_runtime": 64.7839,
	"eval_samples_per_second": 79.31,
	"eval_steps_per_second": 3.319,
	"step": 7400
	},
	{
	"epoch": 1.23,
	"learning_rate": 3.463366661203082e-05,
	"loss": 0.5098,
	"step": 7500
	},
	{
	"epoch": 1.23,
	"eval_label_accuracy": {
	"accuracy": 0.5309458933437136
	},
	"eval_label_f1_macro": {
	"f1": 0.40404686699618486
	},
	"eval_label_f1_micro": {
	"f1": 0.5309458933437136
	},
	"eval_loss": 0.5664647221565247,
	"eval_runtime": 65.2418,
	"eval_samples_per_second": 78.753,
	"eval_steps_per_second": 3.295,
	"step": 7500
	},
	{
	"epoch": 1.25,
	"eval_label_accuracy": {
	"accuracy": 0.5227715064227326
	},
	"eval_label_f1_macro": {
	"f1": 0.3988976622706162
	},
	"eval_label_f1_micro": {
	"f1": 0.5227715064227326
	},
	"eval_loss": 0.5650814175605774,
	"eval_runtime": 65.9036,
	"eval_samples_per_second": 77.962,
	"eval_steps_per_second": 3.262,
	"step": 7600
	},
	{
	"epoch": 1.26,
	"eval_label_accuracy": {
	"accuracy": 0.5266640716231997
	},
	"eval_label_f1_macro": {
	"f1": 0.4099005096569608
	},
	"eval_label_f1_micro": {
	"f1": 0.5266640716231997
	},
	"eval_loss": 0.5657761096954346,
	"eval_runtime": 64.8206,
	"eval_samples_per_second": 79.265,
	"eval_steps_per_second": 3.317,
	"step": 7700
	},
	{
	"epoch": 1.28,
	"eval_label_accuracy": {
	"accuracy": 0.5278318411833398
	},
	"eval_label_f1_macro": {
	"f1": 0.40307633583050173
	},
	"eval_label_f1_micro": {
	"f1": 0.5278318411833398
	},
	"eval_loss": 0.5601173043251038,
	"eval_runtime": 66.1454,
	"eval_samples_per_second": 77.677,
	"eval_steps_per_second": 3.25,
	"step": 7800
	},
	{
	"epoch": 1.29,
	"eval_label_accuracy": {
	"accuracy": 0.5313351498637602
	},
	"eval_label_f1_macro": {
	"f1": 0.40205694039231865
	},
	"eval_label_f1_micro": {
	"f1": 0.5313351498637602
	},
	"eval_loss": 0.5627759099006653,
	"eval_runtime": 64.9362,
	"eval_samples_per_second": 79.124,
	"eval_steps_per_second": 3.311,
	"step": 7900
	},
	{
	"epoch": 1.31,
	"learning_rate": 3.360924438616621e-05,
	"loss": 0.5085,
	"step": 8000
	},
	{
	"epoch": 1.31,
	"eval_label_accuracy": {
	"accuracy": 0.5293888672635266
	},
	"eval_label_f1_macro": {
	"f1": 0.4100384148965112
	},
	"eval_label_f1_micro": {
	"f1": 0.5293888672635266
	},
	"eval_loss": 0.5625594854354858,
	"eval_runtime": 65.2812,
	"eval_samples_per_second": 78.706,
	"eval_steps_per_second": 3.293,
	"step": 8000
	},
	{
	"epoch": 1.33,
	"eval_label_accuracy": {
	"accuracy": 0.5307512650836902
	},
	"eval_label_f1_macro": {
	"f1": 0.4056927310816246
	},
	"eval_label_f1_micro": {
	"f1": 0.5307512650836902
	},
	"eval_loss": 0.562485933303833,
	"eval_runtime": 65.2185,
	"eval_samples_per_second": 78.781,
	"eval_steps_per_second": 3.297,
	"step": 8100
	},
	{
	"epoch": 1.34,
	"eval_label_accuracy": {
	"accuracy": 0.5354223433242506
	},
	"eval_label_f1_macro": {
	"f1": 0.4044048936522055
	},
	"eval_label_f1_micro": {
	"f1": 0.5354223433242506
	},
	"eval_loss": 0.5521498918533325,
	"eval_runtime": 65.3339,
	"eval_samples_per_second": 78.642,
	"eval_steps_per_second": 3.291,
	"step": 8200
	},
	{
	"epoch": 1.36,
	"eval_label_accuracy": {
	"accuracy": 0.5330868042039704
	},
	"eval_label_f1_macro": {
	"f1": 0.40764293642642907
	},
	"eval_label_f1_micro": {
	"f1": 0.5330868042039704
	},
	"eval_loss": 0.5571908950805664,
	"eval_runtime": 64.614,
	"eval_samples_per_second": 79.518,
	"eval_steps_per_second": 3.327,
	"step": 8300
	},
	{
	"epoch": 1.38,
	"eval_label_accuracy": {
	"accuracy": 0.5344492020241339
	},
	"eval_label_f1_macro": {
	"f1": 0.4168299787554328
	},
	"eval_label_f1_micro": {
	"f1": 0.5344492020241339
	},
	"eval_loss": 0.5639694333076477,
	"eval_runtime": 65.7823,
	"eval_samples_per_second": 78.106,
	"eval_steps_per_second": 3.268,
	"step": 8400
	},
	{
	"epoch": 1.39,
	"learning_rate": 3.2584822160301595e-05,
	"loss": 0.5066,
	"step": 8500
	},
	{
	"epoch": 1.39,
	"eval_label_accuracy": {
	"accuracy": 0.5342545737641106
	},
	"eval_label_f1_macro": {
	"f1": 0.40719472411169355
	},
	"eval_label_f1_micro": {
	"f1": 0.5342545737641106
	},
	"eval_loss": 0.5575660467147827,
	"eval_runtime": 65.0464,
	"eval_samples_per_second": 78.99,
	"eval_steps_per_second": 3.305,
	"step": 8500
	},
	{
	"epoch": 1.41,
	"eval_label_accuracy": {
	"accuracy": 0.5256909303230829
	},
	"eval_label_f1_macro": {
	"f1": 0.4166295902681743
	},
	"eval_label_f1_micro": {
	"f1": 0.5256909303230829
	},
	"eval_loss": 0.5562366843223572,
	"eval_runtime": 66.5062,
	"eval_samples_per_second": 77.256,
	"eval_steps_per_second": 3.233,
	"step": 8600
	},
	{
	"epoch": 1.43,
	"eval_label_accuracy": {
	"accuracy": 0.5206305955624757
	},
	"eval_label_f1_macro": {
	"f1": 0.4178763398872619
	},
	"eval_label_f1_micro": {
	"f1": 0.5206305955624757
	},
	"eval_loss": 0.5629637837409973,
	"eval_runtime": 65.1119,
	"eval_samples_per_second": 78.91,
	"eval_steps_per_second": 3.302,
	"step": 8700
	},
	{
	"epoch": 1.44,
	"eval_label_accuracy": {
	"accuracy": 0.5194628260023355
	},
	"eval_label_f1_macro": {
	"f1": 0.4240614359972321
	},
	"eval_label_f1_micro": {
	"f1": 0.5194628260023355
	},
	"eval_loss": 0.5645840764045715,
	"eval_runtime": 65.7329,
	"eval_samples_per_second": 78.165,
	"eval_steps_per_second": 3.271,
	"step": 8800
	},
	{
	"epoch": 1.46,
	"eval_label_accuracy": {
	"accuracy": 0.5270533281432463
	},
	"eval_label_f1_macro": {
	"f1": 0.4232811654810201
	},
	"eval_label_f1_micro": {
	"f1": 0.5270533281432463
	},
	"eval_loss": 0.5628061294555664,
	"eval_runtime": 66.012,
	"eval_samples_per_second": 77.834,
	"eval_steps_per_second": 3.257,
	"step": 8900
	},
	{
	"epoch": 1.48,
	"learning_rate": 3.156039993443698e-05,
	"loss": 0.5043,
	"step": 9000
	},
	{
	"epoch": 1.48,
	"eval_label_accuracy": {
	"accuracy": 0.5192681977423121
	},
	"eval_label_f1_macro": {
	"f1": 0.4062380982170455
	},
	"eval_label_f1_micro": {
	"f1": 0.5192681977423121
	},
	"eval_loss": 0.5618172883987427,
	"eval_runtime": 64.6788,
	"eval_samples_per_second": 79.439,
	"eval_steps_per_second": 3.324,
	"step": 9000
	},
	{
	"epoch": 1.49,
	"eval_label_accuracy": {
	"accuracy": 0.5210198520825223
	},
	"eval_label_f1_macro": {
	"f1": 0.39500190437884825
	},
	"eval_label_f1_micro": {
	"f1": 0.5210198520825223
	},
	"eval_loss": 0.5575444102287292,
	"eval_runtime": 66.1613,
	"eval_samples_per_second": 77.659,
	"eval_steps_per_second": 3.25,
	"step": 9100
	},
	{
	"epoch": 1.51,
	"eval_label_accuracy": {
	"accuracy": 0.5253016738030362
	},
	"eval_label_f1_macro": {
	"f1": 0.43826705554260276
	},
	"eval_label_f1_micro": {
	"f1": 0.5253016738030362
	},
	"eval_loss": 0.55515456199646,
	"eval_runtime": 64.9282,
	"eval_samples_per_second": 79.134,
	"eval_steps_per_second": 3.311,
	"step": 9200
	},
	{
	"epoch": 1.52,
	"eval_label_accuracy": {
	"accuracy": 0.5313351498637602
	},
	"eval_label_f1_macro": {
	"f1": 0.4106274369569952
	},
	"eval_label_f1_micro": {
	"f1": 0.5313351498637602
	},
	"eval_loss": 0.569816529750824,
	"eval_runtime": 66.2885,
	"eval_samples_per_second": 77.51,
	"eval_steps_per_second": 3.243,
	"step": 9300
	},
	{
	"epoch": 1.54,
	"eval_label_accuracy": {
	"accuracy": 0.522966134682756
	},
	"eval_label_f1_macro": {
	"f1": 0.43811143120426327
	},
	"eval_label_f1_micro": {
	"f1": 0.522966134682756
	},
	"eval_loss": 0.5568819642066956,
	"eval_runtime": 65.3832,
	"eval_samples_per_second": 78.583,
	"eval_steps_per_second": 3.288,
	"step": 9400
	},
	{
	"epoch": 1.56,
	"learning_rate": 3.0535977708572365e-05,
	"loss": 0.5051,
	"step": 9500
	},
	{
	"epoch": 1.56,
	"eval_label_accuracy": {
	"accuracy": 0.5336706889840405
	},
	"eval_label_f1_macro": {
	"f1": 0.40680316881280776
	},
	"eval_label_f1_micro": {
	"f1": 0.5336706889840405
	},
	"eval_loss": 0.5624731779098511,
	"eval_runtime": 64.3008,
	"eval_samples_per_second": 79.906,
	"eval_steps_per_second": 3.344,
	"step": 9500
	},
	{
	"epoch": 1.57,
	"eval_label_accuracy": {
	"accuracy": 0.5151810042818217
	},
	"eval_label_f1_macro": {
	"f1": 0.4369801679839114
	},
	"eval_label_f1_micro": {
	"f1": 0.5151810042818217
	},
	"eval_loss": 0.5694777369499207,
	"eval_runtime": 65.4516,
	"eval_samples_per_second": 78.501,
	"eval_steps_per_second": 3.285,
	"step": 9600
	},
	{
	"epoch": 1.59,
	"eval_label_accuracy": {
	"accuracy": 0.5268586998832231
	},
	"eval_label_f1_macro": {
	"f1": 0.4132459851165683
	},
	"eval_label_f1_micro": {
	"f1": 0.5268586998832231
	},
	"eval_loss": 0.56379634141922,
	"eval_runtime": 64.9267,
	"eval_samples_per_second": 79.135,
	"eval_steps_per_second": 3.311,
	"step": 9700
	},
	{
	"epoch": 1.61,
	"eval_label_accuracy": {
	"accuracy": 0.526274815103153
	},
	"eval_label_f1_macro": {
	"f1": 0.40248592881859246
	},
	"eval_label_f1_micro": {
	"f1": 0.526274815103153
	},
	"eval_loss": 0.5575631856918335,
	"eval_runtime": 67.2319,
	"eval_samples_per_second": 76.422,
	"eval_steps_per_second": 3.198,
	"step": 9800
	},
	{
	"epoch": 1.62,
	"eval_label_accuracy": {
	"accuracy": 0.5258855585831063
	},
	"eval_label_f1_macro": {
	"f1": 0.4075480681122011
	},
	"eval_label_f1_micro": {
	"f1": 0.5258855585831063
	},
	"eval_loss": 0.5513472557067871,
	"eval_runtime": 66.4523,
	"eval_samples_per_second": 77.319,
	"eval_steps_per_second": 3.235,
	"step": 9900
	},
	{
	"epoch": 1.64,
	"learning_rate": 2.9511555482707753e-05,
	"loss": 0.4944,
	"step": 10000
	},
	{
	"epoch": 1.64,
	"eval_label_accuracy": {
	"accuracy": 0.5188789412222655
	},
	"eval_label_f1_macro": {
	"f1": 0.41372907313005425
	},
	"eval_label_f1_micro": {
	"f1": 0.5188789412222655
	},
	"eval_loss": 0.5596012473106384,
	"eval_runtime": 65.824,
	"eval_samples_per_second": 78.057,
	"eval_steps_per_second": 3.266,
	"step": 10000
	},
	{
	"epoch": 1.66,
	"eval_label_accuracy": {
	"accuracy": 0.5278318411833398
	},
	"eval_label_f1_macro": {
	"f1": 0.4203493324138542
	},
	"eval_label_f1_micro": {
	"f1": 0.5278318411833398
	},
	"eval_loss": 0.5546495914459229,
	"eval_runtime": 65.4744,
	"eval_samples_per_second": 78.473,
	"eval_steps_per_second": 3.284,
	"step": 10100
	},
	{
	"epoch": 1.67,
	"eval_label_accuracy": {
	"accuracy": 0.535616971584274
	},
	"eval_label_f1_macro": {
	"f1": 0.4063341022177307
	},
	"eval_label_f1_micro": {
	"f1": 0.535616971584274
	},
	"eval_loss": 0.5501392483711243,
	"eval_runtime": 66.7163,
	"eval_samples_per_second": 77.013,
	"eval_steps_per_second": 3.223,
	"step": 10200
	},
	{
	"epoch": 1.69,
	"eval_label_accuracy": {
	"accuracy": 0.5188789412222655
	},
	"eval_label_f1_macro": {
	"f1": 0.4212355713439969
	},
	"eval_label_f1_micro": {
	"f1": 0.5188789412222655
	},
	"eval_loss": 0.5635867714881897,
	"eval_runtime": 66.1134,
	"eval_samples_per_second": 77.715,
	"eval_steps_per_second": 3.252,
	"step": 10300
	},
	{
	"epoch": 1.7,
	"eval_label_accuracy": {
	"accuracy": 0.5239392759828727
	},
	"eval_label_f1_macro": {
	"f1": 0.4234908453840735
	},
	"eval_label_f1_micro": {
	"f1": 0.5239392759828727
	},
	"eval_loss": 0.557228147983551,
	"eval_runtime": 64.7253,
	"eval_samples_per_second": 79.382,
	"eval_steps_per_second": 3.322,
	"step": 10400
	},
	{
	"epoch": 1.72,
	"learning_rate": 2.848713325684314e-05,
	"loss": 0.4908,
	"step": 10500
	},
	{
	"epoch": 1.72,
	"eval_label_accuracy": {
	"accuracy": 0.5251070455430128
	},
	"eval_label_f1_macro": {
	"f1": 0.42864065587210554
	},
	"eval_label_f1_micro": {
	"f1": 0.5251070455430128
	},
	"eval_loss": 0.5468738675117493,
	"eval_runtime": 66.3227,
	"eval_samples_per_second": 77.47,
	"eval_steps_per_second": 3.242,
	"step": 10500
	},
	{
	"epoch": 1.74,
	"eval_label_accuracy": {
	"accuracy": 0.5239392759828727
	},
	"eval_label_f1_macro": {
	"f1": 0.41795817815383196
	},
	"eval_label_f1_micro": {
	"f1": 0.5239392759828727
	},
	"eval_loss": 0.5483611226081848,
	"eval_runtime": 65.701,
	"eval_samples_per_second": 78.203,
	"eval_steps_per_second": 3.272,
	"step": 10600
	},
	{
	"epoch": 1.75,
	"eval_label_accuracy": {
	"accuracy": 0.5214091086025691
	},
	"eval_label_f1_macro": {
	"f1": 0.4024775749504264
	},
	"eval_label_f1_micro": {
	"f1": 0.5214091086025691
	},
	"eval_loss": 0.5590547323226929,
	"eval_runtime": 64.5911,
	"eval_samples_per_second": 79.547,
	"eval_steps_per_second": 3.329,
	"step": 10700
	},
	{
	"epoch": 1.77,
	"eval_label_accuracy": {
	"accuracy": 0.5344492020241339
	},
	"eval_label_f1_macro": {
	"f1": 0.4370419038340574
	},
	"eval_label_f1_micro": {
	"f1": 0.5344492020241339
	},
	"eval_loss": 0.5482434630393982,
	"eval_runtime": 65.2112,
	"eval_samples_per_second": 78.79,
	"eval_steps_per_second": 3.297,
	"step": 10800
	},
	{
	"epoch": 1.79,
	"eval_label_accuracy": {
	"accuracy": 0.5260801868431296
	},
	"eval_label_f1_macro": {
	"f1": 0.4312513940073556
	},
	"eval_label_f1_micro": {
	"f1": 0.5260801868431296
	},
	"eval_loss": 0.5548846125602722,
	"eval_runtime": 66.5938,
	"eval_samples_per_second": 77.154,
	"eval_steps_per_second": 3.229,
	"step": 10900
	},
	{
	"epoch": 1.8,
	"learning_rate": 2.7462711030978526e-05,
	"loss": 0.4956,
	"step": 11000
	},
	{
	"epoch": 1.8,
	"eval_label_accuracy": {
	"accuracy": 0.523550019462826
	},
	"eval_label_f1_macro": {
	"f1": 0.41662322590714945
	},
	"eval_label_f1_micro": {
	"f1": 0.523550019462826
	},
	"eval_loss": 0.5459250211715698,
	"eval_runtime": 65.0832,
	"eval_samples_per_second": 78.945,
	"eval_steps_per_second": 3.303,
	"step": 11000
	},
	{
	"epoch": 1.82,
	"eval_label_accuracy": {
	"accuracy": 0.5216037368625924
	},
	"eval_label_f1_macro": {
	"f1": 0.4343169858642386
	},
	"eval_label_f1_micro": {
	"f1": 0.5216037368625924
	},
	"eval_loss": 0.5509054660797119,
	"eval_runtime": 66.0147,
	"eval_samples_per_second": 77.831,
	"eval_steps_per_second": 3.257,
	"step": 11100
	},
	{
	"epoch": 1.84,
	"eval_label_accuracy": {
	"accuracy": 0.520241339042429
	},
	"eval_label_f1_macro": {
	"f1": 0.4111126597526932
	},
	"eval_label_f1_micro": {
	"f1": 0.520241339042429
	},
	"eval_loss": 0.5683469176292419,
	"eval_runtime": 66.7093,
	"eval_samples_per_second": 77.021,
	"eval_steps_per_second": 3.223,
	"step": 11200
	},
	{
	"epoch": 1.85,
	"eval_label_accuracy": {
	"accuracy": 0.5219929933826392
	},
	"eval_label_f1_macro": {
	"f1": 0.4175089884590279
	},
	"eval_label_f1_micro": {
	"f1": 0.5219929933826392
	},
	"eval_loss": 0.556067168712616,
	"eval_runtime": 65.0023,
	"eval_samples_per_second": 79.043,
	"eval_steps_per_second": 3.308,
	"step": 11300
	},
	{
	"epoch": 1.87,
	"eval_label_accuracy": {
	"accuracy": 0.5325029194239004
	},
	"eval_label_f1_macro": {
	"f1": 0.4221971320619319
	},
	"eval_label_f1_micro": {
	"f1": 0.5325029194239004
	},
	"eval_loss": 0.5479483008384705,
	"eval_runtime": 66.1944,
	"eval_samples_per_second": 77.62,
	"eval_steps_per_second": 3.248,
	"step": 11400
	},
	{
	"epoch": 1.88,
	"learning_rate": 2.6438288805113915e-05,
	"loss": 0.491,
	"step": 11500
	},
	{
	"epoch": 1.88,
	"eval_label_accuracy": {
	"accuracy": 0.5173219151420786
	},
	"eval_label_f1_macro": {
	"f1": 0.41131088875014477
	},
	"eval_label_f1_micro": {
	"f1": 0.5173219151420786
	},
	"eval_loss": 0.5584209561347961,
	"eval_runtime": 65.4294,
	"eval_samples_per_second": 78.527,
	"eval_steps_per_second": 3.286,
	"step": 11500
	},
	{
	"epoch": 1.9,
	"eval_label_accuracy": {
	"accuracy": 0.5305566368236668
	},
	"eval_label_f1_macro": {
	"f1": 0.42505103683817463
	},
	"eval_label_f1_micro": {
	"f1": 0.5305566368236668
	},
	"eval_loss": 0.5507027506828308,
	"eval_runtime": 67.0783,
	"eval_samples_per_second": 76.597,
	"eval_steps_per_second": 3.205,
	"step": 11600
	},
	{
	"epoch": 1.92,
	"eval_label_accuracy": {
	"accuracy": 0.5284157259634099
	},
	"eval_label_f1_macro": {
	"f1": 0.43059965616956497
	},
	"eval_label_f1_micro": {
	"f1": 0.5284157259634099
	},
	"eval_loss": 0.5484103560447693,
	"eval_runtime": 65.412,
	"eval_samples_per_second": 78.548,
	"eval_steps_per_second": 3.287,
	"step": 11700
	},
	{
	"epoch": 1.93,
	"eval_label_accuracy": {
	"accuracy": 0.523550019462826
	},
	"eval_label_f1_macro": {
	"f1": 0.4283240140586777
	},
	"eval_label_f1_micro": {
	"f1": 0.523550019462826
	},
	"eval_loss": 0.5518194437026978,
	"eval_runtime": 65.4314,
	"eval_samples_per_second": 78.525,
	"eval_steps_per_second": 3.286,
	"step": 11800
	},
	{
	"epoch": 1.95,
	"eval_label_accuracy": {
	"accuracy": 0.5249124172829895
	},
	"eval_label_f1_macro": {
	"f1": 0.4202384595807186
	},
	"eval_label_f1_micro": {
	"f1": 0.5249124172829895
	},
	"eval_loss": 0.5580205917358398,
	"eval_runtime": 64.3287,
	"eval_samples_per_second": 79.871,
	"eval_steps_per_second": 3.342,
	"step": 11900
	},
	{
	"epoch": 1.97,
	"learning_rate": 2.5413866579249306e-05,
	"loss": 0.4882,
	"step": 12000
	},
	{
	"epoch": 1.97,
	"eval_label_accuracy": {
	"accuracy": 0.5328921759439471
	},
	"eval_label_f1_macro": {
	"f1": 0.4168927822368606
	},
	"eval_label_f1_micro": {
	"f1": 0.5328921759439471
	},
	"eval_loss": 0.5494405031204224,
	"eval_runtime": 66.1472,
	"eval_samples_per_second": 77.675,
	"eval_steps_per_second": 3.25,
	"step": 12000
	},
	{
	"epoch": 1.98,
	"eval_label_accuracy": {
	"accuracy": 0.5334760607240171
	},
	"eval_label_f1_macro": {
	"f1": 0.4259674463534441
	},
	"eval_label_f1_micro": {
	"f1": 0.5334760607240171
	},
	"eval_loss": 0.54230135679245,
	"eval_runtime": 65.4715,
	"eval_samples_per_second": 78.477,
	"eval_steps_per_second": 3.284,
	"step": 12100
	},
	{
	"epoch": 2.0,
	"eval_label_accuracy": {
	"accuracy": 0.5344492020241339
	},
	"eval_label_f1_macro": {
	"f1": 0.43189802609389794
	},
	"eval_label_f1_micro": {
	"f1": 0.5344492020241339
	},
	"eval_loss": 0.5440633893013,
	"eval_runtime": 64.7322,
	"eval_samples_per_second": 79.373,
	"eval_steps_per_second": 3.321,
	"step": 12200
	},
	{
	"epoch": 2.02,
	"eval_label_accuracy": {
	"accuracy": 0.5274425846632931
	},
	"eval_label_f1_macro": {
	"f1": 0.43452702916498576
	},
	"eval_label_f1_micro": {
	"f1": 0.5274425846632931
	},
	"eval_loss": 0.5580821633338928,
	"eval_runtime": 66.4297,
	"eval_samples_per_second": 77.345,
	"eval_steps_per_second": 3.237,
	"step": 12300
	},
	{
	"epoch": 2.03,
	"eval_label_accuracy": {
	"accuracy": 0.5219929933826392
	},
	"eval_label_f1_macro": {
	"f1": 0.42868961422727936
	},
	"eval_label_f1_micro": {
	"f1": 0.5219929933826392
	},
	"eval_loss": 0.5607529878616333,
	"eval_runtime": 64.7983,
	"eval_samples_per_second": 79.292,
	"eval_steps_per_second": 3.318,
	"step": 12400
	},
	{
	"epoch": 2.05,
	"learning_rate": 2.438944435338469e-05,
	"loss": 0.4764,
	"step": 12500
	},
	{
	"epoch": 2.05,
	"eval_label_accuracy": {
	"accuracy": 0.5309458933437136
	},
	"eval_label_f1_macro": {
	"f1": 0.4501164041177361
	},
	"eval_label_f1_micro": {
	"f1": 0.5309458933437136
	},
	"eval_loss": 0.5601127743721008,
	"eval_runtime": 66.0041,
	"eval_samples_per_second": 77.844,
	"eval_steps_per_second": 3.257,
	"step": 12500
	},
	{
	"epoch": 2.07,
	"eval_label_accuracy": {
	"accuracy": 0.515375632541845
	},
	"eval_label_f1_macro": {
	"f1": 0.44296253953069376
	},
	"eval_label_f1_micro": {
	"f1": 0.515375632541845
	},
	"eval_loss": 0.5829929113388062,
	"eval_runtime": 65.2358,
	"eval_samples_per_second": 78.76,
	"eval_steps_per_second": 3.296,
	"step": 12600
	},
	{
	"epoch": 2.08,
	"eval_label_accuracy": {
	"accuracy": 0.5241339042428961
	},
	"eval_label_f1_macro": {
	"f1": 0.4557503585498297
	},
	"eval_label_f1_micro": {
	"f1": 0.5241339042428961
	},
	"eval_loss": 0.5616418719291687,
	"eval_runtime": 64.7306,
	"eval_samples_per_second": 79.375,
	"eval_steps_per_second": 3.321,
	"step": 12700
	},
	{
	"epoch": 2.1,
	"eval_label_accuracy": {
	"accuracy": 0.5227715064227326
	},
	"eval_label_f1_macro": {
	"f1": 0.43939555085391224
	},
	"eval_label_f1_micro": {
	"f1": 0.5227715064227326
	},
	"eval_loss": 0.5720220804214478,
	"eval_runtime": 65.4508,
	"eval_samples_per_second": 78.502,
	"eval_steps_per_second": 3.285,
	"step": 12800
	},
	{
	"epoch": 2.11,
	"eval_label_accuracy": {
	"accuracy": 0.5249124172829895
	},
	"eval_label_f1_macro": {
	"f1": 0.4453192886564673
	},
	"eval_label_f1_micro": {
	"f1": 0.5249124172829895
	},
	"eval_loss": 0.5684590935707092,
	"eval_runtime": 64.1447,
	"eval_samples_per_second": 80.1,
	"eval_steps_per_second": 3.352,
	"step": 12900
	},
	{
	"epoch": 2.13,
	"learning_rate": 2.336502212752008e-05,
	"loss": 0.459,
	"step": 13000
	},
	{
	"epoch": 2.13,
	"eval_label_accuracy": {
	"accuracy": 0.5184896847022188
	},
	"eval_label_f1_macro": {
	"f1": 0.45810101040373097
	},
	"eval_label_f1_micro": {
	"f1": 0.5184896847022188
	},
	"eval_loss": 0.5632970333099365,
	"eval_runtime": 65.4112,
	"eval_samples_per_second": 78.549,
	"eval_steps_per_second": 3.287,
	"step": 13000
	},
	{
	"epoch": 2.15,
	"eval_label_accuracy": {
	"accuracy": 0.5301673803036201
	},
	"eval_label_f1_macro": {
	"f1": 0.41550375963718733
	},
	"eval_label_f1_micro": {
	"f1": 0.5301673803036201
	},
	"eval_loss": 0.5601311922073364,
	"eval_runtime": 65.7981,
	"eval_samples_per_second": 78.087,
	"eval_steps_per_second": 3.268,
	"step": 13100
	},
	{
	"epoch": 2.16,
	"eval_label_accuracy": {
	"accuracy": 0.5326975476839237
	},
	"eval_label_f1_macro": {
	"f1": 0.4152775382545546
	},
	"eval_label_f1_micro": {
	"f1": 0.5326975476839237
	},
	"eval_loss": 0.5632578730583191,
	"eval_runtime": 65.4374,
	"eval_samples_per_second": 78.518,
	"eval_steps_per_second": 3.286,
	"step": 13200
	},
	{
	"epoch": 2.18,
	"eval_label_accuracy": {
	"accuracy": 0.5225768781627093
	},
	"eval_label_f1_macro": {
	"f1": 0.4441168152604288
	},
	"eval_label_f1_micro": {
	"f1": 0.5225768781627093
	},
	"eval_loss": 0.5665469765663147,
	"eval_runtime": 64.3132,
	"eval_samples_per_second": 79.89,
	"eval_steps_per_second": 3.343,
	"step": 13300
	},
	{
	"epoch": 2.2,
	"eval_label_accuracy": {
	"accuracy": 0.5225768781627093
	},
	"eval_label_f1_macro": {
	"f1": 0.4189456259580441
	},
	"eval_label_f1_micro": {
	"f1": 0.5225768781627093
	},
	"eval_loss": 0.5736687779426575,
	"eval_runtime": 65.6996,
	"eval_samples_per_second": 78.204,
	"eval_steps_per_second": 3.272,
	"step": 13400
	},
	{
	"epoch": 2.21,
	"learning_rate": 2.2340599901655468e-05,
	"loss": 0.4557,
	"step": 13500
	},
	{
	"epoch": 2.21,
	"eval_label_accuracy": {
	"accuracy": 0.5237446477228493
	},
	"eval_label_f1_macro": {
	"f1": 0.44732903233612287
	},
	"eval_label_f1_micro": {
	"f1": 0.5237446477228493
	},
	"eval_loss": 0.5651576519012451,
	"eval_runtime": 66.1178,
	"eval_samples_per_second": 77.71,
	"eval_steps_per_second": 3.252,
	"step": 13500
	},
	{
	"epoch": 2.23,
	"eval_label_accuracy": {
	"accuracy": 0.5268586998832231
	},
	"eval_label_f1_macro": {
	"f1": 0.4296354631479917
	},
	"eval_label_f1_micro": {
	"f1": 0.5268586998832231
	},
	"eval_loss": 0.566527247428894,
	"eval_runtime": 65.4163,
	"eval_samples_per_second": 78.543,
	"eval_steps_per_second": 3.287,
	"step": 13600
	},
	{
	"epoch": 2.25,
	"eval_label_accuracy": {
	"accuracy": 0.5194628260023355
	},
	"eval_label_f1_macro": {
	"f1": 0.4523218163724315
	},
	"eval_label_f1_micro": {
	"f1": 0.5194628260023355
	},
	"eval_loss": 0.5746815204620361,
	"eval_runtime": 66.5011,
	"eval_samples_per_second": 77.262,
	"eval_steps_per_second": 3.233,
	"step": 13700
	},
	{
	"epoch": 2.26,
	"eval_label_accuracy": {
	"accuracy": 0.5241339042428961
	},
	"eval_label_f1_macro": {
	"f1": 0.42963157337372265
	},
	"eval_label_f1_micro": {
	"f1": 0.5241339042428961
	},
	"eval_loss": 0.5709651112556458,
	"eval_runtime": 64.9469,
	"eval_samples_per_second": 79.111,
	"eval_steps_per_second": 3.31,
	"step": 13800
	},
	{
	"epoch": 2.28,
	"eval_label_accuracy": {
	"accuracy": 0.52899961074348
	},
	"eval_label_f1_macro": {
	"f1": 0.4465492291635319
	},
	"eval_label_f1_micro": {
	"f1": 0.52899961074348
	},
	"eval_loss": 0.5652072429656982,
	"eval_runtime": 66.3178,
	"eval_samples_per_second": 77.475,
	"eval_steps_per_second": 3.242,
	"step": 13900
	},
	{
	"epoch": 2.29,
	"learning_rate": 2.1316177675790856e-05,
	"loss": 0.4539,
	"step": 14000
	},
	{
	"epoch": 2.29,
	"eval_label_accuracy": {
	"accuracy": 0.5276372129233164
	},
	"eval_label_f1_macro": {
	"f1": 0.4330344585002601
	},
	"eval_label_f1_micro": {
	"f1": 0.5276372129233164
	},
	"eval_loss": 0.5652056932449341,
	"eval_runtime": 64.4339,
	"eval_samples_per_second": 79.741,
	"eval_steps_per_second": 3.337,
	"step": 14000
	},
	{
	"epoch": 2.31,
	"eval_label_accuracy": {
	"accuracy": 0.5274425846632931
	},
	"eval_label_f1_macro": {
	"f1": 0.43869182088814185
	},
	"eval_label_f1_micro": {
	"f1": 0.5274425846632931
	},
	"eval_loss": 0.5703505277633667,
	"eval_runtime": 66.2068,
	"eval_samples_per_second": 77.605,
	"eval_steps_per_second": 3.247,
	"step": 14100
	},
	{
	"epoch": 2.33,
	"eval_label_accuracy": {
	"accuracy": 0.5258855585831063
	},
	"eval_label_f1_macro": {
	"f1": 0.43879780170912847
	},
	"eval_label_f1_micro": {
	"f1": 0.5258855585831063
	},
	"eval_loss": 0.5729069113731384,
	"eval_runtime": 65.0139,
	"eval_samples_per_second": 79.029,
	"eval_steps_per_second": 3.307,
	"step": 14200
	},
	{
	"epoch": 2.34,
	"eval_label_accuracy": {
	"accuracy": 0.5192681977423121
	},
	"eval_label_f1_macro": {
	"f1": 0.4255072429603308
	},
	"eval_label_f1_micro": {
	"f1": 0.5192681977423121
	},
	"eval_loss": 0.5682628154754639,
	"eval_runtime": 65.9744,
	"eval_samples_per_second": 77.879,
	"eval_steps_per_second": 3.259,
	"step": 14300
	},
	{
	"epoch": 2.36,
	"eval_label_accuracy": {
	"accuracy": 0.5264694433631764
	},
	"eval_label_f1_macro": {
	"f1": 0.43346825826001506
	},
	"eval_label_f1_micro": {
	"f1": 0.5264694433631764
	},
	"eval_loss": 0.5605142712593079,
	"eval_runtime": 65.0867,
	"eval_samples_per_second": 78.941,
	"eval_steps_per_second": 3.303,
	"step": 14400
	},
	{
	"epoch": 2.38,
	"learning_rate": 2.029175544992624e-05,
	"loss": 0.459,
	"step": 14500
	},
	{
	"epoch": 2.38,
	"eval_label_accuracy": {
	"accuracy": 0.5239392759828727
	},
	"eval_label_f1_macro": {
	"f1": 0.44786889559299115
	},
	"eval_label_f1_micro": {
	"f1": 0.5239392759828727
	},
	"eval_loss": 0.5726383924484253,
	"eval_runtime": 66.1098,
	"eval_samples_per_second": 77.719,
	"eval_steps_per_second": 3.252,
	"step": 14500
	},
	{
	"epoch": 2.39,
	"eval_label_accuracy": {
	"accuracy": 0.5291942390035033
	},
	"eval_label_f1_macro": {
	"f1": 0.453869134213484
	},
	"eval_label_f1_micro": {
	"f1": 0.5291942390035033
	},
	"eval_loss": 0.566052258014679,
	"eval_runtime": 65.833,
	"eval_samples_per_second": 78.046,
	"eval_steps_per_second": 3.266,
	"step": 14600
	},
	{
	"epoch": 2.41,
	"eval_label_accuracy": {
	"accuracy": 0.5208252238224991
	},
	"eval_label_f1_macro": {
	"f1": 0.43278533897219335
	},
	"eval_label_f1_micro": {
	"f1": 0.5208252238224991
	},
	"eval_loss": 0.5726243853569031,
	"eval_runtime": 66.8914,
	"eval_samples_per_second": 76.811,
	"eval_steps_per_second": 3.214,
	"step": 14700
	},
	{
	"epoch": 2.43,
	"eval_label_accuracy": {
	"accuracy": 0.52958349552355
	},
	"eval_label_f1_macro": {
	"f1": 0.43445104819328556
	},
	"eval_label_f1_micro": {
	"f1": 0.52958349552355
	},
	"eval_loss": 0.5641396045684814,
	"eval_runtime": 67.2117,
	"eval_samples_per_second": 76.445,
	"eval_steps_per_second": 3.199,
	"step": 14800
	},
	{
	"epoch": 2.44,
	"eval_label_accuracy": {
	"accuracy": 0.5206305955624757
	},
	"eval_label_f1_macro": {
	"f1": 0.4311693806201584
	},
	"eval_label_f1_micro": {
	"f1": 0.5206305955624757
	},
	"eval_loss": 0.5807725787162781,
	"eval_runtime": 66.5101,
	"eval_samples_per_second": 77.251,
	"eval_steps_per_second": 3.233,
	"step": 14900
	},
	{
	"epoch": 2.46,
	"learning_rate": 1.926733322406163e-05,
	"loss": 0.4443,
	"step": 15000
	},
	{
	"epoch": 2.46,
	"eval_label_accuracy": {
	"accuracy": 0.5268586998832231
	},
	"eval_label_f1_macro": {
	"f1": 0.4502312972729043
	},
	"eval_label_f1_micro": {
	"f1": 0.5268586998832231
	},
	"eval_loss": 0.5696139931678772,
	"eval_runtime": 65.9075,
	"eval_samples_per_second": 77.958,
	"eval_steps_per_second": 3.262,
	"step": 15000
	},
	{
	"epoch": 2.48,
	"eval_label_accuracy": {
	"accuracy": 0.5282210977033865
	},
	"eval_label_f1_macro": {
	"f1": 0.45560500346839616
	},
	"eval_label_f1_micro": {
	"f1": 0.5282210977033865
	},
	"eval_loss": 0.5631005167961121,
	"eval_runtime": 65.994,
	"eval_samples_per_second": 77.856,
	"eval_steps_per_second": 3.258,
	"step": 15100
	},
	{
	"epoch": 2.49,
	"eval_label_accuracy": {
	"accuracy": 0.5200467107824056
	},
	"eval_label_f1_macro": {
	"f1": 0.4500935823936061
	},
	"eval_label_f1_micro": {
	"f1": 0.5200467107824056
	},
	"eval_loss": 0.5676321983337402,
	"eval_runtime": 67.7013,
	"eval_samples_per_second": 75.892,
	"eval_steps_per_second": 3.176,
	"step": 15200
	},
	{
	"epoch": 2.51,
	"eval_label_accuracy": {
	"accuracy": 0.5280264694433632
	},
	"eval_label_f1_macro": {
	"f1": 0.4410401539944819
	},
	"eval_label_f1_micro": {
	"f1": 0.5280264694433632
	},
	"eval_loss": 0.562995195388794,
	"eval_runtime": 65.3674,
	"eval_samples_per_second": 78.602,
	"eval_steps_per_second": 3.289,
	"step": 15300
	},
	{
	"epoch": 2.52,
	"eval_label_accuracy": {
	"accuracy": 0.5247177890229662
	},
	"eval_label_f1_macro": {
	"f1": 0.43980399525374536
	},
	"eval_label_f1_micro": {
	"f1": 0.5247177890229662
	},
	"eval_loss": 0.5720946788787842,
	"eval_runtime": 66.3575,
	"eval_samples_per_second": 77.429,
	"eval_steps_per_second": 3.24,
	"step": 15400
	},
	{
	"epoch": 2.54,
	"learning_rate": 1.8242910998197017e-05,
	"loss": 0.4542,
	"step": 15500
	},
	{
	"epoch": 2.54,
	"eval_label_accuracy": {
	"accuracy": 0.5260801868431296
	},
	"eval_label_f1_macro": {
	"f1": 0.4401714578365292
	},
	"eval_label_f1_micro": {
	"f1": 0.5260801868431296
	},
	"eval_loss": 0.5669940114021301,
	"eval_runtime": 65.3675,
	"eval_samples_per_second": 78.602,
	"eval_steps_per_second": 3.289,
	"step": 15500
	},
	{
	"epoch": 2.56,
	"eval_label_accuracy": {
	"accuracy": 0.5278318411833398
	},
	"eval_label_f1_macro": {
	"f1": 0.43352621547332887
	},
	"eval_label_f1_micro": {
	"f1": 0.5278318411833398
	},
	"eval_loss": 0.5640930533409119,
	"eval_runtime": 65.5202,
	"eval_samples_per_second": 78.419,
	"eval_steps_per_second": 3.281,
	"step": 15600
	},
	{
	"epoch": 2.57,
	"eval_label_accuracy": {
	"accuracy": 0.5264694433631764
	},
	"eval_label_f1_macro": {
	"f1": 0.43784802366096
	},
	"eval_label_f1_micro": {
	"f1": 0.5264694433631764
	},
	"eval_loss": 0.5642226934432983,
	"eval_runtime": 64.9095,
	"eval_samples_per_second": 79.156,
	"eval_steps_per_second": 3.312,
	"step": 15700
	},
	{
	"epoch": 2.59,
	"eval_label_accuracy": {
	"accuracy": 0.5315297781237835
	},
	"eval_label_f1_macro": {
	"f1": 0.4357287377608377
	},
	"eval_label_f1_micro": {
	"f1": 0.5315297781237835
	},
	"eval_loss": 0.5649986863136292,
	"eval_runtime": 65.4545,
	"eval_samples_per_second": 78.497,
	"eval_steps_per_second": 3.285,
	"step": 15800
	},
	{
	"epoch": 2.61,
	"eval_label_accuracy": {
	"accuracy": 0.5253016738030362
	},
	"eval_label_f1_macro": {
	"f1": 0.45053423727995034
	},
	"eval_label_f1_micro": {
	"f1": 0.5253016738030362
	},
	"eval_loss": 0.5697636008262634,
	"eval_runtime": 66.7839,
	"eval_samples_per_second": 76.935,
	"eval_steps_per_second": 3.219,
	"step": 15900
	},
	{
	"epoch": 2.62,
	"learning_rate": 1.7218488772332405e-05,
	"loss": 0.451,
	"step": 16000
	},
	{
	"epoch": 2.62,
	"eval_label_accuracy": {
	"accuracy": 0.532308291163877
	},
	"eval_label_f1_macro": {
	"f1": 0.43318094070825297
	},
	"eval_label_f1_micro": {
	"f1": 0.532308291163877
	},
	"eval_loss": 0.5685227513313293,
	"eval_runtime": 65.281,
	"eval_samples_per_second": 78.706,
	"eval_steps_per_second": 3.293,
	"step": 16000
	},
	{
	"epoch": 2.64,
	"eval_label_accuracy": {
	"accuracy": 0.5346438302841573
	},
	"eval_label_f1_macro": {
	"f1": 0.44085402773126725
	},
	"eval_label_f1_micro": {
	"f1": 0.5346438302841573
	},
	"eval_loss": 0.5624856352806091,
	"eval_runtime": 65.795,
	"eval_samples_per_second": 78.091,
	"eval_steps_per_second": 3.268,
	"step": 16100
	},
	{
	"epoch": 2.66,
	"eval_label_accuracy": {
	"accuracy": 0.5165434021019852
	},
	"eval_label_f1_macro": {
	"f1": 0.4669507042700165
	},
	"eval_label_f1_micro": {
	"f1": 0.5165434021019852
	},
	"eval_loss": 0.5654544830322266,
	"eval_runtime": 64.6982,
	"eval_samples_per_second": 79.415,
	"eval_steps_per_second": 3.323,
	"step": 16200
	},
	{
	"epoch": 2.67,
	"eval_label_accuracy": {
	"accuracy": 0.5321136629038536
	},
	"eval_label_f1_macro": {
	"f1": 0.43233762699260603
	},
	"eval_label_f1_micro": {
	"f1": 0.5321136629038536
	},
	"eval_loss": 0.5595969557762146,
	"eval_runtime": 65.444,
	"eval_samples_per_second": 78.51,
	"eval_steps_per_second": 3.285,
	"step": 16300
	},
	{
	"epoch": 2.69,
	"eval_label_accuracy": {
	"accuracy": 0.5138186064616582
	},
	"eval_label_f1_macro": {
	"f1": 0.44383270041686657
	},
	"eval_label_f1_micro": {
	"f1": 0.5138186064616582
	},
	"eval_loss": 0.5683060884475708,
	"eval_runtime": 64.9405,
	"eval_samples_per_second": 79.119,
	"eval_steps_per_second": 3.311,
	"step": 16400
	},
	{
	"epoch": 2.7,
	"learning_rate": 1.6194066546467794e-05,
	"loss": 0.4526,
	"step": 16500
	},
	{
	"epoch": 2.7,
	"eval_label_accuracy": {
	"accuracy": 0.5217983651226158
	},
	"eval_label_f1_macro": {
	"f1": 0.44043820237213194
	},
	"eval_label_f1_micro": {
	"f1": 0.5217983651226158
	},
	"eval_loss": 0.5779083967208862,
	"eval_runtime": 66.9943,
	"eval_samples_per_second": 76.693,
	"eval_steps_per_second": 3.209,
	"step": 16500
	},
	{
	"epoch": 2.72,
	"eval_label_accuracy": {
	"accuracy": 0.5284157259634099
	},
	"eval_label_f1_macro": {
	"f1": 0.4418742015293833
	},
	"eval_label_f1_micro": {
	"f1": 0.5284157259634099
	},
	"eval_loss": 0.5650832056999207,
	"eval_runtime": 65.1199,
	"eval_samples_per_second": 78.901,
	"eval_steps_per_second": 3.302,
	"step": 16600
	},
	{
	"epoch": 2.74,
	"eval_label_accuracy": {
	"accuracy": 0.5313351498637602
	},
	"eval_label_f1_macro": {
	"f1": 0.4478480562913326
	},
	"eval_label_f1_micro": {
	"f1": 0.5313351498637602
	},
	"eval_loss": 0.5622133016586304,
	"eval_runtime": 65.2808,
	"eval_samples_per_second": 78.706,
	"eval_steps_per_second": 3.293,
	"step": 16700
	},
	{
	"epoch": 2.75,
	"eval_label_accuracy": {
	"accuracy": 0.5338653172440638
	},
	"eval_label_f1_macro": {
	"f1": 0.44680022458953056
	},
	"eval_label_f1_micro": {
	"f1": 0.5338653172440638
	},
	"eval_loss": 0.5588511228561401,
	"eval_runtime": 65.8894,
	"eval_samples_per_second": 77.979,
	"eval_steps_per_second": 3.263,
	"step": 16800
	},
	{
	"epoch": 2.77,
	"eval_label_accuracy": {
	"accuracy": 0.5305566368236668
	},
	"eval_label_f1_macro": {
	"f1": 0.4609241185016919
	},
	"eval_label_f1_micro": {
	"f1": 0.5305566368236668
	},
	"eval_loss": 0.5588091015815735,
	"eval_runtime": 66.5578,
	"eval_samples_per_second": 77.196,
	"eval_steps_per_second": 3.23,
	"step": 16900
	},
	{
	"epoch": 2.79,
	"learning_rate": 1.516964432060318e-05,
	"loss": 0.4489,
	"step": 17000
	},
	{
	"epoch": 2.79,
	"eval_label_accuracy": {
	"accuracy": 0.5328921759439471
	},
	"eval_label_f1_macro": {
	"f1": 0.4330697830804149
	},
	"eval_label_f1_micro": {
	"f1": 0.5328921759439471
	},
	"eval_loss": 0.5675057768821716,
	"eval_runtime": 64.7586,
	"eval_samples_per_second": 79.341,
	"eval_steps_per_second": 3.32,
	"step": 17000
	},
	{
	"epoch": 2.8,
	"eval_label_accuracy": {
	"accuracy": 0.5223822499026859
	},
	"eval_label_f1_macro": {
	"f1": 0.45172351795604215
	},
	"eval_label_f1_micro": {
	"f1": 0.5223822499026859
	},
	"eval_loss": 0.5728496313095093,
	"eval_runtime": 65.6773,
	"eval_samples_per_second": 78.231,
	"eval_steps_per_second": 3.274,
	"step": 17100
	},
	{
	"epoch": 2.82,
	"eval_label_accuracy": {
	"accuracy": 0.5336706889840405
	},
	"eval_label_f1_macro": {
	"f1": 0.4601728614564582
	},
	"eval_label_f1_micro": {
	"f1": 0.5336706889840405
	},
	"eval_loss": 0.5668734908103943,
	"eval_runtime": 65.4933,
	"eval_samples_per_second": 78.451,
	"eval_steps_per_second": 3.283,
	"step": 17200
	},
	{
	"epoch": 2.84,
	"eval_label_accuracy": {
	"accuracy": 0.5186843129622422
	},
	"eval_label_f1_macro": {
	"f1": 0.424912443220669
	},
	"eval_label_f1_micro": {
	"f1": 0.5186843129622422
	},
	"eval_loss": 0.5832124948501587,
	"eval_runtime": 66.0442,
	"eval_samples_per_second": 77.796,
	"eval_steps_per_second": 3.255,
	"step": 17300
	},
	{
	"epoch": 2.85,
	"eval_label_accuracy": {
	"accuracy": 0.5214091086025691
	},
	"eval_label_f1_macro": {
	"f1": 0.4560620803234329
	},
	"eval_label_f1_micro": {
	"f1": 0.5214091086025691
	},
	"eval_loss": 0.570393443107605,
	"eval_runtime": 66.6267,
	"eval_samples_per_second": 77.116,
	"eval_steps_per_second": 3.227,
	"step": 17400
	},
	{
	"epoch": 2.87,
	"learning_rate": 1.414522209473857e-05,
	"loss": 0.4453,
	"step": 17500
	},
	{
	"epoch": 2.87,
	"eval_label_accuracy": {
	"accuracy": 0.5251070455430128
	},
	"eval_label_f1_macro": {
	"f1": 0.4507490275513904
	},
	"eval_label_f1_micro": {
	"f1": 0.5251070455430128
	},
	"eval_loss": 0.5699160695075989,
	"eval_runtime": 65.6551,
	"eval_samples_per_second": 78.257,
	"eval_steps_per_second": 3.275,
	"step": 17500
	},
	{
	"epoch": 2.88,
	"eval_label_accuracy": {
	"accuracy": 0.5216037368625924
	},
	"eval_label_f1_macro": {
	"f1": 0.4390779841776778
	},
	"eval_label_f1_micro": {
	"f1": 0.5216037368625924
	},
	"eval_loss": 0.5724750757217407,
	"eval_runtime": 65.0855,
	"eval_samples_per_second": 78.942,
	"eval_steps_per_second": 3.303,
	"step": 17600
	},
	{
	"epoch": 2.9,
	"eval_label_accuracy": {
	"accuracy": 0.523550019462826
	},
	"eval_label_f1_macro": {
	"f1": 0.4348358288094709
	},
	"eval_label_f1_micro": {
	"f1": 0.523550019462826
	},
	"eval_loss": 0.5676676034927368,
	"eval_runtime": 65.9415,
	"eval_samples_per_second": 77.918,
	"eval_steps_per_second": 3.26,
	"step": 17700
	},
	{
	"epoch": 2.92,
	"eval_label_accuracy": {
	"accuracy": 0.52958349552355
	},
	"eval_label_f1_macro": {
	"f1": 0.4412835917222539
	},
	"eval_label_f1_micro": {
	"f1": 0.52958349552355
	},
	"eval_loss": 0.5665853023529053,
	"eval_runtime": 64.4843,
	"eval_samples_per_second": 79.678,
	"eval_steps_per_second": 3.334,
	"step": 17800
	},
	{
	"epoch": 2.93,
	"eval_label_accuracy": {
	"accuracy": 0.5305566368236668
	},
	"eval_label_f1_macro": {
	"f1": 0.4501012112552316
	},
	"eval_label_f1_micro": {
	"f1": 0.5305566368236668
	},
	"eval_loss": 0.5652035474777222,
	"eval_runtime": 65.7573,
	"eval_samples_per_second": 78.136,
	"eval_steps_per_second": 3.27,
	"step": 17900
	},
	{
	"epoch": 2.95,
	"learning_rate": 1.3120799868873956e-05,
	"loss": 0.4419,
	"step": 18000
	},
	{
	"epoch": 2.95,
	"eval_label_accuracy": {
	"accuracy": 0.5305566368236668
	},
	"eval_label_f1_macro": {
	"f1": 0.4349986006914519
	},
	"eval_label_f1_micro": {
	"f1": 0.5305566368236668
	},
	"eval_loss": 0.5659220814704895,
	"eval_runtime": 64.2429,
	"eval_samples_per_second": 79.978,
	"eval_steps_per_second": 3.347,
	"step": 18000
	},
	{
	"epoch": 2.97,
	"eval_label_accuracy": {
	"accuracy": 0.5303620085636435
	},
	"eval_label_f1_macro": {
	"f1": 0.4502960442686812
	},
	"eval_label_f1_micro": {
	"f1": 0.5303620085636435
	},
	"eval_loss": 0.5597621202468872,
	"eval_runtime": 65.7239,
	"eval_samples_per_second": 78.176,
	"eval_steps_per_second": 3.271,
	"step": 18100
	},
	{
	"epoch": 2.98,
	"eval_label_accuracy": {
	"accuracy": 0.5348384585441807
	},
	"eval_label_f1_macro": {
	"f1": 0.4535827940910189
	},
	"eval_label_f1_micro": {
	"f1": 0.5348384585441807
	},
	"eval_loss": 0.5543330311775208,
	"eval_runtime": 66.2534,
	"eval_samples_per_second": 77.551,
	"eval_steps_per_second": 3.245,
	"step": 18200
	},
	{
	"epoch": 3.0,
	"eval_label_accuracy": {
	"accuracy": 0.522966134682756
	},
	"eval_label_f1_macro": {
	"f1": 0.4555867940063284
	},
	"eval_label_f1_micro": {
	"f1": 0.522966134682756
	},
	"eval_loss": 0.5589267015457153,
	"eval_runtime": 65.6099,
	"eval_samples_per_second": 78.311,
	"eval_steps_per_second": 3.277,
	"step": 18300
	},
	{
	"epoch": 3.02,
	"eval_label_accuracy": {
	"accuracy": 0.5270533281432463
	},
	"eval_label_f1_macro": {
	"f1": 0.4552882900544635
	},
	"eval_label_f1_micro": {
	"f1": 0.5270533281432463
	},
	"eval_loss": 0.5679383873939514,
	"eval_runtime": 64.2272,
	"eval_samples_per_second": 79.997,
	"eval_steps_per_second": 3.347,
	"step": 18400
	},
	{
	"epoch": 3.03,
	"learning_rate": 1.2096377643009343e-05,
	"loss": 0.4465,
	"step": 18500
	},
	{
	"epoch": 3.03,
	"eval_label_accuracy": {
	"accuracy": 0.5284157259634099
	},
	"eval_label_f1_macro": {
	"f1": 0.44697535042783487
	},
	"eval_label_f1_micro": {
	"f1": 0.5284157259634099
	},
	"eval_loss": 0.5660849213600159,
	"eval_runtime": 65.7257,
	"eval_samples_per_second": 78.173,
	"eval_steps_per_second": 3.271,
	"step": 18500
	},
	{
	"epoch": 3.05,
	"eval_label_accuracy": {
	"accuracy": 0.526274815103153
	},
	"eval_label_f1_macro": {
	"f1": 0.45912227016242724
	},
	"eval_label_f1_micro": {
	"f1": 0.526274815103153
	},
	"eval_loss": 0.5786118507385254,
	"eval_runtime": 65.7514,
	"eval_samples_per_second": 78.143,
	"eval_steps_per_second": 3.27,
	"step": 18600
	},
	{
	"epoch": 3.07,
	"eval_label_accuracy": {
	"accuracy": 0.5233553912028026
	},
	"eval_label_f1_macro": {
	"f1": 0.4514329459423202
	},
	"eval_label_f1_micro": {
	"f1": 0.5233553912028026
	},
	"eval_loss": 0.5863333344459534,
	"eval_runtime": 65.1687,
	"eval_samples_per_second": 78.842,
	"eval_steps_per_second": 3.299,
	"step": 18700
	},
	{
	"epoch": 3.08,
	"eval_label_accuracy": {
	"accuracy": 0.5268586998832231
	},
	"eval_label_f1_macro": {
	"f1": 0.4562521468447126
	},
	"eval_label_f1_micro": {
	"f1": 0.5268586998832231
	},
	"eval_loss": 0.5805368423461914,
	"eval_runtime": 66.5366,
	"eval_samples_per_second": 77.221,
	"eval_steps_per_second": 3.231,
	"step": 18800
	},
	{
	"epoch": 3.1,
	"eval_label_accuracy": {
	"accuracy": 0.5325029194239004
	},
	"eval_label_f1_macro": {
	"f1": 0.45956515670564957
	},
	"eval_label_f1_micro": {
	"f1": 0.5325029194239004
	},
	"eval_loss": 0.5740306377410889,
	"eval_runtime": 64.6401,
	"eval_samples_per_second": 79.486,
	"eval_steps_per_second": 3.326,
	"step": 18900
	},
	{
	"epoch": 3.11,
	"learning_rate": 1.107195541714473e-05,
	"loss": 0.4239,
	"step": 19000
	},
	{
	"epoch": 3.11,
	"eval_label_accuracy": {
	"accuracy": 0.5282210977033865
	},
	"eval_label_f1_macro": {
	"f1": 0.45915033212245415
	},
	"eval_label_f1_micro": {
	"f1": 0.5282210977033865
	},
	"eval_loss": 0.5756375789642334,
	"eval_runtime": 68.6905,
	"eval_samples_per_second": 74.799,
	"eval_steps_per_second": 3.13,
	"step": 19000
	},
	{
	"epoch": 3.13,
	"eval_label_accuracy": {
	"accuracy": 0.5245231607629428
	},
	"eval_label_f1_macro": {
	"f1": 0.4461544721075864
	},
	"eval_label_f1_micro": {
	"f1": 0.5245231607629428
	},
	"eval_loss": 0.582427442073822,
	"eval_runtime": 66.4502,
	"eval_samples_per_second": 77.321,
	"eval_steps_per_second": 3.236,
	"step": 19100
	},
	{
	"epoch": 3.15,
	"eval_label_accuracy": {
	"accuracy": 0.5216037368625924
	},
	"eval_label_f1_macro": {
	"f1": 0.4586287753791167
	},
	"eval_label_f1_micro": {
	"f1": 0.5216037368625924
	},
	"eval_loss": 0.5848153233528137,
	"eval_runtime": 66.8407,
	"eval_samples_per_second": 76.869,
	"eval_steps_per_second": 3.217,
	"step": 19200
	},
	{
	"epoch": 3.16,
	"eval_label_accuracy": {
	"accuracy": 0.5243285325029194
	},
	"eval_label_f1_macro": {
	"f1": 0.44899785496859856
	},
	"eval_label_f1_micro": {
	"f1": 0.5243285325029194
	},
	"eval_loss": 0.5789693593978882,
	"eval_runtime": 64.6355,
	"eval_samples_per_second": 79.492,
	"eval_steps_per_second": 3.326,
	"step": 19300
	},
	{
	"epoch": 3.18,
	"eval_label_accuracy": {
	"accuracy": 0.5307512650836902
	},
	"eval_label_f1_macro": {
	"f1": 0.45259529720591607
	},
	"eval_label_f1_micro": {
	"f1": 0.5307512650836902
	},
	"eval_loss": 0.5765287280082703,
	"eval_runtime": 65.9843,
	"eval_samples_per_second": 77.867,
	"eval_steps_per_second": 3.258,
	"step": 19400
	},
	{
	"epoch": 3.2,
	"learning_rate": 1.004753319128012e-05,
	"loss": 0.4262,
	"step": 19500
	},
	{
	"epoch": 3.2,
	"eval_label_accuracy": {
	"accuracy": 0.5237446477228493
	},
	"eval_label_f1_macro": {
	"f1": 0.4596084810630643
	},
	"eval_label_f1_micro": {
	"f1": 0.5237446477228493
	},
	"eval_loss": 0.5859604477882385,
	"eval_runtime": 64.6675,
	"eval_samples_per_second": 79.453,
	"eval_steps_per_second": 3.325,
	"step": 19500
	},
	{
	"epoch": 3.21,
	"eval_label_accuracy": {
	"accuracy": 0.5227715064227326
	},
	"eval_label_f1_macro": {
	"f1": 0.46148605295712625
	},
	"eval_label_f1_micro": {
	"f1": 0.5227715064227326
	},
	"eval_loss": 0.5810762047767639,
	"eval_runtime": 64.6184,
	"eval_samples_per_second": 79.513,
	"eval_steps_per_second": 3.327,
	"step": 19600
	},
	{
	"epoch": 3.23,
	"eval_label_accuracy": {
	"accuracy": 0.5245231607629428
	},
	"eval_label_f1_macro": {
	"f1": 0.45539993700221526
	},
	"eval_label_f1_micro": {
	"f1": 0.5245231607629428
	},
	"eval_loss": 0.5829537510871887,
	"eval_runtime": 65.5451,
	"eval_samples_per_second": 78.389,
	"eval_steps_per_second": 3.28,
	"step": 19700
	},
	{
	"epoch": 3.25,
	"eval_label_accuracy": {
	"accuracy": 0.5256909303230829
	},
	"eval_label_f1_macro": {
	"f1": 0.4484784466484443
	},
	"eval_label_f1_micro": {
	"f1": 0.5256909303230829
	},
	"eval_loss": 0.5800737738609314,
	"eval_runtime": 65.0145,
	"eval_samples_per_second": 79.028,
	"eval_steps_per_second": 3.307,
	"step": 19800
	},
	{
	"epoch": 3.26,
	"eval_label_accuracy": {
	"accuracy": 0.5266640716231997
	},
	"eval_label_f1_macro": {
	"f1": 0.45752780514666963
	},
	"eval_label_f1_micro": {
	"f1": 0.5266640716231997
	},
	"eval_loss": 0.577346682548523,
	"eval_runtime": 66.4954,
	"eval_samples_per_second": 77.268,
	"eval_steps_per_second": 3.233,
	"step": 19900
	},
	{
	"epoch": 3.28,
	"learning_rate": 9.023110965415506e-06,
	"loss": 0.4264,
	"step": 20000
	},
	{
	"epoch": 3.28,
	"eval_label_accuracy": {
	"accuracy": 0.5303620085636435
	},
	"eval_label_f1_macro": {
	"f1": 0.45750719642409793
	},
	"eval_label_f1_micro": {
	"f1": 0.5303620085636435
	},
	"eval_loss": 0.5826326608657837,
	"eval_runtime": 66.7123,
	"eval_samples_per_second": 77.017,
	"eval_steps_per_second": 3.223,
	"step": 20000
	},
	{
	"epoch": 3.29,
	"eval_label_accuracy": {
	"accuracy": 0.5276372129233164
	},
	"eval_label_f1_macro": {
	"f1": 0.4493522486957304
	},
	"eval_label_f1_micro": {
	"f1": 0.5276372129233164
	},
	"eval_loss": 0.5857098698616028,
	"eval_runtime": 68.7242,
	"eval_samples_per_second": 74.763,
	"eval_steps_per_second": 3.128,
	"step": 20100
	},
	{
	"epoch": 3.31,
	"eval_label_accuracy": {
	"accuracy": 0.5293888672635266
	},
	"eval_label_f1_macro": {
	"f1": 0.4554299299346091
	},
	"eval_label_f1_micro": {
	"f1": 0.5293888672635266
	},
	"eval_loss": 0.582249104976654,
	"eval_runtime": 66.5201,
	"eval_samples_per_second": 77.24,
	"eval_steps_per_second": 3.232,
	"step": 20200
	},
	{
	"epoch": 3.33,
	"eval_label_accuracy": {
	"accuracy": 0.5249124172829895
	},
	"eval_label_f1_macro": {
	"f1": 0.4618692825892151
	},
	"eval_label_f1_micro": {
	"f1": 0.5249124172829895
	},
	"eval_loss": 0.5820056200027466,
	"eval_runtime": 67.0656,
	"eval_samples_per_second": 76.612,
	"eval_steps_per_second": 3.206,
	"step": 20300
	},
	{
	"epoch": 3.34,
	"eval_label_accuracy": {
	"accuracy": 0.5278318411833398
	},
	"eval_label_f1_macro": {
	"f1": 0.46204183748606525
	},
	"eval_label_f1_micro": {
	"f1": 0.5278318411833398
	},
	"eval_loss": 0.5718916654586792,
	"eval_runtime": 66.261,
	"eval_samples_per_second": 77.542,
	"eval_steps_per_second": 3.245,
	"step": 20400
	},
	{
	"epoch": 3.36,
	"learning_rate": 7.998688739550894e-06,
	"loss": 0.4208,
	"step": 20500
	},
	{
	"epoch": 3.36,
	"eval_label_accuracy": {
	"accuracy": 0.5241339042428961
	},
	"eval_label_f1_macro": {
	"f1": 0.45599482745719977
	},
	"eval_label_f1_micro": {
	"f1": 0.5241339042428961
	},
	"eval_loss": 0.5849379301071167,
	"eval_runtime": 66.4821,
	"eval_samples_per_second": 77.284,
	"eval_steps_per_second": 3.234,
	"step": 20500
	},
	{
	"epoch": 3.38,
	"eval_label_accuracy": {
	"accuracy": 0.5237446477228493
	},
	"eval_label_f1_macro": {
	"f1": 0.4555559080742948
	},
	"eval_label_f1_micro": {
	"f1": 0.5237446477228493
	},
	"eval_loss": 0.5843728184700012,
	"eval_runtime": 64.7647,
	"eval_samples_per_second": 79.333,
	"eval_steps_per_second": 3.32,
	"step": 20600
	},
	{
	"epoch": 3.39,
	"eval_label_accuracy": {
	"accuracy": 0.5243285325029194
	},
	"eval_label_f1_macro": {
	"f1": 0.45771013752228895
	},
	"eval_label_f1_micro": {
	"f1": 0.5243285325029194
	},
	"eval_loss": 0.5808063745498657,
	"eval_runtime": 65.6904,
	"eval_samples_per_second": 78.215,
	"eval_steps_per_second": 3.273,
	"step": 20700
	},
	{
	"epoch": 3.41,
	"eval_label_accuracy": {
	"accuracy": 0.5260801868431296
	},
	"eval_label_f1_macro": {
	"f1": 0.4631605032772811
	},
	"eval_label_f1_micro": {
	"f1": 0.5260801868431296
	},
	"eval_loss": 0.5888592004776001,
	"eval_runtime": 64.5737,
	"eval_samples_per_second": 79.568,
	"eval_steps_per_second": 3.33,
	"step": 20800
	},
	{
	"epoch": 3.43,
	"eval_label_accuracy": {
	"accuracy": 0.5266640716231997
	},
	"eval_label_f1_macro": {
	"f1": 0.44799630877745866
	},
	"eval_label_f1_micro": {
	"f1": 0.5266640716231997
	},
	"eval_loss": 0.588912308216095,
	"eval_runtime": 66.1245,
	"eval_samples_per_second": 77.702,
	"eval_steps_per_second": 3.251,
	"step": 20900
	},
	{
	"epoch": 3.44,
	"learning_rate": 6.974266513686281e-06,
	"loss": 0.4228,
	"step": 21000
	},
	{
	"epoch": 3.44,
	"eval_label_accuracy": {
	"accuracy": 0.5264694433631764
	},
	"eval_label_f1_macro": {
	"f1": 0.46067694317610275
	},
	"eval_label_f1_micro": {
	"f1": 0.5264694433631764
	},
	"eval_loss": 0.5871345400810242,
	"eval_runtime": 66.1371,
	"eval_samples_per_second": 77.687,
	"eval_steps_per_second": 3.251,
	"step": 21000
	},
	{
	"epoch": 3.46,
	"eval_label_accuracy": {
	"accuracy": 0.5299727520435967
	},
	"eval_label_f1_macro": {
	"f1": 0.45858742112683054
	},
	"eval_label_f1_micro": {
	"f1": 0.5299727520435967
	},
	"eval_loss": 0.5821002721786499,
	"eval_runtime": 64.6289,
	"eval_samples_per_second": 79.5,
	"eval_steps_per_second": 3.327,
	"step": 21100
	},
	{
	"epoch": 3.47,
	"eval_label_accuracy": {
	"accuracy": 0.5276372129233164
	},
	"eval_label_f1_macro": {
	"f1": 0.44706482899459093
	},
	"eval_label_f1_micro": {
	"f1": 0.5276372129233164
	},
	"eval_loss": 0.5892929434776306,
	"eval_runtime": 65.9065,
	"eval_samples_per_second": 77.959,
	"eval_steps_per_second": 3.262,
	"step": 21200
	},
	{
	"epoch": 3.49,
	"eval_label_accuracy": {
	"accuracy": 0.5278318411833398
	},
	"eval_label_f1_macro": {
	"f1": 0.4531243508380409
	},
	"eval_label_f1_micro": {
	"f1": 0.5278318411833398
	},
	"eval_loss": 0.5871041417121887,
	"eval_runtime": 64.9299,
	"eval_samples_per_second": 79.131,
	"eval_steps_per_second": 3.311,
	"step": 21300
	},
	{
	"epoch": 3.51,
	"eval_label_accuracy": {
	"accuracy": 0.5291942390035033
	},
	"eval_label_f1_macro": {
	"f1": 0.4544963505218613
	},
	"eval_label_f1_micro": {
	"f1": 0.5291942390035033
	},
	"eval_loss": 0.581632137298584,
	"eval_runtime": 66.5734,
	"eval_samples_per_second": 77.178,
	"eval_steps_per_second": 3.23,
	"step": 21400
	},
	{
	"epoch": 3.52,
	"learning_rate": 5.949844287821669e-06,
	"loss": 0.4146,
	"step": 21500
	},
	{
	"epoch": 3.52,
	"eval_label_accuracy": {
	"accuracy": 0.526274815103153
	},
	"eval_label_f1_macro": {
	"f1": 0.46000446310082077
	},
	"eval_label_f1_micro": {
	"f1": 0.526274815103153
	},
	"eval_loss": 0.5873268842697144,
	"eval_runtime": 66.2757,
	"eval_samples_per_second": 77.525,
	"eval_steps_per_second": 3.244,
	"step": 21500
	},
	{
	"epoch": 3.54,
	"eval_label_accuracy": {
	"accuracy": 0.5293888672635266
	},
	"eval_label_f1_macro": {
	"f1": 0.4466423631159167
	},
	"eval_label_f1_micro": {
	"f1": 0.5293888672635266
	},
	"eval_loss": 0.5862780809402466,
	"eval_runtime": 65.0169,
	"eval_samples_per_second": 79.026,
	"eval_steps_per_second": 3.307,
	"step": 21600
	},
	{
	"epoch": 3.56,
	"eval_label_accuracy": {
	"accuracy": 0.5274425846632931
	},
	"eval_label_f1_macro": {
	"f1": 0.4553183199766613
	},
	"eval_label_f1_micro": {
	"f1": 0.5274425846632931
	},
	"eval_loss": 0.5865354537963867,
	"eval_runtime": 66.6836,
	"eval_samples_per_second": 77.05,
	"eval_steps_per_second": 3.224,
	"step": 21700
	},
	{
	"epoch": 3.57,
	"eval_label_accuracy": {
	"accuracy": 0.526274815103153
	},
	"eval_label_f1_macro": {
	"f1": 0.4584618360909396
	},
	"eval_label_f1_micro": {
	"f1": 0.526274815103153
	},
	"eval_loss": 0.5862194299697876,
	"eval_runtime": 65.2945,
	"eval_samples_per_second": 78.69,
	"eval_steps_per_second": 3.293,
	"step": 21800
	},
	{
	"epoch": 3.59,
	"eval_label_accuracy": {
	"accuracy": 0.5253016738030362
	},
	"eval_label_f1_macro": {
	"f1": 0.4556988660685002
	},
	"eval_label_f1_micro": {
	"f1": 0.5253016738030362
	},
	"eval_loss": 0.5815604329109192,
	"eval_runtime": 66.8701,
	"eval_samples_per_second": 76.836,
	"eval_steps_per_second": 3.215,
	"step": 21900
	},
	{
	"epoch": 3.61,
	"learning_rate": 4.925422061957056e-06,
	"loss": 0.4179,
	"step": 22000
	},
	{
	"epoch": 3.61,
	"eval_label_accuracy": {
	"accuracy": 0.52899961074348
	},
	"eval_label_f1_macro": {
	"f1": 0.4502397089365151
	},
	"eval_label_f1_micro": {
	"f1": 0.52899961074348
	},
	"eval_loss": 0.5844454169273376,
	"eval_runtime": 64.4681,
	"eval_samples_per_second": 79.698,
	"eval_steps_per_second": 3.335,
	"step": 22000
	},
	{
	"epoch": 3.62,
	"eval_label_accuracy": {
	"accuracy": 0.5293888672635266
	},
	"eval_label_f1_macro": {
	"f1": 0.45103878090924954
	},
	"eval_label_f1_micro": {
	"f1": 0.5293888672635266
	},
	"eval_loss": 0.5837833881378174,
	"eval_runtime": 64.5629,
	"eval_samples_per_second": 79.581,
	"eval_steps_per_second": 3.33,
	"step": 22100
	},
	{
	"epoch": 3.64,
	"eval_label_accuracy": {
	"accuracy": 0.5264694433631764
	},
	"eval_label_f1_macro": {
	"f1": 0.4605815902638898
	},
	"eval_label_f1_micro": {
	"f1": 0.5264694433631764
	},
	"eval_loss": 0.5830559730529785,
	"eval_runtime": 65.8104,
	"eval_samples_per_second": 78.073,
	"eval_steps_per_second": 3.267,
	"step": 22200
	},
	{
	"epoch": 3.66,
	"eval_label_accuracy": {
	"accuracy": 0.52958349552355
	},
	"eval_label_f1_macro": {
	"f1": 0.45065967020468145
	},
	"eval_label_f1_micro": {
	"f1": 0.52958349552355
	},
	"eval_loss": 0.5816081166267395,
	"eval_runtime": 65.6528,
	"eval_samples_per_second": 78.26,
	"eval_steps_per_second": 3.275,
	"step": 22300
	},
	{
	"epoch": 3.67,
	"eval_label_accuracy": {
	"accuracy": 0.5293888672635266
	},
	"eval_label_f1_macro": {
	"f1": 0.45309891731169716
	},
	"eval_label_f1_micro": {
	"f1": 0.5293888672635266
	},
	"eval_loss": 0.5825657844543457,
	"eval_runtime": 65.9972,
	"eval_samples_per_second": 77.852,
	"eval_steps_per_second": 3.258,
	"step": 22400
	},
	{
	"epoch": 3.69,
	"learning_rate": 3.900999836092445e-06,
	"loss": 0.4259,
	"step": 22500
	},
	{
	"epoch": 3.69,
	"eval_label_accuracy": {
	"accuracy": 0.5303620085636435
	},
	"eval_label_f1_macro": {
	"f1": 0.4533884487481862
	},
	"eval_label_f1_micro": {
	"f1": 0.5303620085636435
	},
	"eval_loss": 0.5796229839324951,
	"eval_runtime": 64.285,
	"eval_samples_per_second": 79.925,
	"eval_steps_per_second": 3.344,
	"step": 22500
	},
	{
	"epoch": 3.7,
	"eval_label_accuracy": {
	"accuracy": 0.5305566368236668
	},
	"eval_label_f1_macro": {
	"f1": 0.4515523588029331
	},
	"eval_label_f1_micro": {
	"f1": 0.5305566368236668
	},
	"eval_loss": 0.5833083391189575,
	"eval_runtime": 65.2335,
	"eval_samples_per_second": 78.763,
	"eval_steps_per_second": 3.296,
	"step": 22600
	},
	{
	"epoch": 3.72,
	"eval_label_accuracy": {
	"accuracy": 0.5260801868431296
	},
	"eval_label_f1_macro": {
	"f1": 0.4593256681180433
	},
	"eval_label_f1_micro": {
	"f1": 0.5260801868431296
	},
	"eval_loss": 0.578184187412262,
	"eval_runtime": 66.0227,
	"eval_samples_per_second": 77.822,
	"eval_steps_per_second": 3.256,
	"step": 22700
	},
	{
	"epoch": 3.74,
	"eval_label_accuracy": {
	"accuracy": 0.5268586998832231
	},
	"eval_label_f1_macro": {
	"f1": 0.4603837774249291
	},
	"eval_label_f1_micro": {
	"f1": 0.5268586998832231
	},
	"eval_loss": 0.5812641382217407,
	"eval_runtime": 65.1177,
	"eval_samples_per_second": 78.903,
	"eval_steps_per_second": 3.302,
	"step": 22800
	},
	{
	"epoch": 3.75,
	"eval_label_accuracy": {
	"accuracy": 0.5319190346438303
	},
	"eval_label_f1_macro": {
	"f1": 0.45997737731014476
	},
	"eval_label_f1_micro": {
	"f1": 0.5319190346438303
	},
	"eval_loss": 0.5770907402038574,
	"eval_runtime": 65.3117,
	"eval_samples_per_second": 78.669,
	"eval_steps_per_second": 3.292,
	"step": 22900
	},
	{
	"epoch": 3.77,
	"learning_rate": 2.8765776102278315e-06,
	"loss": 0.4274,
	"step": 23000
	},
	{
	"epoch": 3.77,
	"eval_label_accuracy": {
	"accuracy": 0.5247177890229662
	},
	"eval_label_f1_macro": {
	"f1": 0.45907215035166693
	},
	"eval_label_f1_micro": {
	"f1": 0.5247177890229662
	},
	"eval_loss": 0.5833043456077576,
	"eval_runtime": 65.7031,
	"eval_samples_per_second": 78.2,
	"eval_steps_per_second": 3.272,
	"step": 23000
	},
	{
	"epoch": 3.79,
	"eval_label_accuracy": {
	"accuracy": 0.526274815103153
	},
	"eval_label_f1_macro": {
	"f1": 0.4541259526342647
	},
	"eval_label_f1_micro": {
	"f1": 0.526274815103153
	},
	"eval_loss": 0.5847244262695312,
	"eval_runtime": 65.8232,
	"eval_samples_per_second": 78.058,
	"eval_steps_per_second": 3.266,
	"step": 23100
	},
	{
	"epoch": 3.8,
	"eval_label_accuracy": {
	"accuracy": 0.5266640716231997
	},
	"eval_label_f1_macro": {
	"f1": 0.451974998095672
	},
	"eval_label_f1_micro": {
	"f1": 0.5266640716231997
	},
	"eval_loss": 0.5817099809646606,
	"eval_runtime": 64.7736,
	"eval_samples_per_second": 79.322,
	"eval_steps_per_second": 3.319,
	"step": 23200
	},
	{
	"epoch": 3.82,
	"eval_label_accuracy": {
	"accuracy": 0.5288049824834566
	},
	"eval_label_f1_macro": {
	"f1": 0.46024834620814586
	},
	"eval_label_f1_micro": {
	"f1": 0.5288049824834566
	},
	"eval_loss": 0.5799014568328857,
	"eval_runtime": 65.921,
	"eval_samples_per_second": 77.942,
	"eval_steps_per_second": 3.261,
	"step": 23300
	},
	{
	"epoch": 3.84,
	"eval_label_accuracy": {
	"accuracy": 0.5276372129233164
	},
	"eval_label_f1_macro": {
	"f1": 0.4581019267498323
	},
	"eval_label_f1_micro": {
	"f1": 0.5276372129233164
	},
	"eval_loss": 0.5810489058494568,
	"eval_runtime": 65.3442,
	"eval_samples_per_second": 78.63,
	"eval_steps_per_second": 3.29,
	"step": 23400
	},
	{
	"epoch": 3.85,
	"learning_rate": 1.8521553843632193e-06,
	"loss": 0.4289,
	"step": 23500
	},
	{
	"epoch": 3.85,
	"eval_label_accuracy": {
	"accuracy": 0.5272479564032697
	},
	"eval_label_f1_macro": {
	"f1": 0.4541508997429681
	},
	"eval_label_f1_micro": {
	"f1": 0.5272479564032697
	},
	"eval_loss": 0.5799488425254822,
	"eval_runtime": 65.7671,
	"eval_samples_per_second": 78.124,
	"eval_steps_per_second": 3.269,
	"step": 23500
	},
	{
	"epoch": 3.87,
	"eval_label_accuracy": {
	"accuracy": 0.5274425846632931
	},
	"eval_label_f1_macro": {
	"f1": 0.4574637003228606
	},
	"eval_label_f1_micro": {
	"f1": 0.5274425846632931
	},
	"eval_loss": 0.5793448686599731,
	"eval_runtime": 65.0934,
	"eval_samples_per_second": 78.933,
	"eval_steps_per_second": 3.303,
	"step": 23600
	},
	{
	"epoch": 3.88,
	"eval_label_accuracy": {
	"accuracy": 0.5276372129233164
	},
	"eval_label_f1_macro": {
	"f1": 0.45638935381995627
	},
	"eval_label_f1_micro": {
	"f1": 0.5276372129233164
	},
	"eval_loss": 0.5791721940040588,
	"eval_runtime": 64.3159,
	"eval_samples_per_second": 79.887,
	"eval_steps_per_second": 3.343,
	"step": 23700
	},
	{
	"epoch": 3.9,
	"eval_label_accuracy": {
	"accuracy": 0.5268586998832231
	},
	"eval_label_f1_macro": {
	"f1": 0.45473822883034853
	},
	"eval_label_f1_micro": {
	"f1": 0.5268586998832231
	},
	"eval_loss": 0.5804610848426819,
	"eval_runtime": 66.2146,
	"eval_samples_per_second": 77.596,
	"eval_steps_per_second": 3.247,
	"step": 23800
	},
	{
	"epoch": 3.92,
	"eval_label_accuracy": {
	"accuracy": 0.5270533281432463
	},
	"eval_label_f1_macro": {
	"f1": 0.45519902851058563
	},
	"eval_label_f1_micro": {
	"f1": 0.5270533281432463
	},
	"eval_loss": 0.5822835564613342,
	"eval_runtime": 65.6357,
	"eval_samples_per_second": 78.281,
	"eval_steps_per_second": 3.276,
	"step": 23900
	},
	{
	"epoch": 3.93,
	"learning_rate": 8.277331584986067e-07,
	"loss": 0.4174,
	"step": 24000
	},
	{
	"epoch": 3.93,
	"eval_label_accuracy": {
	"accuracy": 0.5278318411833398
	},
	"eval_label_f1_macro": {
	"f1": 0.4562786712755399
	},
	"eval_label_f1_micro": {
	"f1": 0.5278318411833398
	},
	"eval_loss": 0.5810161828994751,
	"eval_runtime": 65.4574,
	"eval_samples_per_second": 78.494,
	"eval_steps_per_second": 3.285,
	"step": 24000
	},
	{
	"epoch": 3.95,
	"eval_label_accuracy": {
	"accuracy": 0.5280264694433632
	},
	"eval_label_f1_macro": {
	"f1": 0.45638550607459255
	},
	"eval_label_f1_micro": {
	"f1": 0.5280264694433632
	},
	"eval_loss": 0.5815566182136536,
	"eval_runtime": 64.709,
	"eval_samples_per_second": 79.402,
	"eval_steps_per_second": 3.323,
	"step": 24100
	},
	{
	"epoch": 3.97,
	"eval_label_accuracy": {
	"accuracy": 0.5276372129233164
	},
	"eval_label_f1_macro": {
	"f1": 0.456888857673732
	},
	"eval_label_f1_micro": {
	"f1": 0.5276372129233164
	},
	"eval_loss": 0.5815967321395874,
	"eval_runtime": 65.864,
	"eval_samples_per_second": 78.009,
	"eval_steps_per_second": 3.264,
	"step": 24200
	},
	{
	"epoch": 3.98,
	"eval_label_accuracy": {
	"accuracy": 0.5274425846632931
	},
	"eval_label_f1_macro": {
	"f1": 0.456560066253126
	},
	"eval_label_f1_micro": {
	"f1": 0.5274425846632931
	},
	"eval_loss": 0.5813802480697632,
	"eval_runtime": 65.7676,
	"eval_samples_per_second": 78.124,
	"eval_steps_per_second": 3.269,
	"step": 24300
	},
	{
	"epoch": 4.0,
	"eval_label_accuracy": {
	"accuracy": 0.5276372129233164
	},
	"eval_label_f1_macro": {
	"f1": 0.4561525816310299
	},
	"eval_label_f1_micro": {
	"f1": 0.5276372129233164
	},
	"eval_loss": 0.5812935829162598,
	"eval_runtime": 66.0073,
	"eval_samples_per_second": 77.84,
	"eval_steps_per_second": 3.257,
	"step": 24400
	},
	{
	"epoch": 4.0,
	"step": 24404,
	"total_flos": 5.079375568585728e+16,
	"train_loss": 0.5641878431614374,
	"train_runtime": 33021.6046,
	"train_samples_per_second": 11.824,
	"train_steps_per_second": 0.739
	}
	],
	"logging_steps": 500,
	"max_steps": 24404,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 4,
	"save_steps": 500,
	"total_flos": 5.079375568585728e+16,
	"train_batch_size": 16,
	"trial_name": null,
	"trial_params": null
	}