{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 0.9998334721065778,
  "eval_steps": 1126,
  "global_step": 4503,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.0,
      "learning_rate": 2e-05,
      "loss": 1.2902,
      "step": 1
    },
    {
      "epoch": 0.0,
      "eval_loss": 0.9115545749664307,
      "eval_runtime": 322.1856,
      "eval_samples_per_second": 56.3,
      "eval_steps_per_second": 28.151,
      "step": 1
    },
    {
      "epoch": 0.0,
      "learning_rate": 4e-05,
      "loss": 1.4118,
      "step": 2
    },
    {
      "epoch": 0.0,
      "learning_rate": 6e-05,
      "loss": 1.256,
      "step": 3
    },
    {
      "epoch": 0.0,
      "learning_rate": 8e-05,
      "loss": 1.3199,
      "step": 4
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.0001,
      "loss": 1.4236,
      "step": 5
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00012,
      "loss": 1.3817,
      "step": 6
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00014,
      "loss": 1.3202,
      "step": 7
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00016,
      "loss": 1.2792,
      "step": 8
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00018,
      "loss": 1.2805,
      "step": 9
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.0002,
      "loss": 1.2195,
      "step": 10
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00019999999847725134,
      "loss": 1.2479,
      "step": 11
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.0001999999939090053,
      "loss": 1.305,
      "step": 12
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.0001999999862952621,
      "loss": 1.1611,
      "step": 13
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00019999997563602194,
      "loss": 1.0523,
      "step": 14
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00019999996193128514,
      "loss": 1.1309,
      "step": 15
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00019999994518105213,
      "loss": 1.2117,
      "step": 16
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.0001999999253853234,
      "loss": 1.3288,
      "step": 17
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.0001999999025440996,
      "loss": 1.2277,
      "step": 18
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00019999987665738137,
      "loss": 1.2257,
      "step": 19
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.0001999998477251695,
      "loss": 1.1263,
      "step": 20
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.0001999998157474649,
      "loss": 1.1887,
      "step": 21
    },
    {
      "epoch": 0.0,
      "learning_rate": 0.00019999978072426857,
      "loss": 1.2123,
      "step": 22
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999974265558153,
      "loss": 1.2075,
      "step": 23
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999970154140493,
      "loss": 1.0792,
      "step": 24
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999965738174007,
      "loss": 1.2648,
      "step": 25
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999961017658823,
      "loss": 1.1978,
      "step": 26
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999955992595095,
      "loss": 1.1447,
      "step": 27
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999950662982964,
      "loss": 1.2405,
      "step": 28
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.000199999450288226,
      "loss": 1.2258,
      "step": 29
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999939090114172,
      "loss": 1.1205,
      "step": 30
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999932846857864,
      "loss": 1.1179,
      "step": 31
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999926299053863,
      "loss": 1.2437,
      "step": 32
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999919446702367,
      "loss": 1.0822,
      "step": 33
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999912289803587,
      "loss": 1.1449,
      "step": 34
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.0001999990482835774,
      "loss": 1.3301,
      "step": 35
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999897062365055,
      "loss": 0.9776,
      "step": 36
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999888991825772,
      "loss": 1.0474,
      "step": 37
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999880616740123,
      "loss": 1.1361,
      "step": 38
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999871937108378,
      "loss": 1.115,
      "step": 39
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999862952930797,
      "loss": 1.089,
      "step": 40
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999853664207648,
      "loss": 1.1859,
      "step": 41
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999844070939222,
      "loss": 1.0527,
      "step": 42
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999834173125804,
      "loss": 1.015,
      "step": 43
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.000199998239707677,
      "loss": 1.2429,
      "step": 44
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999813463865217,
      "loss": 1.1172,
      "step": 45
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999802652418682,
      "loss": 1.134,
      "step": 46
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999791536428417,
      "loss": 1.1653,
      "step": 47
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999780115894766,
      "loss": 1.098,
      "step": 48
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.0001999976839081807,
      "loss": 1.0869,
      "step": 49
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999756361198693,
      "loss": 1.0181,
      "step": 50
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999744027036998,
      "loss": 1.1695,
      "step": 51
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.0001999973138833336,
      "loss": 1.1122,
      "step": 52
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999718445088167,
      "loss": 1.2223,
      "step": 53
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999705197301808,
      "loss": 1.0845,
      "step": 54
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999691644974693,
      "loss": 1.2205,
      "step": 55
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.0001999967778810723,
      "loss": 1.0687,
      "step": 56
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.0001999966362669984,
      "loss": 1.2313,
      "step": 57
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.0001999964916075296,
      "loss": 1.1096,
      "step": 58
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999634390267026,
      "loss": 1.2174,
      "step": 59
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999619315242488,
      "loss": 1.2244,
      "step": 60
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.0001999960393567981,
      "loss": 1.1469,
      "step": 61
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999588251579453,
      "loss": 1.0302,
      "step": 62
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.000199995722629419,
      "loss": 1.3699,
      "step": 63
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999555969767635,
      "loss": 1.0839,
      "step": 64
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999539372057157,
      "loss": 1.0683,
      "step": 65
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999522469810969,
      "loss": 1.1492,
      "step": 66
    },
    {
      "epoch": 0.01,
      "learning_rate": 0.00019999505263029586,
      "loss": 1.0818,
      "step": 67
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999487751713531,
      "loss": 1.1244,
      "step": 68
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999469935863342,
      "loss": 1.0086,
      "step": 69
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999451815479557,
      "loss": 1.2438,
      "step": 70
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999433390562732,
      "loss": 1.1498,
      "step": 71
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999414661113423,
      "loss": 1.1199,
      "step": 72
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999395627132204,
      "loss": 1.1543,
      "step": 73
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999376288619652,
      "loss": 1.2054,
      "step": 74
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.0001999935664557636,
      "loss": 1.0414,
      "step": 75
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999336698002922,
      "loss": 1.2056,
      "step": 76
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999316445899949,
      "loss": 1.1078,
      "step": 77
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999295889268056,
      "loss": 1.167,
      "step": 78
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999275028107869,
      "loss": 1.0823,
      "step": 79
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999253862420022,
      "loss": 1.2409,
      "step": 80
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.0001999923239220516,
      "loss": 1.0577,
      "step": 81
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999210617463938,
      "loss": 1.1682,
      "step": 82
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999188538197022,
      "loss": 1.0984,
      "step": 83
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999166154405083,
      "loss": 1.1261,
      "step": 84
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999143466088796,
      "loss": 1.1321,
      "step": 85
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.0001999912047324886,
      "loss": 0.9803,
      "step": 86
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999097175885973,
      "loss": 1.1959,
      "step": 87
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999073574000843,
      "loss": 1.1837,
      "step": 88
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.0001999904966759419,
      "loss": 1.0425,
      "step": 89
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999025456666743,
      "loss": 1.0678,
      "step": 90
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019999000941219234,
      "loss": 1.1834,
      "step": 91
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998976121252417,
      "loss": 1.178,
      "step": 92
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998950996767044,
      "loss": 1.1079,
      "step": 93
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.0001999892556776388,
      "loss": 1.1642,
      "step": 94
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998899834243702,
      "loss": 1.1114,
      "step": 95
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998873796207294,
      "loss": 1.2399,
      "step": 96
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998847453655443,
      "loss": 1.1991,
      "step": 97
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998820806588956,
      "loss": 1.2608,
      "step": 98
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998793855008644,
      "loss": 1.1684,
      "step": 99
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998766598915328,
      "loss": 1.0807,
      "step": 100
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998739038309837,
      "loss": 1.1495,
      "step": 101
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998711173193013,
      "loss": 1.1358,
      "step": 102
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998683003565702,
      "loss": 1.0595,
      "step": 103
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.0001999865452942876,
      "loss": 1.101,
      "step": 104
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998625750783058,
      "loss": 1.1221,
      "step": 105
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998596667629472,
      "loss": 1.152,
      "step": 106
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998567279968886,
      "loss": 1.0205,
      "step": 107
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998537587802198,
      "loss": 1.0357,
      "step": 108
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998507591130306,
      "loss": 1.1513,
      "step": 109
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998477289954133,
      "loss": 1.1591,
      "step": 110
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.0001999844668427459,
      "loss": 1.1536,
      "step": 111
    },
    {
      "epoch": 0.02,
      "learning_rate": 0.00019998415774092623,
      "loss": 1.0139,
      "step": 112
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998384559409161,
      "loss": 1.1909,
      "step": 113
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998353040225162,
      "loss": 1.0827,
      "step": 114
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998321216541584,
      "loss": 1.1355,
      "step": 115
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998289088359394,
      "loss": 1.0757,
      "step": 116
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998256655679572,
      "loss": 1.0737,
      "step": 117
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999822391850311,
      "loss": 1.1843,
      "step": 118
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998190876830996,
      "loss": 1.1194,
      "step": 119
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998157530664242,
      "loss": 1.053,
      "step": 120
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998123880003864,
      "loss": 1.122,
      "step": 121
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998089924850887,
      "loss": 0.9631,
      "step": 122
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998055665206344,
      "loss": 1.0605,
      "step": 123
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019998021101071275,
      "loss": 0.9988,
      "step": 124
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997986232446737,
      "loss": 1.0981,
      "step": 125
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999795105933379,
      "loss": 1.1284,
      "step": 126
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997915581733509,
      "loss": 1.1916,
      "step": 127
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997879799646967,
      "loss": 1.1193,
      "step": 128
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997843713075262,
      "loss": 1.0561,
      "step": 129
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999780732201949,
      "loss": 1.1072,
      "step": 130
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997770626480751,
      "loss": 1.039,
      "step": 131
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997733626460175,
      "loss": 1.0322,
      "step": 132
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997696321958884,
      "loss": 1.1176,
      "step": 133
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997658712978016,
      "loss": 1.0842,
      "step": 134
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999762079951871,
      "loss": 1.2144,
      "step": 135
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997582581582127,
      "loss": 1.004,
      "step": 136
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999754405916943,
      "loss": 1.1733,
      "step": 137
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997505232281787,
      "loss": 1.1078,
      "step": 138
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999746610092039,
      "loss": 1.0405,
      "step": 139
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997426665086424,
      "loss": 1.2085,
      "step": 140
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999738692478109,
      "loss": 1.2088,
      "step": 141
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997346880005598,
      "loss": 1.3012,
      "step": 142
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999730653076117,
      "loss": 1.0184,
      "step": 143
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997265877049034,
      "loss": 1.1067,
      "step": 144
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999722491887043,
      "loss": 1.0186,
      "step": 145
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997183656226603,
      "loss": 1.1453,
      "step": 146
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997142089118807,
      "loss": 1.0723,
      "step": 147
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997100217548317,
      "loss": 1.1119,
      "step": 148
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997058041516395,
      "loss": 1.0785,
      "step": 149
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019997015561024338,
      "loss": 1.0005,
      "step": 150
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019996972776073434,
      "loss": 1.0229,
      "step": 151
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019996929686664987,
      "loss": 1.065,
      "step": 152
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019996886292800305,
      "loss": 1.0459,
      "step": 153
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019996842594480717,
      "loss": 1.1116,
      "step": 154
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.0001999679859170755,
      "loss": 1.0312,
      "step": 155
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019996754284482143,
      "loss": 1.1563,
      "step": 156
    },
    {
      "epoch": 0.03,
      "learning_rate": 0.00019996709672805846,
      "loss": 1.0179,
      "step": 157
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999666475668002,
      "loss": 1.0774,
      "step": 158
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996619536106027,
      "loss": 1.0422,
      "step": 159
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996574011085251,
      "loss": 1.0424,
      "step": 160
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996528181619077,
      "loss": 1.0828,
      "step": 161
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996482047708903,
      "loss": 1.0423,
      "step": 162
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996435609356125,
      "loss": 1.0867,
      "step": 163
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996388866562164,
      "loss": 1.1106,
      "step": 164
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996341819328444,
      "loss": 1.0064,
      "step": 165
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996294467656392,
      "loss": 1.1037,
      "step": 166
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999624681154746,
      "loss": 1.0777,
      "step": 167
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996198851003093,
      "loss": 0.9905,
      "step": 168
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996150586024748,
      "loss": 1.1627,
      "step": 169
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996102016613904,
      "loss": 1.1721,
      "step": 170
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996053142772033,
      "loss": 1.1808,
      "step": 171
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019996003964500628,
      "loss": 1.1152,
      "step": 172
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995954481801182,
      "loss": 1.2394,
      "step": 173
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995904694675206,
      "loss": 1.149,
      "step": 174
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995854603124214,
      "loss": 1.0496,
      "step": 175
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999580420714973,
      "loss": 0.9757,
      "step": 176
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995753506753296,
      "loss": 1.0415,
      "step": 177
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999570250193645,
      "loss": 1.0024,
      "step": 178
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995651192700745,
      "loss": 1.002,
      "step": 179
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995599579047748,
      "loss": 0.9617,
      "step": 180
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995547660979024,
      "loss": 1.103,
      "step": 181
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995495438496162,
      "loss": 1.0558,
      "step": 182
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995442911600747,
      "loss": 1.049,
      "step": 183
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999539008029438,
      "loss": 1.0462,
      "step": 184
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995336944578674,
      "loss": 1.1051,
      "step": 185
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999528350445524,
      "loss": 0.9253,
      "step": 186
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999522975992571,
      "loss": 1.1318,
      "step": 187
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999517571099172,
      "loss": 1.0436,
      "step": 188
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995121357654918,
      "loss": 0.9919,
      "step": 189
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019995066699916958,
      "loss": 1.0236,
      "step": 190
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.000199950117377795,
      "loss": 1.0733,
      "step": 191
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019994956471244225,
      "loss": 1.0112,
      "step": 192
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999490090031281,
      "loss": 0.9201,
      "step": 193
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999484502498695,
      "loss": 1.0793,
      "step": 194
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019994788845268354,
      "loss": 1.0102,
      "step": 195
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999473236115872,
      "loss": 1.1175,
      "step": 196
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019994675572659776,
      "loss": 1.0691,
      "step": 197
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019994618479773248,
      "loss": 0.9213,
      "step": 198
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019994561082500878,
      "loss": 0.8912,
      "step": 199
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019994503380844415,
      "loss": 1.1143,
      "step": 200
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.0001999444537480561,
      "loss": 1.0468,
      "step": 201
    },
    {
      "epoch": 0.04,
      "learning_rate": 0.00019994387064386232,
      "loss": 1.2166,
      "step": 202
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019994328449588064,
      "loss": 1.1189,
      "step": 203
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019994269530412883,
      "loss": 1.0865,
      "step": 204
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999421030686248,
      "loss": 1.0032,
      "step": 205
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019994150778938674,
      "loss": 1.0802,
      "step": 206
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019994090946643262,
      "loss": 1.0913,
      "step": 207
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019994030809978075,
      "loss": 1.11,
      "step": 208
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993970368944943,
      "loss": 1.0943,
      "step": 209
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993909623545705,
      "loss": 1.0812,
      "step": 210
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999384857378221,
      "loss": 0.9891,
      "step": 211
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999378721965632,
      "loss": 0.9012,
      "step": 212
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.000199937255611699,
      "loss": 1.1478,
      "step": 213
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993663598324833,
      "loss": 0.9896,
      "step": 214
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993601331123005,
      "loss": 1.0891,
      "step": 215
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993538759566305,
      "loss": 1.0028,
      "step": 216
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999347588365665,
      "loss": 1.0153,
      "step": 217
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999341270339595,
      "loss": 1.0581,
      "step": 218
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993349218786123,
      "loss": 1.05,
      "step": 219
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993285429829112,
      "loss": 0.9599,
      "step": 220
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993221336526854,
      "loss": 1.1683,
      "step": 221
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993156938881304,
      "loss": 1.1041,
      "step": 222
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999309223689442,
      "loss": 1.1458,
      "step": 223
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019993027230568174,
      "loss": 1.2516,
      "step": 224
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992961919904547,
      "loss": 1.067,
      "step": 225
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992896304905526,
      "loss": 1.0111,
      "step": 226
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992830385573112,
      "loss": 1.1215,
      "step": 227
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999276416190931,
      "loss": 1.1412,
      "step": 228
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992697633916138,
      "loss": 1.0791,
      "step": 229
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992630801595623,
      "loss": 1.141,
      "step": 230
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992563664949795,
      "loss": 1.0437,
      "step": 231
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992496223980705,
      "loss": 1.0436,
      "step": 232
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992428478690405,
      "loss": 1.025,
      "step": 233
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999236042908096,
      "loss": 0.9699,
      "step": 234
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992292075154437,
      "loss": 1.0048,
      "step": 235
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992223416912924,
      "loss": 0.9851,
      "step": 236
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992154454358507,
      "loss": 1.0397,
      "step": 237
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999208518749329,
      "loss": 1.0889,
      "step": 238
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019992015616319378,
      "loss": 1.2323,
      "step": 239
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019991945740838895,
      "loss": 1.0959,
      "step": 240
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019991875561053968,
      "loss": 1.0103,
      "step": 241
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019991805076966733,
      "loss": 1.0481,
      "step": 242
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019991734288579333,
      "loss": 0.9678,
      "step": 243
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.0001999166319589393,
      "loss": 1.0728,
      "step": 244
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019991591798912688,
      "loss": 1.0046,
      "step": 245
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019991520097637776,
      "loss": 1.0618,
      "step": 246
    },
    {
      "epoch": 0.05,
      "learning_rate": 0.00019991448092071385,
      "loss": 0.9787,
      "step": 247
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019991375782215705,
      "loss": 0.9806,
      "step": 248
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019991303168072935,
      "loss": 1.0656,
      "step": 249
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001999123024964529,
      "loss": 1.0752,
      "step": 250
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001999115702693499,
      "loss": 0.9457,
      "step": 251
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019991083499944267,
      "loss": 1.079,
      "step": 252
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019991009668675355,
      "loss": 1.1294,
      "step": 253
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990935533130508,
      "loss": 1.0672,
      "step": 254
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990861093311982,
      "loss": 1.0705,
      "step": 255
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990786349222042,
      "loss": 1.0532,
      "step": 256
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990711300862967,
      "loss": 0.9975,
      "step": 257
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990635948237043,
      "loss": 1.0349,
      "step": 258
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001999056029134656,
      "loss": 0.9695,
      "step": 259
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990484330193825,
      "loss": 1.1312,
      "step": 260
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990408064781155,
      "loss": 1.0828,
      "step": 261
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001999033149511087,
      "loss": 0.9631,
      "step": 262
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.000199902546211853,
      "loss": 1.1944,
      "step": 263
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990177443006787,
      "loss": 1.0388,
      "step": 264
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019990099960577685,
      "loss": 1.0376,
      "step": 265
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001999002217390035,
      "loss": 1.0378,
      "step": 266
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001998994408297715,
      "loss": 1.0984,
      "step": 267
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019989865687810465,
      "loss": 1.1549,
      "step": 268
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019989786988402683,
      "loss": 1.0767,
      "step": 269
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019989707984756203,
      "loss": 1.0515,
      "step": 270
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019989628676873427,
      "loss": 0.9439,
      "step": 271
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001998954906475677,
      "loss": 0.9988,
      "step": 272
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001998946914840866,
      "loss": 1.0694,
      "step": 273
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001998938892783153,
      "loss": 1.0115,
      "step": 274
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001998930840302782,
      "loss": 1.0835,
      "step": 275
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019989227573999986,
      "loss": 1.0541,
      "step": 276
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001998914644075049,
      "loss": 1.1137,
      "step": 277
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.000199890650032818,
      "loss": 1.0041,
      "step": 278
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.000199889832615964,
      "loss": 1.113,
      "step": 279
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988901215696773,
      "loss": 0.9553,
      "step": 280
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988818865585424,
      "loss": 1.1098,
      "step": 281
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988736211264856,
      "loss": 1.1043,
      "step": 282
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988653252737593,
      "loss": 1.0639,
      "step": 283
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988569990006153,
      "loss": 1.0304,
      "step": 284
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988486423073082,
      "loss": 1.1525,
      "step": 285
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988402551940912,
      "loss": 1.0849,
      "step": 286
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001998831837661221,
      "loss": 1.0178,
      "step": 287
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.0001998823389708953,
      "loss": 1.1307,
      "step": 288
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988149113375452,
      "loss": 0.9198,
      "step": 289
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019988064025472553,
      "loss": 1.0196,
      "step": 290
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019987978633383426,
      "loss": 1.1701,
      "step": 291
    },
    {
      "epoch": 0.06,
      "learning_rate": 0.00019987892937110675,
      "loss": 1.0052,
      "step": 292
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019987806936656903,
      "loss": 1.1542,
      "step": 293
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019987720632024734,
      "loss": 1.0416,
      "step": 294
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019987634023216794,
      "loss": 1.0956,
      "step": 295
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019987547110235726,
      "loss": 0.994,
      "step": 296
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998745989308417,
      "loss": 1.0488,
      "step": 297
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019987372371764786,
      "loss": 1.1458,
      "step": 298
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998728454628024,
      "loss": 1.2264,
      "step": 299
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019987196416633202,
      "loss": 1.1417,
      "step": 300
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998710798282636,
      "loss": 1.0389,
      "step": 301
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019987019244862406,
      "loss": 1.0917,
      "step": 302
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019986930202744045,
      "loss": 1.1202,
      "step": 303
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019986840856473984,
      "loss": 1.1541,
      "step": 304
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998675120605495,
      "loss": 0.9585,
      "step": 305
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998666125148967,
      "loss": 1.0979,
      "step": 306
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998657099278088,
      "loss": 1.0436,
      "step": 307
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019986480429931339,
      "loss": 1.0013,
      "step": 308
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019986389562943796,
      "loss": 0.9371,
      "step": 309
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019986298391821018,
      "loss": 1.0413,
      "step": 310
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019986206916565785,
      "loss": 1.1128,
      "step": 311
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019986115137180885,
      "loss": 1.1177,
      "step": 312
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019986023053669108,
      "loss": 1.0826,
      "step": 313
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019985930666033264,
      "loss": 1.0164,
      "step": 314
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998583797427616,
      "loss": 1.0449,
      "step": 315
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019985744978400627,
      "loss": 1.1064,
      "step": 316
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998565167840949,
      "loss": 1.0844,
      "step": 317
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019985558074305594,
      "loss": 1.0365,
      "step": 318
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998546416609179,
      "loss": 1.1369,
      "step": 319
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019985369953770933,
      "loss": 1.0159,
      "step": 320
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.000199852754373459,
      "loss": 0.9669,
      "step": 321
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019985180616819564,
      "loss": 0.9857,
      "step": 322
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019985085492194815,
      "loss": 1.0031,
      "step": 323
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019984990063474548,
      "loss": 1.018,
      "step": 324
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998489433066167,
      "loss": 1.0134,
      "step": 325
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.000199847982937591,
      "loss": 1.099,
      "step": 326
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019984701952769761,
      "loss": 1.0395,
      "step": 327
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019984605307696583,
      "loss": 1.2129,
      "step": 328
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019984508358542513,
      "loss": 1.1113,
      "step": 329
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019984411105310505,
      "loss": 0.9209,
      "step": 330
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019984313548003518,
      "loss": 1.0758,
      "step": 331
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019984215686624524,
      "loss": 0.9869,
      "step": 332
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019984117521176502,
      "loss": 1.0516,
      "step": 333
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998401905166244,
      "loss": 0.9819,
      "step": 334
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.00019983920278085346,
      "loss": 1.0401,
      "step": 335
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998382120044822,
      "loss": 1.0835,
      "step": 336
    },
    {
      "epoch": 0.07,
      "learning_rate": 0.0001998372181875408,
      "loss": 1.0921,
      "step": 337
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019983622133005956,
      "loss": 1.1014,
      "step": 338
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019983522143206882,
      "loss": 1.0282,
      "step": 339
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.000199834218493599,
      "loss": 0.8881,
      "step": 340
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.0001998332125146807,
      "loss": 0.9722,
      "step": 341
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019983220349534454,
      "loss": 1.0505,
      "step": 342
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019983119143562124,
      "loss": 1.0748,
      "step": 343
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.0001998301763355416,
      "loss": 0.9513,
      "step": 344
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.0001998291581951366,
      "loss": 0.9727,
      "step": 345
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019982813701443716,
      "loss": 1.0634,
      "step": 346
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019982711279347445,
      "loss": 1.011,
      "step": 347
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019982608553227964,
      "loss": 1.0497,
      "step": 348
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.000199825055230884,
      "loss": 0.9937,
      "step": 349
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019982402188931895,
      "loss": 1.1273,
      "step": 350
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019982298550761594,
      "loss": 1.0143,
      "step": 351
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.0001998219460858065,
      "loss": 1.0841,
      "step": 352
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019982090362392232,
      "loss": 1.0709,
      "step": 353
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981985812199513,
      "loss": 0.9525,
      "step": 354
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981880958005682,
      "loss": 1.1914,
      "step": 355
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981775799813925,
      "loss": 1.0414,
      "step": 356
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981670337627447,
      "loss": 1.0814,
      "step": 357
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981564571449462,
      "loss": 1.2062,
      "step": 358
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981458501283191,
      "loss": 1.088,
      "step": 359
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981352127131864,
      "loss": 1.1215,
      "step": 360
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981245448998718,
      "loss": 1.0735,
      "step": 361
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981138466887007,
      "loss": 1.0002,
      "step": 362
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019981031180799983,
      "loss": 1.0581,
      "step": 363
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980923590740918,
      "loss": 0.995,
      "step": 364
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980815696713086,
      "loss": 1.0963,
      "step": 365
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980707498719772,
      "loss": 1.0282,
      "step": 366
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980598996764272,
      "loss": 0.895,
      "step": 367
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980490190849896,
      "loss": 1.1265,
      "step": 368
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980381080979953,
      "loss": 0.9927,
      "step": 369
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980271667157764,
      "loss": 1.0643,
      "step": 370
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980161949386665,
      "loss": 1.0123,
      "step": 371
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019980051927669993,
      "loss": 1.0476,
      "step": 372
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979941602011106,
      "loss": 1.0658,
      "step": 373
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979830972413355,
      "loss": 1.1077,
      "step": 374
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979720038880116,
      "loss": 0.9249,
      "step": 375
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979608801414762,
      "loss": 1.0955,
      "step": 376
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979497260020688,
      "loss": 1.1134,
      "step": 377
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979385414701283,
      "loss": 1.2121,
      "step": 378
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979273265459963,
      "loss": 1.219,
      "step": 379
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979160812300134,
      "loss": 1.0623,
      "step": 380
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019979048055225222,
      "loss": 1.0029,
      "step": 381
    },
    {
      "epoch": 0.08,
      "learning_rate": 0.00019978934994238667,
      "loss": 1.0378,
      "step": 382
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019978821629343906,
      "loss": 1.0174,
      "step": 383
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019978707960544397,
      "loss": 0.9817,
      "step": 384
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.000199785939878436,
      "loss": 1.0317,
      "step": 385
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.0001997847971124498,
      "loss": 0.9705,
      "step": 386
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019978365130752027,
      "loss": 0.9227,
      "step": 387
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019978250246368223,
      "loss": 0.9849,
      "step": 388
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.0001997813505809707,
      "loss": 1.087,
      "step": 389
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019978019565942076,
      "loss": 1.0972,
      "step": 390
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019977903769906758,
      "loss": 0.974,
      "step": 391
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019977787669994644,
      "loss": 1.089,
      "step": 392
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019977671266209265,
      "loss": 1.0408,
      "step": 393
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019977554558554171,
      "loss": 1.0783,
      "step": 394
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019977437547032917,
      "loss": 0.99,
      "step": 395
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019977320231649061,
      "loss": 1.1073,
      "step": 396
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019977202612406184,
      "loss": 1.1415,
      "step": 397
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019977084689307858,
      "loss": 1.0875,
      "step": 398
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019976966462357685,
      "loss": 0.9568,
      "step": 399
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019976847931559255,
      "loss": 1.0158,
      "step": 400
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019976729096916188,
      "loss": 1.0753,
      "step": 401
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019976609958432094,
      "loss": 0.934,
      "step": 402
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019976490516110607,
      "loss": 0.9132,
      "step": 403
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019976370769955363,
      "loss": 1.198,
      "step": 404
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019976250719970008,
      "loss": 1.0733,
      "step": 405
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.000199761303661582,
      "loss": 1.0232,
      "step": 406
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019976009708523606,
      "loss": 0.993,
      "step": 407
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019975888747069895,
      "loss": 1.0855,
      "step": 408
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019975767481800755,
      "loss": 0.9751,
      "step": 409
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019975645912719881,
      "loss": 1.0736,
      "step": 410
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019975524039830969,
      "loss": 0.9777,
      "step": 411
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019975401863137732,
      "loss": 0.9479,
      "step": 412
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019975279382643897,
      "loss": 1.0235,
      "step": 413
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.0001997515659835319,
      "loss": 1.0427,
      "step": 414
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.0001997503351026935,
      "loss": 1.0613,
      "step": 415
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019974910118396126,
      "loss": 1.0254,
      "step": 416
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019974786422737278,
      "loss": 1.041,
      "step": 417
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019974662423296571,
      "loss": 0.983,
      "step": 418
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019974538120077776,
      "loss": 1.0705,
      "step": 419
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.0001997441351308469,
      "loss": 0.9402,
      "step": 420
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019974288602321103,
      "loss": 0.9562,
      "step": 421
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019974163387790817,
      "loss": 0.9401,
      "step": 422
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019974037869497643,
      "loss": 1.1495,
      "step": 423
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019973912047445414,
      "loss": 0.8879,
      "step": 424
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.0001997378592163795,
      "loss": 1.0497,
      "step": 425
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.000199736594920791,
      "loss": 1.0893,
      "step": 426
    },
    {
      "epoch": 0.09,
      "learning_rate": 0.00019973532758772714,
      "loss": 0.9018,
      "step": 427
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019973405721722648,
      "loss": 1.105,
      "step": 428
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019973278380932768,
      "loss": 0.9295,
      "step": 429
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019973150736406962,
      "loss": 0.9876,
      "step": 430
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997302278814911,
      "loss": 1.0989,
      "step": 431
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997289453616311,
      "loss": 1.1693,
      "step": 432
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997276598045287,
      "loss": 1.0528,
      "step": 433
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019972637121022305,
      "loss": 1.1274,
      "step": 434
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019972507957875335,
      "loss": 1.0387,
      "step": 435
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019972378491015902,
      "loss": 1.0284,
      "step": 436
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997224872044794,
      "loss": 1.0907,
      "step": 437
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019972118646175403,
      "loss": 1.0149,
      "step": 438
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019971988268202258,
      "loss": 1.091,
      "step": 439
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997185758653247,
      "loss": 0.9837,
      "step": 440
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019971726601170024,
      "loss": 1.0079,
      "step": 441
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019971595312118904,
      "loss": 1.0189,
      "step": 442
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019971463719383107,
      "loss": 1.0573,
      "step": 443
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997133182296665,
      "loss": 0.9789,
      "step": 444
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997119962287354,
      "loss": 1.0299,
      "step": 445
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997106711910781,
      "loss": 1.105,
      "step": 446
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997093431167349,
      "loss": 1.1845,
      "step": 447
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019970801200574632,
      "loss": 1.0333,
      "step": 448
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001997066778581528,
      "loss": 0.9603,
      "step": 449
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019970534067399504,
      "loss": 1.0152,
      "step": 450
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019970400045331375,
      "loss": 1.1743,
      "step": 451
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019970265719614972,
      "loss": 0.9309,
      "step": 452
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019970131090254393,
      "loss": 1.0735,
      "step": 453
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001996999615725373,
      "loss": 1.1109,
      "step": 454
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019969860920617097,
      "loss": 1.1276,
      "step": 455
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001996972538034861,
      "loss": 1.124,
      "step": 456
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.000199695895364524,
      "loss": 1.1048,
      "step": 457
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.000199694533889326,
      "loss": 1.1206,
      "step": 458
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019969316937793358,
      "loss": 1.1663,
      "step": 459
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019969180183038832,
      "loss": 1.0457,
      "step": 460
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019969043124673185,
      "loss": 1.088,
      "step": 461
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019968905762700594,
      "loss": 1.0235,
      "step": 462
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019968768097125236,
      "loss": 1.0731,
      "step": 463
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001996863012795131,
      "loss": 1.0018,
      "step": 464
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019968491855183013,
      "loss": 0.8522,
      "step": 465
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019968353278824558,
      "loss": 1.097,
      "step": 466
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019968214398880167,
      "loss": 0.9954,
      "step": 467
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019968075215354066,
      "loss": 1.0728,
      "step": 468
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.000199679357282505,
      "loss": 0.9683,
      "step": 469
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.0001996779593757371,
      "loss": 1.0178,
      "step": 470
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019967655843327955,
      "loss": 0.8394,
      "step": 471
    },
    {
      "epoch": 0.1,
      "learning_rate": 0.00019967515445517506,
      "loss": 1.0278,
      "step": 472
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019967374744146634,
      "loss": 0.9896,
      "step": 473
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019967233739219626,
      "loss": 1.117,
      "step": 474
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019967092430740776,
      "loss": 1.0357,
      "step": 475
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996695081871439,
      "loss": 1.1898,
      "step": 476
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019966808903144773,
      "loss": 1.0399,
      "step": 477
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019966666684036256,
      "loss": 1.1488,
      "step": 478
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996652416139317,
      "loss": 0.9991,
      "step": 479
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019966381335219846,
      "loss": 1.0787,
      "step": 480
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019966238205520646,
      "loss": 0.951,
      "step": 481
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019966094772299917,
      "loss": 1.0184,
      "step": 482
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019965951035562035,
      "loss": 0.8474,
      "step": 483
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019965806995311377,
      "loss": 1.0127,
      "step": 484
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996566265155233,
      "loss": 1.0143,
      "step": 485
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019965518004289287,
      "loss": 0.9819,
      "step": 486
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019965373053526655,
      "loss": 1.0461,
      "step": 487
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019965227799268847,
      "loss": 0.9182,
      "step": 488
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996508224152029,
      "loss": 0.9934,
      "step": 489
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019964936380285412,
      "loss": 0.9373,
      "step": 490
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019964790215568662,
      "loss": 1.1639,
      "step": 491
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019964643747374483,
      "loss": 0.9973,
      "step": 492
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019964496975707343,
      "loss": 1.0917,
      "step": 493
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996434990057171,
      "loss": 1.1485,
      "step": 494
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996420252197206,
      "loss": 0.9961,
      "step": 495
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019964054839912885,
      "loss": 1.1573,
      "step": 496
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996390685439868,
      "loss": 1.1322,
      "step": 497
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019963758565433955,
      "loss": 0.9241,
      "step": 498
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019963609973023224,
      "loss": 1.1385,
      "step": 499
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996346107717101,
      "loss": 0.9839,
      "step": 500
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019963311877881855,
      "loss": 1.0313,
      "step": 501
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019963162375160297,
      "loss": 1.0274,
      "step": 502
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019963012569010889,
      "loss": 1.0905,
      "step": 503
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019962862459438195,
      "loss": 1.0738,
      "step": 504
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019962712046446785,
      "loss": 1.0839,
      "step": 505
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019962561330041242,
      "loss": 1.1587,
      "step": 506
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019962410310226156,
      "loss": 1.088,
      "step": 507
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019962258987006126,
      "loss": 1.1314,
      "step": 508
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996210736038576,
      "loss": 1.0311,
      "step": 509
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019961955430369675,
      "loss": 1.0237,
      "step": 510
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019961803196962498,
      "loss": 1.0049,
      "step": 511
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019961650660168867,
      "loss": 1.065,
      "step": 512
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019961497819993428,
      "loss": 1.0469,
      "step": 513
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.0001996134467644083,
      "loss": 0.8723,
      "step": 514
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019961191229515745,
      "loss": 0.9619,
      "step": 515
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019961037479222844,
      "loss": 1.0213,
      "step": 516
    },
    {
      "epoch": 0.11,
      "learning_rate": 0.00019960883425566806,
      "loss": 1.0291,
      "step": 517
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019960729068552323,
      "loss": 1.0326,
      "step": 518
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019960574408184098,
      "loss": 1.0212,
      "step": 519
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019960419444466844,
      "loss": 0.9718,
      "step": 520
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019960264177405277,
      "loss": 1.0177,
      "step": 521
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019960108607004122,
      "loss": 1.0039,
      "step": 522
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019959952733268122,
      "loss": 1.0062,
      "step": 523
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019959796556202024,
      "loss": 0.9761,
      "step": 524
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019959640075810584,
      "loss": 1.0121,
      "step": 525
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019959483292098567,
      "loss": 0.9528,
      "step": 526
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019959326205070744,
      "loss": 1.0403,
      "step": 527
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019959168814731907,
      "loss": 1.0744,
      "step": 528
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019959011121086845,
      "loss": 1.0021,
      "step": 529
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.0001995885312414036,
      "loss": 1.1523,
      "step": 530
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019958694823897264,
      "loss": 1.1838,
      "step": 531
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.0001995853622036238,
      "loss": 1.0433,
      "step": 532
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019958377313540534,
      "loss": 0.9414,
      "step": 533
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.0001995821810343657,
      "loss": 1.0579,
      "step": 534
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019958058590055332,
      "loss": 1.2848,
      "step": 535
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019957898773401684,
      "loss": 1.1579,
      "step": 536
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.0001995773865348049,
      "loss": 1.1551,
      "step": 537
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019957578230296626,
      "loss": 0.9735,
      "step": 538
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019957417503854981,
      "loss": 0.9358,
      "step": 539
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019957256474160447,
      "loss": 1.0008,
      "step": 540
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019957095141217925,
      "loss": 1.138,
      "step": 541
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019956933505032334,
      "loss": 0.9996,
      "step": 542
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019956771565608593,
      "loss": 1.0492,
      "step": 543
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019956609322951637,
      "loss": 1.0338,
      "step": 544
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019956446777066403,
      "loss": 1.0514,
      "step": 545
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019956283927957845,
      "loss": 1.0691,
      "step": 546
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.0001995612077563092,
      "loss": 0.9185,
      "step": 547
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019955957320090602,
      "loss": 1.1187,
      "step": 548
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019955793561341864,
      "loss": 1.0387,
      "step": 549
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019955629499389692,
      "loss": 0.9267,
      "step": 550
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019955465134239084,
      "loss": 1.1182,
      "step": 551
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019955300465895052,
      "loss": 1.0413,
      "step": 552
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.000199551354943626,
      "loss": 1.1555,
      "step": 553
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.0001995497021964676,
      "loss": 1.0846,
      "step": 554
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019954804641752563,
      "loss": 1.0217,
      "step": 555
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019954638760685055,
      "loss": 1.0118,
      "step": 556
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019954472576449281,
      "loss": 1.143,
      "step": 557
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019954306089050309,
      "loss": 1.0524,
      "step": 558
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019954139298493202,
      "loss": 0.983,
      "step": 559
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019953972204783048,
      "loss": 1.1482,
      "step": 560
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019953804807924927,
      "loss": 1.0454,
      "step": 561
    },
    {
      "epoch": 0.12,
      "learning_rate": 0.00019953637107923946,
      "loss": 1.155,
      "step": 562
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019953469104785207,
      "loss": 1.0556,
      "step": 563
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019953300798513827,
      "loss": 0.9931,
      "step": 564
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019953132189114934,
      "loss": 1.1463,
      "step": 565
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019952963276593662,
      "loss": 1.1118,
      "step": 566
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001995279406095515,
      "loss": 1.1257,
      "step": 567
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001995262454220456,
      "loss": 1.0753,
      "step": 568
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001995245472034705,
      "loss": 1.0306,
      "step": 569
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001995228459538779,
      "loss": 1.0246,
      "step": 570
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019952114167331967,
      "loss": 1.0318,
      "step": 571
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001995194343618477,
      "loss": 0.9452,
      "step": 572
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019951772401951393,
      "loss": 1.0459,
      "step": 573
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019951601064637054,
      "loss": 1.0389,
      "step": 574
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001995142942424696,
      "loss": 0.9689,
      "step": 575
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019951257480786344,
      "loss": 1.0065,
      "step": 576
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019951085234260447,
      "loss": 1.1282,
      "step": 577
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001995091268467451,
      "loss": 1.1533,
      "step": 578
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019950739832033784,
      "loss": 1.0026,
      "step": 579
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001995056667634354,
      "loss": 1.134,
      "step": 580
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019950393217609049,
      "loss": 1.1734,
      "step": 581
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019950219455835595,
      "loss": 1.0894,
      "step": 582
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019950045391028465,
      "loss": 1.069,
      "step": 583
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019949871023192968,
      "loss": 1.0832,
      "step": 584
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019949696352334408,
      "loss": 0.9801,
      "step": 585
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001994952137845811,
      "loss": 0.9739,
      "step": 586
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019949346101569396,
      "loss": 1.0488,
      "step": 587
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019949170521673607,
      "loss": 1.1393,
      "step": 588
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019948994638776095,
      "loss": 1.0676,
      "step": 589
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019948818452882207,
      "loss": 0.9839,
      "step": 590
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019948641963997318,
      "loss": 1.1815,
      "step": 591
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019948465172126798,
      "loss": 1.1585,
      "step": 592
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019948288077276032,
      "loss": 1.0722,
      "step": 593
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019948110679450414,
      "loss": 1.0083,
      "step": 594
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019947932978655347,
      "loss": 1.0571,
      "step": 595
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001994775497489624,
      "loss": 1.004,
      "step": 596
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019947576668178518,
      "loss": 1.0818,
      "step": 597
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001994739805850761,
      "loss": 1.1108,
      "step": 598
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019947219145888956,
      "loss": 0.9509,
      "step": 599
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019947039930328002,
      "loss": 1.0255,
      "step": 600
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019946860411830208,
      "loss": 0.9485,
      "step": 601
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019946680590401044,
      "loss": 1.0609,
      "step": 602
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001994650046604598,
      "loss": 1.1636,
      "step": 603
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019946320038770508,
      "loss": 0.997,
      "step": 604
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.0001994613930858012,
      "loss": 1.0472,
      "step": 605
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019945958275480318,
      "loss": 0.9642,
      "step": 606
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019945776939476618,
      "loss": 1.034,
      "step": 607
    },
    {
      "epoch": 0.13,
      "learning_rate": 0.00019945595300574547,
      "loss": 1.0707,
      "step": 608
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019945413358779627,
      "loss": 1.0383,
      "step": 609
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019945231114097407,
      "loss": 0.9245,
      "step": 610
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019945048566533433,
      "loss": 1.2035,
      "step": 611
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019944865716093265,
      "loss": 0.991,
      "step": 612
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019944682562782475,
      "loss": 1.0635,
      "step": 613
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019944499106606638,
      "loss": 0.9961,
      "step": 614
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019944315347571344,
      "loss": 1.0034,
      "step": 615
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019944131285682182,
      "loss": 1.0946,
      "step": 616
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019943946920944765,
      "loss": 1.1079,
      "step": 617
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019943762253364706,
      "loss": 0.8995,
      "step": 618
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019943577282947628,
      "loss": 1.0767,
      "step": 619
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019943392009699165,
      "loss": 1.0443,
      "step": 620
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019943206433624958,
      "loss": 1.0701,
      "step": 621
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019943020554730664,
      "loss": 1.0511,
      "step": 622
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019942834373021937,
      "loss": 1.0628,
      "step": 623
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019942647888504452,
      "loss": 1.0458,
      "step": 624
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019942461101183883,
      "loss": 1.0712,
      "step": 625
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019942274011065924,
      "loss": 0.9649,
      "step": 626
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019942086618156274,
      "loss": 1.1515,
      "step": 627
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019941898922460634,
      "loss": 1.05,
      "step": 628
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019941710923984722,
      "loss": 1.0901,
      "step": 629
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019941522622734265,
      "loss": 1.0932,
      "step": 630
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019941334018715,
      "loss": 1.0134,
      "step": 631
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019941145111932666,
      "loss": 0.979,
      "step": 632
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.0001994095590239302,
      "loss": 1.1313,
      "step": 633
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019940766390101825,
      "loss": 0.949,
      "step": 634
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019940576575064846,
      "loss": 0.9083,
      "step": 635
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.0001994038645728787,
      "loss": 1.0535,
      "step": 636
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019940196036776685,
      "loss": 0.9848,
      "step": 637
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019940005313537094,
      "loss": 0.9914,
      "step": 638
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019939814287574898,
      "loss": 0.994,
      "step": 639
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019939622958895919,
      "loss": 0.8778,
      "step": 640
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019939431327505985,
      "loss": 0.967,
      "step": 641
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019939239393410932,
      "loss": 1.0986,
      "step": 642
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019939047156616603,
      "loss": 0.9679,
      "step": 643
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.0001993885461712885,
      "loss": 0.9391,
      "step": 644
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019938661774953546,
      "loss": 0.9589,
      "step": 645
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019938468630096556,
      "loss": 1.0484,
      "step": 646
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019938275182563767,
      "loss": 1.0489,
      "step": 647
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019938081432361064,
      "loss": 0.921,
      "step": 648
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019937887379494352,
      "loss": 1.0732,
      "step": 649
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019937693023969546,
      "loss": 0.9876,
      "step": 650
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019937498365792556,
      "loss": 1.0048,
      "step": 651
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019937303404969314,
      "loss": 1.0545,
      "step": 652
    },
    {
      "epoch": 0.14,
      "learning_rate": 0.00019937108141505758,
      "loss": 0.9367,
      "step": 653
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019936912575407837,
      "loss": 1.1789,
      "step": 654
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.000199367167066815,
      "loss": 1.0056,
      "step": 655
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019936520535332718,
      "loss": 1.0949,
      "step": 656
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019936324061367464,
      "loss": 1.0397,
      "step": 657
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019936127284791722,
      "loss": 1.1051,
      "step": 658
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019935930205611485,
      "loss": 1.1602,
      "step": 659
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019935732823832755,
      "loss": 1.068,
      "step": 660
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.0001993553513946154,
      "loss": 1.0055,
      "step": 661
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019935337152503864,
      "loss": 0.9019,
      "step": 662
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019935138862965757,
      "loss": 1.0362,
      "step": 663
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019934940270853254,
      "loss": 0.9499,
      "step": 664
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019934741376172408,
      "loss": 1.0689,
      "step": 665
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019934542178929275,
      "loss": 1.0802,
      "step": 666
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019934342679129918,
      "loss": 0.9842,
      "step": 667
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019934142876780418,
      "loss": 1.0086,
      "step": 668
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019933942771886855,
      "loss": 1.0484,
      "step": 669
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019933742364455328,
      "loss": 1.0683,
      "step": 670
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019933541654491935,
      "loss": 0.9663,
      "step": 671
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019933340642002795,
      "loss": 1.0169,
      "step": 672
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019933139326994023,
      "loss": 1.0994,
      "step": 673
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019932937709471758,
      "loss": 1.1617,
      "step": 674
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019932735789442133,
      "loss": 1.032,
      "step": 675
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.000199325335669113,
      "loss": 0.9784,
      "step": 676
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.0001993233104188542,
      "loss": 1.0078,
      "step": 677
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.0001993212821437066,
      "loss": 0.9982,
      "step": 678
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.0001993192508437319,
      "loss": 1.1674,
      "step": 679
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019931721651899204,
      "loss": 1.0125,
      "step": 680
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019931517916954897,
      "loss": 1.0935,
      "step": 681
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019931313879546474,
      "loss": 0.9946,
      "step": 682
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019931109539680146,
      "loss": 1.0014,
      "step": 683
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019930904897362138,
      "loss": 1.0328,
      "step": 684
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.0001993069995259868,
      "loss": 0.9471,
      "step": 685
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019930494705396018,
      "loss": 1.0626,
      "step": 686
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.000199302891557604,
      "loss": 0.9952,
      "step": 687
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019930083303698086,
      "loss": 1.1627,
      "step": 688
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019929877149215346,
      "loss": 0.9368,
      "step": 689
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019929670692318458,
      "loss": 1.0036,
      "step": 690
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.0001992946393301371,
      "loss": 0.9587,
      "step": 691
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019929256871307398,
      "loss": 1.0007,
      "step": 692
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019929049507205827,
      "loss": 0.9091,
      "step": 693
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019928841840715316,
      "loss": 1.0954,
      "step": 694
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019928633871842187,
      "loss": 0.89,
      "step": 695
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019928425600592773,
      "loss": 1.1111,
      "step": 696
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.0001992821702697342,
      "loss": 1.0708,
      "step": 697
    },
    {
      "epoch": 0.15,
      "learning_rate": 0.00019928008150990479,
      "loss": 1.1184,
      "step": 698
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019927798972650305,
      "loss": 0.9428,
      "step": 699
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019927589491959278,
      "loss": 1.0359,
      "step": 700
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019927379708923771,
      "loss": 0.9094,
      "step": 701
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019927169623550176,
      "loss": 0.9286,
      "step": 702
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019926959235844893,
      "loss": 0.8808,
      "step": 703
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.0001992674854581433,
      "loss": 1.0611,
      "step": 704
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019926537553464893,
      "loss": 1.0535,
      "step": 705
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019926326258803018,
      "loss": 1.0009,
      "step": 706
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.0001992611466183514,
      "loss": 1.0123,
      "step": 707
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.000199259027625677,
      "loss": 1.0991,
      "step": 708
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019925690561007148,
      "loss": 1.0561,
      "step": 709
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019925478057159954,
      "loss": 1.0876,
      "step": 710
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019925265251032585,
      "loss": 1.0716,
      "step": 711
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019925052142631523,
      "loss": 0.9723,
      "step": 712
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.0001992483873196326,
      "loss": 1.0343,
      "step": 713
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019924625019034293,
      "loss": 1.0375,
      "step": 714
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019924411003851132,
      "loss": 1.1172,
      "step": 715
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019924196686420294,
      "loss": 1.0154,
      "step": 716
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019923982066748303,
      "loss": 1.0258,
      "step": 717
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019923767144841703,
      "loss": 1.0255,
      "step": 718
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019923551920707032,
      "loss": 0.8622,
      "step": 719
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019923336394350852,
      "loss": 1.0193,
      "step": 720
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019923120565779718,
      "loss": 1.0418,
      "step": 721
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019922904435000212,
      "loss": 0.8839,
      "step": 722
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019922688002018906,
      "loss": 1.0048,
      "step": 723
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019922471266842405,
      "loss": 0.9342,
      "step": 724
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019922254229477298,
      "loss": 0.9768,
      "step": 725
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019922036889930195,
      "loss": 0.9184,
      "step": 726
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019921819248207724,
      "loss": 1.0755,
      "step": 727
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019921601304316507,
      "loss": 1.1098,
      "step": 728
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019921383058263184,
      "loss": 1.0164,
      "step": 729
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.000199211645100544,
      "loss": 0.9153,
      "step": 730
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019920945659696808,
      "loss": 0.9595,
      "step": 731
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.0001992072650719708,
      "loss": 1.0414,
      "step": 732
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019920507052561886,
      "loss": 1.0516,
      "step": 733
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.0001992028729579791,
      "loss": 1.0021,
      "step": 734
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019920067236911843,
      "loss": 0.9898,
      "step": 735
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.0001991984687591039,
      "loss": 0.9922,
      "step": 736
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.0001991962621280026,
      "loss": 1.0281,
      "step": 737
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019919405247588174,
      "loss": 1.0822,
      "step": 738
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019919183980280863,
      "loss": 1.0445,
      "step": 739
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019918962410885063,
      "loss": 0.9972,
      "step": 740
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019918740539407522,
      "loss": 1.065,
      "step": 741
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019918518365855,
      "loss": 0.9678,
      "step": 742
    },
    {
      "epoch": 0.16,
      "learning_rate": 0.00019918295890234263,
      "loss": 1.048,
      "step": 743
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.0001991807311255208,
      "loss": 0.9492,
      "step": 744
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019917850032815247,
      "loss": 1.0895,
      "step": 745
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019917626651030546,
      "loss": 0.9889,
      "step": 746
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019917402967204787,
      "loss": 1.018,
      "step": 747
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019917178981344785,
      "loss": 0.9904,
      "step": 748
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019916954693457352,
      "loss": 1.0342,
      "step": 749
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019916730103549326,
      "loss": 0.9015,
      "step": 750
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019916505211627547,
      "loss": 1.0607,
      "step": 751
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.0001991628001769886,
      "loss": 0.9832,
      "step": 752
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019916054521770127,
      "loss": 1.1477,
      "step": 753
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.0001991582872384821,
      "loss": 0.9907,
      "step": 754
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019915602623939992,
      "loss": 1.0465,
      "step": 755
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019915376222052358,
      "loss": 1.0868,
      "step": 756
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.000199151495181922,
      "loss": 1.1518,
      "step": 757
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019914922512366423,
      "loss": 1.0705,
      "step": 758
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.0001991469520458194,
      "loss": 1.0143,
      "step": 759
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019914467594845677,
      "loss": 1.0003,
      "step": 760
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019914239683164564,
      "loss": 1.1539,
      "step": 761
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.0001991401146954554,
      "loss": 0.9252,
      "step": 762
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019913782953995555,
      "loss": 1.1063,
      "step": 763
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019913554136521575,
      "loss": 1.2113,
      "step": 764
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019913325017130565,
      "loss": 0.9578,
      "step": 765
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019913095595829497,
      "loss": 1.0236,
      "step": 766
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019912865872625363,
      "loss": 1.0173,
      "step": 767
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019912635847525162,
      "loss": 0.8697,
      "step": 768
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019912405520535896,
      "loss": 0.9959,
      "step": 769
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019912174891664576,
      "loss": 1.0841,
      "step": 770
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019911943960918232,
      "loss": 1.1033,
      "step": 771
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019911712728303896,
      "loss": 1.0996,
      "step": 772
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.0001991148119382861,
      "loss": 1.0417,
      "step": 773
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019911249357499423,
      "loss": 1.105,
      "step": 774
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.000199110172193234,
      "loss": 1.0663,
      "step": 775
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019910784779307602,
      "loss": 1.0074,
      "step": 776
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019910552037459117,
      "loss": 0.9711,
      "step": 777
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019910318993785029,
      "loss": 1.113,
      "step": 778
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019910085648292437,
      "loss": 1.017,
      "step": 779
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019909852000988445,
      "loss": 1.0867,
      "step": 780
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019909618051880174,
      "loss": 1.0108,
      "step": 781
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019909383800974738,
      "loss": 0.932,
      "step": 782
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019909149248279286,
      "loss": 0.8733,
      "step": 783
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.0001990891439380095,
      "loss": 1.0042,
      "step": 784
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019908679237546885,
      "loss": 1.0357,
      "step": 785
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019908443779524258,
      "loss": 0.9597,
      "step": 786
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019908208019740232,
      "loss": 1.018,
      "step": 787
    },
    {
      "epoch": 0.17,
      "learning_rate": 0.00019907971958201993,
      "loss": 0.8547,
      "step": 788
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990773559491673,
      "loss": 1.0137,
      "step": 789
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019907498929891637,
      "loss": 1.0264,
      "step": 790
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019907261963133922,
      "loss": 1.0669,
      "step": 791
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019907024694650809,
      "loss": 1.0481,
      "step": 792
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019906787124449515,
      "loss": 1.1006,
      "step": 793
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019906549252537281,
      "loss": 1.0673,
      "step": 794
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019906311078921347,
      "loss": 0.9853,
      "step": 795
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990607260360897,
      "loss": 0.9805,
      "step": 796
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019905833826607415,
      "loss": 1.1128,
      "step": 797
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019905594747923947,
      "loss": 1.0133,
      "step": 798
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019905355367565855,
      "loss": 1.0214,
      "step": 799
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990511568554042,
      "loss": 0.9423,
      "step": 800
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990487570185495,
      "loss": 1.049,
      "step": 801
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990463541651675,
      "loss": 0.9333,
      "step": 802
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019904394829533138,
      "loss": 1.0125,
      "step": 803
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019904153940911444,
      "loss": 1.0602,
      "step": 804
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019903912750658998,
      "loss": 1.0257,
      "step": 805
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990367125878315,
      "loss": 1.0097,
      "step": 806
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019903429465291253,
      "loss": 0.947,
      "step": 807
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019903187370190673,
      "loss": 1.0635,
      "step": 808
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019902944973488782,
      "loss": 1.077,
      "step": 809
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990270227519296,
      "loss": 1.0346,
      "step": 810
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019902459275310602,
      "loss": 0.9948,
      "step": 811
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019902215973849108,
      "loss": 0.9556,
      "step": 812
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019901972370815884,
      "loss": 1.0617,
      "step": 813
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990172846621835,
      "loss": 1.0169,
      "step": 814
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990148426006394,
      "loss": 1.1031,
      "step": 815
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019901239752360083,
      "loss": 1.1524,
      "step": 816
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001990099494311423,
      "loss": 1.021,
      "step": 817
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019900749832333836,
      "loss": 0.9503,
      "step": 818
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019900504420026366,
      "loss": 1.0947,
      "step": 819
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019900258706199292,
      "loss": 1.0248,
      "step": 820
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019900012690860104,
      "loss": 1.1508,
      "step": 821
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019899766374016284,
      "loss": 1.0027,
      "step": 822
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001989951975567534,
      "loss": 1.0896,
      "step": 823
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019899272835844785,
      "loss": 0.9599,
      "step": 824
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001989902561453213,
      "loss": 1.0241,
      "step": 825
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019898778091744914,
      "loss": 1.0109,
      "step": 826
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019898530267490672,
      "loss": 0.882,
      "step": 827
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019898282141776944,
      "loss": 0.9039,
      "step": 828
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.000198980337146113,
      "loss": 1.1413,
      "step": 829
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019897784986001296,
      "loss": 1.0698,
      "step": 830
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.0001989753595595451,
      "loss": 1.032,
      "step": 831
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019897286624478527,
      "loss": 1.173,
      "step": 832
    },
    {
      "epoch": 0.18,
      "learning_rate": 0.00019897036991580938,
      "loss": 1.0034,
      "step": 833
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989678705726935,
      "loss": 1.0054,
      "step": 834
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989653682155137,
      "loss": 1.1116,
      "step": 835
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019896286284434622,
      "loss": 1.0241,
      "step": 836
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019896035445926736,
      "loss": 1.1369,
      "step": 837
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019895784306035345,
      "loss": 1.0268,
      "step": 838
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019895532864768107,
      "loss": 1.2064,
      "step": 839
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019895281122132676,
      "loss": 0.9441,
      "step": 840
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019895029078136715,
      "loss": 1.0103,
      "step": 841
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019894776732787904,
      "loss": 0.987,
      "step": 842
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989452408609393,
      "loss": 0.9868,
      "step": 843
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989427113806248,
      "loss": 1.0688,
      "step": 844
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019894017888701267,
      "loss": 1.0835,
      "step": 845
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019893764338017997,
      "loss": 1.0364,
      "step": 846
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019893510486020395,
      "loss": 1.0863,
      "step": 847
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019893256332716188,
      "loss": 1.1263,
      "step": 848
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989300187811312,
      "loss": 0.9823,
      "step": 849
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989274712221894,
      "loss": 1.0176,
      "step": 850
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019892492065041407,
      "loss": 0.9843,
      "step": 851
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019892236706588285,
      "loss": 1.1007,
      "step": 852
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019891981046867358,
      "loss": 0.9395,
      "step": 853
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019891725085886404,
      "loss": 0.9663,
      "step": 854
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019891468823653223,
      "loss": 1.0504,
      "step": 855
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989121226017562,
      "loss": 1.0013,
      "step": 856
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019890955395461405,
      "loss": 0.9307,
      "step": 857
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019890698229518405,
      "loss": 0.9661,
      "step": 858
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989044076235445,
      "loss": 0.9907,
      "step": 859
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001989018299397738,
      "loss": 0.9852,
      "step": 860
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019889924924395048,
      "loss": 1.0689,
      "step": 861
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001988966655361531,
      "loss": 1.0578,
      "step": 862
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019889407881646038,
      "loss": 0.9968,
      "step": 863
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001988914890849511,
      "loss": 0.9799,
      "step": 864
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019888889634170408,
      "loss": 1.0682,
      "step": 865
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019888630058679832,
      "loss": 0.9552,
      "step": 866
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001988837018203129,
      "loss": 0.9412,
      "step": 867
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019888110004232692,
      "loss": 1.1148,
      "step": 868
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019887849525291964,
      "loss": 1.0645,
      "step": 869
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001988758874521704,
      "loss": 1.0504,
      "step": 870
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019887327664015855,
      "loss": 0.975,
      "step": 871
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001988706628169637,
      "loss": 1.0644,
      "step": 872
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019886804598266537,
      "loss": 0.9943,
      "step": 873
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019886542613734332,
      "loss": 1.0266,
      "step": 874
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019886280328107732,
      "loss": 1.0448,
      "step": 875
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019886017741394722,
      "loss": 1.087,
      "step": 876
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.00019885754853603304,
      "loss": 1.1222,
      "step": 877
    },
    {
      "epoch": 0.19,
      "learning_rate": 0.0001988549166474148,
      "loss": 0.8913,
      "step": 878
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019885228174817266,
      "loss": 1.1927,
      "step": 879
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001988496438383869,
      "loss": 1.0019,
      "step": 880
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019884700291813778,
      "loss": 1.12,
      "step": 881
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019884435898750584,
      "loss": 1.0726,
      "step": 882
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001988417120465715,
      "loss": 1.057,
      "step": 883
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019883906209541542,
      "loss": 1.015,
      "step": 884
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019883640913411833,
      "loss": 1.0861,
      "step": 885
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019883375316276096,
      "loss": 1.1061,
      "step": 886
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019883109418142422,
      "loss": 1.0129,
      "step": 887
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019882843219018911,
      "loss": 1.0328,
      "step": 888
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019882576718913673,
      "loss": 1.0679,
      "step": 889
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001988230991783482,
      "loss": 1.0265,
      "step": 890
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019882042815790474,
      "loss": 1.0207,
      "step": 891
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019881775412788772,
      "loss": 0.9408,
      "step": 892
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019881507708837862,
      "loss": 0.9345,
      "step": 893
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019881239703945896,
      "loss": 0.9402,
      "step": 894
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019880971398121032,
      "loss": 0.9383,
      "step": 895
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019880702791371443,
      "loss": 1.0246,
      "step": 896
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001988043388370531,
      "loss": 1.1404,
      "step": 897
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019880164675130827,
      "loss": 0.9312,
      "step": 898
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019879895165656183,
      "loss": 0.9537,
      "step": 899
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001987962535528959,
      "loss": 0.9976,
      "step": 900
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019879355244039267,
      "loss": 0.9807,
      "step": 901
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019879084831913443,
      "loss": 1.1015,
      "step": 902
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019878814118920346,
      "loss": 1.0165,
      "step": 903
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019878543105068225,
      "loss": 1.0344,
      "step": 904
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019878271790365335,
      "loss": 0.8769,
      "step": 905
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019878000174819937,
      "loss": 1.0688,
      "step": 906
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.000198777282584403,
      "loss": 0.986,
      "step": 907
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001987745604123471,
      "loss": 0.9936,
      "step": 908
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019877183523211455,
      "loss": 1.0023,
      "step": 909
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019876910704378834,
      "loss": 1.1325,
      "step": 910
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001987663758474516,
      "loss": 0.9773,
      "step": 911
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019876364164318747,
      "loss": 1.1318,
      "step": 912
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001987609044310792,
      "loss": 1.0471,
      "step": 913
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001987581642112102,
      "loss": 1.12,
      "step": 914
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019875542098366387,
      "loss": 1.0638,
      "step": 915
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001987526747485238,
      "loss": 0.9409,
      "step": 916
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019874992550587362,
      "loss": 1.2854,
      "step": 917
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019874717325579707,
      "loss": 1.0848,
      "step": 918
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.0001987444179983779,
      "loss": 1.0904,
      "step": 919
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019874165973370012,
      "loss": 0.9664,
      "step": 920
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019873889846184765,
      "loss": 1.0406,
      "step": 921
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019873613418290464,
      "loss": 0.9482,
      "step": 922
    },
    {
      "epoch": 0.2,
      "learning_rate": 0.00019873336689695526,
      "loss": 0.9949,
      "step": 923
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019873059660408378,
      "loss": 0.9624,
      "step": 924
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019872782330437454,
      "loss": 0.9115,
      "step": 925
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019872504699791206,
      "loss": 0.954,
      "step": 926
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019872226768478086,
      "loss": 0.9729,
      "step": 927
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019871948536506558,
      "loss": 1.0564,
      "step": 928
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019871670003885096,
      "loss": 0.8338,
      "step": 929
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019871391170622188,
      "loss": 0.9649,
      "step": 930
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019871112036726316,
      "loss": 0.9306,
      "step": 931
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019870832602205988,
      "loss": 0.9399,
      "step": 932
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019870552867069712,
      "loss": 1.0579,
      "step": 933
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019870272831326008,
      "loss": 1.0458,
      "step": 934
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019869992494983403,
      "loss": 1.0108,
      "step": 935
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019869711858050434,
      "loss": 1.0837,
      "step": 936
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.0001986943092053565,
      "loss": 1.0125,
      "step": 937
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.0001986914968244761,
      "loss": 0.9319,
      "step": 938
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019868868143794872,
      "loss": 0.8633,
      "step": 939
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019868586304586013,
      "loss": 0.9914,
      "step": 940
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.0001986830416482962,
      "loss": 1.1919,
      "step": 941
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.0001986802172453428,
      "loss": 1.0232,
      "step": 942
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.000198677389837086,
      "loss": 1.1635,
      "step": 943
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019867455942361187,
      "loss": 1.0275,
      "step": 944
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019867172600500664,
      "loss": 1.0872,
      "step": 945
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019866888958135657,
      "loss": 0.9097,
      "step": 946
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019866605015274807,
      "loss": 1.047,
      "step": 947
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019866320771926756,
      "loss": 0.9363,
      "step": 948
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019866036228100166,
      "loss": 1.0473,
      "step": 949
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019865751383803707,
      "loss": 0.9747,
      "step": 950
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019865466239046042,
      "loss": 1.028,
      "step": 951
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019865180793835868,
      "loss": 1.0213,
      "step": 952
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019864895048181866,
      "loss": 1.0074,
      "step": 953
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019864609002092745,
      "loss": 1.067,
      "step": 954
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.0001986432265557722,
      "loss": 0.972,
      "step": 955
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019864036008644003,
      "loss": 0.9114,
      "step": 956
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.0001986374906130183,
      "loss": 0.9962,
      "step": 957
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019863461813559438,
      "loss": 1.0276,
      "step": 958
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019863174265425575,
      "loss": 1.0105,
      "step": 959
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019862886416909,
      "loss": 0.9962,
      "step": 960
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019862598268018475,
      "loss": 1.1166,
      "step": 961
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.0001986230981876278,
      "loss": 1.0482,
      "step": 962
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.000198620210691507,
      "loss": 0.9868,
      "step": 963
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019861732019191028,
      "loss": 1.0501,
      "step": 964
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019861442668892565,
      "loss": 1.0953,
      "step": 965
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019861153018264124,
      "loss": 0.9627,
      "step": 966
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019860863067314527,
      "loss": 1.0047,
      "step": 967
    },
    {
      "epoch": 0.21,
      "learning_rate": 0.00019860572816052602,
      "loss": 0.9652,
      "step": 968
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.0001986028226448719,
      "loss": 1.1034,
      "step": 969
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019859991412627146,
      "loss": 1.0479,
      "step": 970
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019859700260481318,
      "loss": 1.1247,
      "step": 971
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019859408808058578,
      "loss": 0.9702,
      "step": 972
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019859117055367803,
      "loss": 1.1214,
      "step": 973
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019858825002417875,
      "loss": 0.9762,
      "step": 974
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019858532649217692,
      "loss": 0.8806,
      "step": 975
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019858239995776153,
      "loss": 0.9613,
      "step": 976
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019857947042102177,
      "loss": 1.0543,
      "step": 977
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019857653788204682,
      "loss": 1.1201,
      "step": 978
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019857360234092598,
      "loss": 0.9836,
      "step": 979
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019857066379774867,
      "loss": 1.064,
      "step": 980
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019856772225260437,
      "loss": 1.0494,
      "step": 981
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019856477770558272,
      "loss": 1.011,
      "step": 982
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019856183015677333,
      "loss": 1.0167,
      "step": 983
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.000198558879606266,
      "loss": 1.0447,
      "step": 984
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019855592605415052,
      "loss": 0.9554,
      "step": 985
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019855296950051696,
      "loss": 0.9658,
      "step": 986
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019855000994545527,
      "loss": 1.0216,
      "step": 987
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019854704738905566,
      "loss": 0.9848,
      "step": 988
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019854408183140826,
      "loss": 0.9927,
      "step": 989
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019854111327260342,
      "loss": 0.9725,
      "step": 990
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.0001985381417127316,
      "loss": 0.9753,
      "step": 991
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019853516715188327,
      "loss": 0.9991,
      "step": 992
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.000198532189590149,
      "loss": 0.9852,
      "step": 993
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019852920902761946,
      "loss": 1.029,
      "step": 994
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019852622546438547,
      "loss": 1.0463,
      "step": 995
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019852323890053784,
      "loss": 0.9557,
      "step": 996
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019852024933616756,
      "loss": 0.8977,
      "step": 997
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.0001985172567713657,
      "loss": 0.9762,
      "step": 998
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019851426120622335,
      "loss": 0.947,
      "step": 999
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019851126264083178,
      "loss": 1.0603,
      "step": 1000
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019850826107528226,
      "loss": 1.1398,
      "step": 1001
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019850525650966626,
      "loss": 1.0262,
      "step": 1002
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019850224894407527,
      "loss": 0.9733,
      "step": 1003
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019849923837860086,
      "loss": 0.9964,
      "step": 1004
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019849622481333471,
      "loss": 1.0378,
      "step": 1005
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019849320824836863,
      "loss": 0.9517,
      "step": 1006
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019849018868379448,
      "loss": 1.1026,
      "step": 1007
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019848716611970421,
      "loss": 0.9598,
      "step": 1008
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019848414055618992,
      "loss": 0.9964,
      "step": 1009
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019848111199334366,
      "loss": 0.9534,
      "step": 1010
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019847808043125774,
      "loss": 1.042,
      "step": 1011
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.0001984750458700245,
      "loss": 1.0867,
      "step": 1012
    },
    {
      "epoch": 0.22,
      "learning_rate": 0.00019847200830973627,
      "loss": 0.969,
      "step": 1013
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019846896775048563,
      "loss": 0.9795,
      "step": 1014
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019846592419236518,
      "loss": 0.951,
      "step": 1015
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019846287763546758,
      "loss": 0.9187,
      "step": 1016
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019845982807988565,
      "loss": 1.0844,
      "step": 1017
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001984567755257122,
      "loss": 0.9395,
      "step": 1018
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019845371997304024,
      "loss": 0.9508,
      "step": 1019
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019845066142196283,
      "loss": 1.0565,
      "step": 1020
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019844759987257312,
      "loss": 0.9553,
      "step": 1021
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019844453532496433,
      "loss": 0.9837,
      "step": 1022
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019844146777922981,
      "loss": 1.0249,
      "step": 1023
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019843839723546295,
      "loss": 1.1107,
      "step": 1024
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001984353236937573,
      "loss": 1.0336,
      "step": 1025
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019843224715420648,
      "loss": 1.1058,
      "step": 1026
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001984291676169041,
      "loss": 1.0705,
      "step": 1027
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.000198426085081944,
      "loss": 1.1839,
      "step": 1028
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019842299954942014,
      "loss": 1.0777,
      "step": 1029
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019841991101942637,
      "loss": 0.9628,
      "step": 1030
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019841681949205677,
      "loss": 1.0003,
      "step": 1031
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019841372496740554,
      "loss": 1.0434,
      "step": 1032
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001984106274455669,
      "loss": 0.9434,
      "step": 1033
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001984075269266352,
      "loss": 1.0279,
      "step": 1034
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001984044234107048,
      "loss": 0.945,
      "step": 1035
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019840131689787032,
      "loss": 1.0454,
      "step": 1036
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019839820738822627,
      "loss": 1.0494,
      "step": 1037
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019839509488186742,
      "loss": 1.0857,
      "step": 1038
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019839197937888855,
      "loss": 0.9959,
      "step": 1039
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019838886087938451,
      "loss": 1.0225,
      "step": 1040
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001983857393834503,
      "loss": 1.0244,
      "step": 1041
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019838261489118098,
      "loss": 1.0142,
      "step": 1042
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001983794874026717,
      "loss": 0.9772,
      "step": 1043
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019837635691801774,
      "loss": 1.0036,
      "step": 1044
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001983732234373144,
      "loss": 1.0732,
      "step": 1045
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001983700869606571,
      "loss": 0.9843,
      "step": 1046
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001983669474881414,
      "loss": 0.8867,
      "step": 1047
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.0001983638050198629,
      "loss": 0.8859,
      "step": 1048
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019836065955591728,
      "loss": 1.0908,
      "step": 1049
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019835751109640036,
      "loss": 1.028,
      "step": 1050
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019835435964140805,
      "loss": 1.1344,
      "step": 1051
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019835120519103627,
      "loss": 1.0504,
      "step": 1052
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019834804774538113,
      "loss": 1.0095,
      "step": 1053
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019834488730453877,
      "loss": 1.0085,
      "step": 1054
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019834172386860546,
      "loss": 1.0874,
      "step": 1055
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019833855743767753,
      "loss": 1.0661,
      "step": 1056
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019833538801185139,
      "loss": 0.9789,
      "step": 1057
    },
    {
      "epoch": 0.23,
      "learning_rate": 0.00019833221559122362,
      "loss": 1.0536,
      "step": 1058
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001983290401758908,
      "loss": 0.968,
      "step": 1059
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019832586176594963,
      "loss": 1.0388,
      "step": 1060
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001983226803614969,
      "loss": 1.016,
      "step": 1061
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019831949596262955,
      "loss": 0.9242,
      "step": 1062
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019831630856944452,
      "loss": 1.0145,
      "step": 1063
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001983131181820389,
      "loss": 1.0206,
      "step": 1064
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019830992480050985,
      "loss": 1.065,
      "step": 1065
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001983067284249546,
      "loss": 1.1223,
      "step": 1066
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019830352905547054,
      "loss": 0.961,
      "step": 1067
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019830032669215507,
      "loss": 1.0477,
      "step": 1068
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019829712133510573,
      "loss": 1.0822,
      "step": 1069
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019829391298442018,
      "loss": 1.0325,
      "step": 1070
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019829070164019603,
      "loss": 1.0082,
      "step": 1071
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019828748730253115,
      "loss": 0.9571,
      "step": 1072
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019828426997152345,
      "loss": 0.9834,
      "step": 1073
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019828104964727088,
      "loss": 1.0196,
      "step": 1074
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001982778263298715,
      "loss": 1.036,
      "step": 1075
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019827460001942354,
      "loss": 1.0138,
      "step": 1076
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001982713707160252,
      "loss": 1.0459,
      "step": 1077
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019826813841977483,
      "loss": 0.8971,
      "step": 1078
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019826490313077088,
      "loss": 0.9076,
      "step": 1079
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001982616648491119,
      "loss": 1.0233,
      "step": 1080
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001982584235748965,
      "loss": 1.0721,
      "step": 1081
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019825517930822337,
      "loss": 1.033,
      "step": 1082
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019825193204919134,
      "loss": 1.0046,
      "step": 1083
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019824868179789932,
      "loss": 0.9587,
      "step": 1084
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019824542855444627,
      "loss": 1.0734,
      "step": 1085
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019824217231893126,
      "loss": 0.9922,
      "step": 1086
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019823891309145343,
      "loss": 0.9472,
      "step": 1087
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019823565087211212,
      "loss": 0.9197,
      "step": 1088
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019823238566100667,
      "loss": 0.9348,
      "step": 1089
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019822911745823646,
      "loss": 1.0176,
      "step": 1090
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019822584626390106,
      "loss": 1.0695,
      "step": 1091
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019822257207810008,
      "loss": 0.9928,
      "step": 1092
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019821929490093326,
      "loss": 1.0871,
      "step": 1093
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019821601473250038,
      "loss": 1.1234,
      "step": 1094
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019821273157290134,
      "loss": 0.8941,
      "step": 1095
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019820944542223615,
      "loss": 1.0814,
      "step": 1096
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.0001982061562806049,
      "loss": 0.9734,
      "step": 1097
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019820286414810772,
      "loss": 1.0515,
      "step": 1098
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019819956902484488,
      "loss": 1.0199,
      "step": 1099
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019819627091091676,
      "loss": 0.9387,
      "step": 1100
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019819296980642375,
      "loss": 1.0134,
      "step": 1101
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019818966571146646,
      "loss": 0.9808,
      "step": 1102
    },
    {
      "epoch": 0.24,
      "learning_rate": 0.00019818635862614548,
      "loss": 1.0903,
      "step": 1103
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019818304855056152,
      "loss": 0.8725,
      "step": 1104
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001981797354848154,
      "loss": 0.9302,
      "step": 1105
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019817641942900799,
      "loss": 1.0761,
      "step": 1106
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001981731003832403,
      "loss": 1.0344,
      "step": 1107
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019816977834761343,
      "loss": 0.9374,
      "step": 1108
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019816645332222855,
      "loss": 0.9979,
      "step": 1109
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019816312530718686,
      "loss": 0.9319,
      "step": 1110
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019815979430258982,
      "loss": 1.0336,
      "step": 1111
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001981564603085388,
      "loss": 1.0163,
      "step": 1112
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019815312332513533,
      "loss": 0.9566,
      "step": 1113
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001981497833524811,
      "loss": 0.9268,
      "step": 1114
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019814644039067777,
      "loss": 0.8686,
      "step": 1115
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001981430944398272,
      "loss": 0.9397,
      "step": 1116
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019813974550003126,
      "loss": 0.95,
      "step": 1117
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019813639357139196,
      "loss": 1.0146,
      "step": 1118
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019813303865401136,
      "loss": 1.0269,
      "step": 1119
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019812968074799163,
      "loss": 0.9968,
      "step": 1120
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019812631985343505,
      "loss": 1.087,
      "step": 1121
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019812295597044396,
      "loss": 1.0831,
      "step": 1122
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019811958909912085,
      "loss": 1.0811,
      "step": 1123
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019811621923956823,
      "loss": 1.019,
      "step": 1124
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001981128463918887,
      "loss": 0.9932,
      "step": 1125
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019810947055618502,
      "loss": 1.0653,
      "step": 1126
    },
    {
      "epoch": 0.25,
      "eval_loss": 0.6458216905593872,
      "eval_runtime": 322.1326,
      "eval_samples_per_second": 56.309,
      "eval_steps_per_second": 28.156,
      "step": 1126
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019810609173256,
      "loss": 1.013,
      "step": 1127
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019810270992111652,
      "loss": 1.0404,
      "step": 1128
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019809932512195762,
      "loss": 1.1174,
      "step": 1129
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001980959373351863,
      "loss": 1.0271,
      "step": 1130
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001980925465609058,
      "loss": 0.9896,
      "step": 1131
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019808915279921938,
      "loss": 0.9364,
      "step": 1132
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019808575605023037,
      "loss": 0.9742,
      "step": 1133
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019808235631404224,
      "loss": 0.9988,
      "step": 1134
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019807895359075852,
      "loss": 0.8774,
      "step": 1135
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019807554788048285,
      "loss": 1.009,
      "step": 1136
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019807213918331893,
      "loss": 1.0295,
      "step": 1137
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001980687274993706,
      "loss": 1.0025,
      "step": 1138
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019806531282874173,
      "loss": 0.9094,
      "step": 1139
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019806189517153634,
      "loss": 0.9804,
      "step": 1140
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001980584745278585,
      "loss": 1.0385,
      "step": 1141
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019805505089781243,
      "loss": 1.0444,
      "step": 1142
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001980516242815023,
      "loss": 1.0167,
      "step": 1143
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001980481946790326,
      "loss": 0.9822,
      "step": 1144
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019804476209050765,
      "loss": 0.9827,
      "step": 1145
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.00019804132651603205,
      "loss": 1.1233,
      "step": 1146
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001980378879557104,
      "loss": 0.9585,
      "step": 1147
    },
    {
      "epoch": 0.25,
      "learning_rate": 0.0001980344464096475,
      "loss": 1.0499,
      "step": 1148
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001980310018779481,
      "loss": 0.957,
      "step": 1149
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019802755436071706,
      "loss": 0.9713,
      "step": 1150
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019802410385805948,
      "loss": 1.0306,
      "step": 1151
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001980206503700804,
      "loss": 0.852,
      "step": 1152
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019801719389688492,
      "loss": 1.0416,
      "step": 1153
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001980137344385784,
      "loss": 1.0022,
      "step": 1154
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019801027199526616,
      "loss": 1.0526,
      "step": 1155
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019800680656705368,
      "loss": 0.9306,
      "step": 1156
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001980033381540465,
      "loss": 1.0885,
      "step": 1157
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019799986675635018,
      "loss": 1.0264,
      "step": 1158
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979963923740705,
      "loss": 1.0387,
      "step": 1159
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979929150073133,
      "loss": 0.9465,
      "step": 1160
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979894346561844,
      "loss": 1.0147,
      "step": 1161
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019798595132078988,
      "loss": 1.0763,
      "step": 1162
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019798246500123576,
      "loss": 0.9063,
      "step": 1163
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019797897569762824,
      "loss": 1.0094,
      "step": 1164
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019797548341007358,
      "loss": 1.104,
      "step": 1165
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019797198813867816,
      "loss": 1.1521,
      "step": 1166
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979684898835484,
      "loss": 0.9671,
      "step": 1167
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019796498864479086,
      "loss": 0.9293,
      "step": 1168
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019796148442251217,
      "loss": 1.079,
      "step": 1169
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019795797721681904,
      "loss": 0.8382,
      "step": 1170
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019795446702781827,
      "loss": 0.9261,
      "step": 1171
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979509538556168,
      "loss": 1.1614,
      "step": 1172
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979474377003216,
      "loss": 1.0681,
      "step": 1173
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019794391856203973,
      "loss": 0.8877,
      "step": 1174
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979403964408784,
      "loss": 0.9985,
      "step": 1175
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019793687133694488,
      "loss": 0.9788,
      "step": 1176
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019793334325034648,
      "loss": 1.0495,
      "step": 1177
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019792981218119075,
      "loss": 1.0016,
      "step": 1178
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979262781295851,
      "loss": 1.0966,
      "step": 1179
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019792274109563723,
      "loss": 1.0493,
      "step": 1180
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019791920107945486,
      "loss": 1.0164,
      "step": 1181
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.0001979156580811458,
      "loss": 1.0747,
      "step": 1182
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019791211210081793,
      "loss": 1.0193,
      "step": 1183
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019790856313857926,
      "loss": 1.0397,
      "step": 1184
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019790501119453785,
      "loss": 0.9759,
      "step": 1185
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019790145626880193,
      "loss": 0.9062,
      "step": 1186
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019789789836147968,
      "loss": 0.9514,
      "step": 1187
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019789433747267955,
      "loss": 1.0537,
      "step": 1188
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019789077360250992,
      "loss": 1.022,
      "step": 1189
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019788720675107934,
      "loss": 1.0396,
      "step": 1190
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019788363691849648,
      "loss": 1.1966,
      "step": 1191
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019788006410487,
      "loss": 1.0839,
      "step": 1192
    },
    {
      "epoch": 0.26,
      "learning_rate": 0.00019787648831030876,
      "loss": 1.0297,
      "step": 1193
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001978729095349216,
      "loss": 0.8893,
      "step": 1194
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019786932777881758,
      "loss": 1.0607,
      "step": 1195
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019786574304210577,
      "loss": 1.0131,
      "step": 1196
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001978621553248953,
      "loss": 1.0101,
      "step": 1197
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019785856462729544,
      "loss": 0.9938,
      "step": 1198
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001978549709494156,
      "loss": 1.1419,
      "step": 1199
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019785137429136515,
      "loss": 1.072,
      "step": 1200
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019784777465325367,
      "loss": 1.1039,
      "step": 1201
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001978441720351908,
      "loss": 0.9817,
      "step": 1202
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019784056643728623,
      "loss": 1.0424,
      "step": 1203
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001978369578596498,
      "loss": 0.9705,
      "step": 1204
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019783334630239137,
      "loss": 0.9256,
      "step": 1205
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019782973176562092,
      "loss": 1.0573,
      "step": 1206
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001978261142494486,
      "loss": 1.0502,
      "step": 1207
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001978224937539845,
      "loss": 0.9933,
      "step": 1208
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019781887027933893,
      "loss": 0.9134,
      "step": 1209
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019781524382562224,
      "loss": 1.018,
      "step": 1210
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019781161439294488,
      "loss": 1.0565,
      "step": 1211
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019780798198141734,
      "loss": 1.0935,
      "step": 1212
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019780434659115028,
      "loss": 1.017,
      "step": 1213
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019780070822225443,
      "loss": 0.9602,
      "step": 1214
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001977970668748406,
      "loss": 1.0691,
      "step": 1215
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019779342254901963,
      "loss": 1.0961,
      "step": 1216
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019778977524490253,
      "loss": 1.0147,
      "step": 1217
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019778612496260041,
      "loss": 0.8275,
      "step": 1218
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019778247170222442,
      "loss": 1.0408,
      "step": 1219
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019777881546388583,
      "loss": 1.0909,
      "step": 1220
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019777515624769598,
      "loss": 0.9587,
      "step": 1221
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001977714940537663,
      "loss": 0.9427,
      "step": 1222
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019776782888220835,
      "loss": 1.0976,
      "step": 1223
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019776416073313374,
      "loss": 1.0059,
      "step": 1224
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019776048960665416,
      "loss": 1.0359,
      "step": 1225
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019775681550288145,
      "loss": 0.9333,
      "step": 1226
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001977531384219275,
      "loss": 0.9798,
      "step": 1227
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019774945836390425,
      "loss": 0.9189,
      "step": 1228
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019774577532892385,
      "loss": 1.0546,
      "step": 1229
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.0001977420893170984,
      "loss": 0.9582,
      "step": 1230
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019773840032854018,
      "loss": 1.0674,
      "step": 1231
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019773470836336157,
      "loss": 1.0145,
      "step": 1232
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019773101342167497,
      "loss": 0.9535,
      "step": 1233
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019772731550359292,
      "loss": 0.9915,
      "step": 1234
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019772361460922803,
      "loss": 1.1071,
      "step": 1235
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019771991073869305,
      "loss": 1.1025,
      "step": 1236
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.00019771620389210073,
      "loss": 1.0098,
      "step": 1237
    },
    {
      "epoch": 0.27,
      "learning_rate": 0.000197712494069564,
      "loss": 0.9359,
      "step": 1238
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019770878127119582,
      "loss": 1.0237,
      "step": 1239
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001977050654971093,
      "loss": 0.9782,
      "step": 1240
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001977013467474175,
      "loss": 0.9479,
      "step": 1241
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001976976250222338,
      "loss": 1.0606,
      "step": 1242
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001976939003216715,
      "loss": 0.9307,
      "step": 1243
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019769017264584403,
      "loss": 1.0532,
      "step": 1244
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019768644199486487,
      "loss": 1.1023,
      "step": 1245
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019768270836884773,
      "loss": 0.9538,
      "step": 1246
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019767897176790626,
      "loss": 1.112,
      "step": 1247
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019767523219215428,
      "loss": 0.973,
      "step": 1248
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019767148964170567,
      "loss": 1.0029,
      "step": 1249
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019766774411667437,
      "loss": 0.9359,
      "step": 1250
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001976639956171745,
      "loss": 1.0382,
      "step": 1251
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019766024414332023,
      "loss": 1.0837,
      "step": 1252
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019765648969522577,
      "loss": 0.9508,
      "step": 1253
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019765273227300548,
      "loss": 0.9397,
      "step": 1254
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019764897187677378,
      "loss": 0.9292,
      "step": 1255
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019764520850664523,
      "loss": 0.9807,
      "step": 1256
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019764144216273438,
      "loss": 0.9729,
      "step": 1257
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019763767284515602,
      "loss": 1.0533,
      "step": 1258
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019763390055402486,
      "loss": 1.0428,
      "step": 1259
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019763012528945586,
      "loss": 0.96,
      "step": 1260
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019762634705156393,
      "loss": 1.1171,
      "step": 1261
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019762256584046414,
      "loss": 1.0264,
      "step": 1262
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001976187816562717,
      "loss": 1.1071,
      "step": 1263
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019761499449910184,
      "loss": 0.9712,
      "step": 1264
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019761120436906986,
      "loss": 1.0293,
      "step": 1265
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001976074112662912,
      "loss": 1.0252,
      "step": 1266
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019760361519088142,
      "loss": 1.1033,
      "step": 1267
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001975998161429561,
      "loss": 1.06,
      "step": 1268
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001975960141226309,
      "loss": 1.0415,
      "step": 1269
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001975922091300217,
      "loss": 0.9914,
      "step": 1270
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019758840116524434,
      "loss": 1.0785,
      "step": 1271
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019758459022841475,
      "loss": 0.9217,
      "step": 1272
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019758077631964902,
      "loss": 0.959,
      "step": 1273
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019757695943906333,
      "loss": 1.1044,
      "step": 1274
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001975731395867739,
      "loss": 1.0005,
      "step": 1275
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019756931676289706,
      "loss": 0.876,
      "step": 1276
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019756549096754925,
      "loss": 1.0194,
      "step": 1277
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019756166220084696,
      "loss": 1.1026,
      "step": 1278
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019755783046290678,
      "loss": 0.8739,
      "step": 1279
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019755399575384548,
      "loss": 1.1062,
      "step": 1280
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001975501580737798,
      "loss": 0.9815,
      "step": 1281
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.0001975463174228266,
      "loss": 1.0538,
      "step": 1282
    },
    {
      "epoch": 0.28,
      "learning_rate": 0.00019754247380110286,
      "loss": 0.9825,
      "step": 1283
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019753862720872564,
      "loss": 1.0056,
      "step": 1284
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.0001975347776458121,
      "loss": 1.0577,
      "step": 1285
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019753092511247945,
      "loss": 0.9718,
      "step": 1286
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019752706960884505,
      "loss": 1.1534,
      "step": 1287
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.0001975232111350263,
      "loss": 1.0929,
      "step": 1288
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.0001975193496911407,
      "loss": 0.9393,
      "step": 1289
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019751548527730588,
      "loss": 0.9626,
      "step": 1290
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019751161789363953,
      "loss": 0.9809,
      "step": 1291
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.0001975077475402594,
      "loss": 1.0173,
      "step": 1292
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019750387421728339,
      "loss": 0.9608,
      "step": 1293
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019749999792482943,
      "loss": 0.9963,
      "step": 1294
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019749611866301558,
      "loss": 1.0235,
      "step": 1295
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019749223643196001,
      "loss": 0.8684,
      "step": 1296
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019748835123178097,
      "loss": 1.0213,
      "step": 1297
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019748446306259673,
      "loss": 0.9439,
      "step": 1298
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.0001974805719245257,
      "loss": 0.9094,
      "step": 1299
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019747667781768645,
      "loss": 1.1409,
      "step": 1300
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019747278074219753,
      "loss": 0.9063,
      "step": 1301
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019746888069817762,
      "loss": 0.9754,
      "step": 1302
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019746497768574546,
      "loss": 1.0705,
      "step": 1303
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019746107170502003,
      "loss": 1.0137,
      "step": 1304
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019745716275612022,
      "loss": 1.14,
      "step": 1305
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019745325083916503,
      "loss": 1.0804,
      "step": 1306
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.0001974493359542737,
      "loss": 0.9778,
      "step": 1307
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019744541810156534,
      "loss": 1.0215,
      "step": 1308
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019744149728115936,
      "loss": 0.9585,
      "step": 1309
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019743757349317514,
      "loss": 1.0852,
      "step": 1310
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019743364673773217,
      "loss": 0.99,
      "step": 1311
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019742971701495004,
      "loss": 0.9094,
      "step": 1312
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019742578432494845,
      "loss": 1.1573,
      "step": 1313
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019742184866784713,
      "loss": 0.9559,
      "step": 1314
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.000197417910043766,
      "loss": 0.8975,
      "step": 1315
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019741396845282498,
      "loss": 0.932,
      "step": 1316
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019741002389514408,
      "loss": 0.9483,
      "step": 1317
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019740607637084345,
      "loss": 1.165,
      "step": 1318
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019740212588004337,
      "loss": 1.0803,
      "step": 1319
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019739817242286404,
      "loss": 0.8995,
      "step": 1320
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.000197394215999426,
      "loss": 0.9994,
      "step": 1321
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.0001973902566098496,
      "loss": 1.0449,
      "step": 1322
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019738629425425553,
      "loss": 0.9136,
      "step": 1323
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.0001973823289327644,
      "loss": 0.885,
      "step": 1324
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.000197378360645497,
      "loss": 1.1525,
      "step": 1325
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019737438939257417,
      "loss": 0.9678,
      "step": 1326
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019737041517411692,
      "loss": 1.0017,
      "step": 1327
    },
    {
      "epoch": 0.29,
      "learning_rate": 0.00019736643799024618,
      "loss": 1.0206,
      "step": 1328
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019736245784108313,
      "loss": 1.124,
      "step": 1329
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019735847472674903,
      "loss": 0.9775,
      "step": 1330
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.0001973544886473651,
      "loss": 1.0115,
      "step": 1331
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019735049960305278,
      "loss": 1.0099,
      "step": 1332
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019734650759393354,
      "loss": 1.135,
      "step": 1333
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019734251262012897,
      "loss": 0.9436,
      "step": 1334
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019733851468176075,
      "loss": 0.8519,
      "step": 1335
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.0001973345137789506,
      "loss": 0.9857,
      "step": 1336
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019733050991182038,
      "loss": 0.9064,
      "step": 1337
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019732650308049206,
      "loss": 0.9914,
      "step": 1338
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019732249328508763,
      "loss": 1.0434,
      "step": 1339
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019731848052572924,
      "loss": 0.9497,
      "step": 1340
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019731446480253907,
      "loss": 0.9168,
      "step": 1341
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019731044611563943,
      "loss": 0.9966,
      "step": 1342
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019730642446515268,
      "loss": 0.8687,
      "step": 1343
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019730239985120136,
      "loss": 0.944,
      "step": 1344
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019729837227390798,
      "loss": 1.0491,
      "step": 1345
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019729434173339526,
      "loss": 1.1477,
      "step": 1346
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019729030822978588,
      "loss": 1.0057,
      "step": 1347
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019728627176320273,
      "loss": 1.0034,
      "step": 1348
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019728223233376875,
      "loss": 0.8945,
      "step": 1349
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.0001972781899416069,
      "loss": 1.0753,
      "step": 1350
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019727414458684038,
      "loss": 1.1841,
      "step": 1351
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019727009626959227,
      "loss": 0.8942,
      "step": 1352
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019726604498998597,
      "loss": 0.9882,
      "step": 1353
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019726199074814483,
      "loss": 1.024,
      "step": 1354
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.0001972579335441923,
      "loss": 1.0994,
      "step": 1355
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019725387337825195,
      "loss": 0.8449,
      "step": 1356
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019724981025044747,
      "loss": 0.8734,
      "step": 1357
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019724574416090252,
      "loss": 1.0882,
      "step": 1358
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019724167510974105,
      "loss": 1.0129,
      "step": 1359
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019723760309708687,
      "loss": 1.0387,
      "step": 1360
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019723352812306405,
      "loss": 0.8313,
      "step": 1361
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.0001972294501877967,
      "loss": 0.9917,
      "step": 1362
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019722536929140896,
      "loss": 1.0526,
      "step": 1363
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019722128543402519,
      "loss": 1.0659,
      "step": 1364
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019721719861576968,
      "loss": 1.0207,
      "step": 1365
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019721310883676697,
      "loss": 1.0478,
      "step": 1366
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.0001972090160971416,
      "loss": 1.0374,
      "step": 1367
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019720492039701815,
      "loss": 1.0496,
      "step": 1368
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.0001972008217365214,
      "loss": 0.9543,
      "step": 1369
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019719672011577624,
      "loss": 1.0109,
      "step": 1370
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019719261553490747,
      "loss": 0.8756,
      "step": 1371
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019718850799404014,
      "loss": 0.952,
      "step": 1372
    },
    {
      "epoch": 0.3,
      "learning_rate": 0.00019718439749329939,
      "loss": 0.9912,
      "step": 1373
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001971802840328103,
      "loss": 1.0178,
      "step": 1374
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019717616761269827,
      "loss": 0.9533,
      "step": 1375
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019717204823308857,
      "loss": 0.9176,
      "step": 1376
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001971679258941067,
      "loss": 0.9217,
      "step": 1377
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001971638005958782,
      "loss": 1.1175,
      "step": 1378
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001971596723385287,
      "loss": 0.8889,
      "step": 1379
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019715554112218395,
      "loss": 1.0608,
      "step": 1380
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019715140694696973,
      "loss": 1.0611,
      "step": 1381
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019714726981301194,
      "loss": 1.0285,
      "step": 1382
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019714312972043664,
      "loss": 0.9093,
      "step": 1383
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019713898666936985,
      "loss": 0.999,
      "step": 1384
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019713484065993778,
      "loss": 0.9887,
      "step": 1385
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019713069169226665,
      "loss": 1.0372,
      "step": 1386
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001971265397664829,
      "loss": 0.9563,
      "step": 1387
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019712238488271293,
      "loss": 1.0251,
      "step": 1388
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019711822704108326,
      "loss": 1.0673,
      "step": 1389
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019711406624172052,
      "loss": 1.0352,
      "step": 1390
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019710990248475145,
      "loss": 0.9455,
      "step": 1391
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019710573577030286,
      "loss": 1.0673,
      "step": 1392
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019710156609850163,
      "loss": 1.0922,
      "step": 1393
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019709739346947478,
      "loss": 1.0051,
      "step": 1394
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019709321788334932,
      "loss": 1.0885,
      "step": 1395
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019708903934025247,
      "loss": 0.9765,
      "step": 1396
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019708485784031147,
      "loss": 1.0529,
      "step": 1397
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001970806733836537,
      "loss": 1.0696,
      "step": 1398
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019707648597040654,
      "loss": 0.9379,
      "step": 1399
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019707229560069758,
      "loss": 1.023,
      "step": 1400
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019706810227465438,
      "loss": 0.9125,
      "step": 1401
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019706390599240464,
      "loss": 1.0675,
      "step": 1402
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019705970675407627,
      "loss": 0.967,
      "step": 1403
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.000197055504559797,
      "loss": 0.9768,
      "step": 1404
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019705129940969493,
      "loss": 1.0636,
      "step": 1405
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019704709130389806,
      "loss": 1.1519,
      "step": 1406
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001970428802425346,
      "loss": 1.1784,
      "step": 1407
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019703866622573278,
      "loss": 1.0678,
      "step": 1408
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001970344492536209,
      "loss": 0.8472,
      "step": 1409
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001970302293263274,
      "loss": 1.0692,
      "step": 1410
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019702600644398084,
      "loss": 0.9448,
      "step": 1411
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001970217806067098,
      "loss": 1.0172,
      "step": 1412
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019701755181464296,
      "loss": 0.974,
      "step": 1413
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019701332006790914,
      "loss": 0.9249,
      "step": 1414
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019700908536663718,
      "loss": 1.1123,
      "step": 1415
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019700484771095612,
      "loss": 0.9914,
      "step": 1416
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.00019700060710099493,
      "loss": 0.9629,
      "step": 1417
    },
    {
      "epoch": 0.31,
      "learning_rate": 0.0001969963635368828,
      "loss": 1.0224,
      "step": 1418
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019699211701874897,
      "loss": 0.9559,
      "step": 1419
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019698786754672275,
      "loss": 1.0419,
      "step": 1420
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001969836151209336,
      "loss": 0.9267,
      "step": 1421
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019697935974151095,
      "loss": 0.9454,
      "step": 1422
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001969751014085845,
      "loss": 0.8974,
      "step": 1423
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019697084012228384,
      "loss": 0.9413,
      "step": 1424
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019696657588273882,
      "loss": 0.8866,
      "step": 1425
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019696230869007927,
      "loss": 0.963,
      "step": 1426
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019695803854443512,
      "loss": 0.8956,
      "step": 1427
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001969537654459365,
      "loss": 1.1471,
      "step": 1428
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019694948939471345,
      "loss": 0.9075,
      "step": 1429
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001969452103908963,
      "loss": 0.9452,
      "step": 1430
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019694092843461526,
      "loss": 1.0637,
      "step": 1431
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001969366435260008,
      "loss": 1.0232,
      "step": 1432
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019693235566518343,
      "loss": 0.9828,
      "step": 1433
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019692806485229367,
      "loss": 0.9481,
      "step": 1434
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001969237710874623,
      "loss": 1.0264,
      "step": 1435
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019691947437081996,
      "loss": 1.1061,
      "step": 1436
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019691517470249762,
      "loss": 1.15,
      "step": 1437
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019691087208262615,
      "loss": 0.9823,
      "step": 1438
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019690656651133662,
      "loss": 1.004,
      "step": 1439
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019690225798876018,
      "loss": 0.9444,
      "step": 1440
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019689794651502797,
      "loss": 1.0062,
      "step": 1441
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019689363209027136,
      "loss": 1.0116,
      "step": 1442
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019688931471462175,
      "loss": 0.9236,
      "step": 1443
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001968849943882106,
      "loss": 0.9827,
      "step": 1444
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019688067111116946,
      "loss": 1.0205,
      "step": 1445
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019687634488363003,
      "loss": 0.9782,
      "step": 1446
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019687201570572408,
      "loss": 0.8711,
      "step": 1447
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019686768357758344,
      "loss": 0.9695,
      "step": 1448
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019686334849933998,
      "loss": 0.9145,
      "step": 1449
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019685901047112586,
      "loss": 0.9815,
      "step": 1450
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019685466949307306,
      "loss": 1.1415,
      "step": 1451
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001968503255653139,
      "loss": 0.9481,
      "step": 1452
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019684597868798055,
      "loss": 0.9759,
      "step": 1453
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001968416288612055,
      "loss": 0.9475,
      "step": 1454
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019683727608512118,
      "loss": 0.9635,
      "step": 1455
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019683292035986016,
      "loss": 1.0146,
      "step": 1456
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.0001968285616855551,
      "loss": 1.0728,
      "step": 1457
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019682420006233872,
      "loss": 0.8355,
      "step": 1458
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019681983549034386,
      "loss": 0.956,
      "step": 1459
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019681546796970347,
      "loss": 0.9992,
      "step": 1460
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019681109750055054,
      "loss": 0.942,
      "step": 1461
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019680672408301818,
      "loss": 1.048,
      "step": 1462
    },
    {
      "epoch": 0.32,
      "learning_rate": 0.00019680234771723957,
      "loss": 0.9354,
      "step": 1463
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019679796840334798,
      "loss": 0.9411,
      "step": 1464
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019679358614147684,
      "loss": 0.927,
      "step": 1465
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019678920093175957,
      "loss": 1.0458,
      "step": 1466
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019678481277432972,
      "loss": 0.9623,
      "step": 1467
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019678042166932093,
      "loss": 0.9233,
      "step": 1468
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019677602761686695,
      "loss": 1.0088,
      "step": 1469
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019677163061710158,
      "loss": 1.136,
      "step": 1470
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019676723067015874,
      "loss": 1.0234,
      "step": 1471
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019676282777617243,
      "loss": 0.9899,
      "step": 1472
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019675842193527676,
      "loss": 0.9173,
      "step": 1473
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019675401314760585,
      "loss": 1.0632,
      "step": 1474
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019674960141329403,
      "loss": 0.8498,
      "step": 1475
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019674518673247566,
      "loss": 0.8948,
      "step": 1476
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019674076910528512,
      "loss": 1.1067,
      "step": 1477
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019673634853185703,
      "loss": 0.9819,
      "step": 1478
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019673192501232597,
      "loss": 1.0361,
      "step": 1479
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019672749854682668,
      "loss": 1.0425,
      "step": 1480
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019672306913549395,
      "loss": 1.0728,
      "step": 1481
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019671863677846272,
      "loss": 1.0487,
      "step": 1482
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019671420147586793,
      "loss": 1.0726,
      "step": 1483
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019670976322784466,
      "loss": 0.9753,
      "step": 1484
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019670532203452807,
      "loss": 1.1,
      "step": 1485
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019670087789605347,
      "loss": 0.985,
      "step": 1486
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019669643081255618,
      "loss": 0.9659,
      "step": 1487
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.0001966919807841716,
      "loss": 0.9233,
      "step": 1488
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.0001966875278110353,
      "loss": 1.0733,
      "step": 1489
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019668307189328287,
      "loss": 1.0862,
      "step": 1490
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019667861303105,
      "loss": 0.9761,
      "step": 1491
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019667415122447254,
      "loss": 0.9947,
      "step": 1492
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019666968647368634,
      "loss": 1.0064,
      "step": 1493
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019666521877882739,
      "loss": 0.9614,
      "step": 1494
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.0001966607481400317,
      "loss": 0.9493,
      "step": 1495
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019665627455743548,
      "loss": 0.9113,
      "step": 1496
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019665179803117497,
      "loss": 0.9826,
      "step": 1497
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019664731856138646,
      "loss": 1.026,
      "step": 1498
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.0001966428361482064,
      "loss": 1.1172,
      "step": 1499
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019663835079177132,
      "loss": 1.1311,
      "step": 1500
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.0001966338624922178,
      "loss": 0.9591,
      "step": 1501
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019662937124968256,
      "loss": 0.9262,
      "step": 1502
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.0001966248770643023,
      "loss": 0.9298,
      "step": 1503
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019662037993621397,
      "loss": 1.0763,
      "step": 1504
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019661587986555452,
      "loss": 0.9608,
      "step": 1505
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019661137685246099,
      "loss": 0.9408,
      "step": 1506
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.0001966068708970705,
      "loss": 1.0412,
      "step": 1507
    },
    {
      "epoch": 0.33,
      "learning_rate": 0.00019660236199952027,
      "loss": 0.9908,
      "step": 1508
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019659785015994764,
      "loss": 1.0444,
      "step": 1509
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019659333537849004,
      "loss": 0.9983,
      "step": 1510
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019658881765528493,
      "loss": 1.1155,
      "step": 1511
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019658429699046995,
      "loss": 0.9031,
      "step": 1512
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965797733841827,
      "loss": 0.992,
      "step": 1513
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.000196575246836561,
      "loss": 0.9759,
      "step": 1514
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019657071734774273,
      "loss": 1.0204,
      "step": 1515
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019656618491786576,
      "loss": 1.0843,
      "step": 1516
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019656164954706817,
      "loss": 0.9311,
      "step": 1517
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965571112354881,
      "loss": 0.9147,
      "step": 1518
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019655256998326367,
      "loss": 1.0539,
      "step": 1519
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965480257905333,
      "loss": 1.0225,
      "step": 1520
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019654347865743533,
      "loss": 1.0792,
      "step": 1521
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965389285841083,
      "loss": 1.0285,
      "step": 1522
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019653437557069068,
      "loss": 1.0676,
      "step": 1523
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965298196173212,
      "loss": 1.0892,
      "step": 1524
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965252607241386,
      "loss": 1.0275,
      "step": 1525
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965206988912817,
      "loss": 0.9334,
      "step": 1526
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019651613411888948,
      "loss": 1.0616,
      "step": 1527
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965115664071009,
      "loss": 0.9615,
      "step": 1528
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965069957560551,
      "loss": 1.0959,
      "step": 1529
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001965024221658913,
      "loss": 1.0427,
      "step": 1530
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019649784563674876,
      "loss": 0.9417,
      "step": 1531
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019649326616876685,
      "loss": 0.9956,
      "step": 1532
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019648868376208507,
      "loss": 0.9876,
      "step": 1533
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019648409841684295,
      "loss": 0.9277,
      "step": 1534
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019647951013318014,
      "loss": 1.0295,
      "step": 1535
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019647491891123639,
      "loss": 1.0309,
      "step": 1536
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001964703247511515,
      "loss": 1.0077,
      "step": 1537
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019646572765306543,
      "loss": 0.9986,
      "step": 1538
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019646112761711811,
      "loss": 1.0166,
      "step": 1539
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019645652464344971,
      "loss": 0.9826,
      "step": 1540
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001964519187322004,
      "loss": 0.9504,
      "step": 1541
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001964473098835104,
      "loss": 0.9352,
      "step": 1542
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019644269809752015,
      "loss": 1.091,
      "step": 1543
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019643808337437005,
      "loss": 0.9047,
      "step": 1544
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019643346571420064,
      "loss": 1.0838,
      "step": 1545
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019642884511715254,
      "loss": 1.0321,
      "step": 1546
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019642422158336654,
      "loss": 0.9503,
      "step": 1547
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001964195951129834,
      "loss": 0.9154,
      "step": 1548
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019641496570614396,
      "loss": 1.0417,
      "step": 1549
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019641033336298934,
      "loss": 1.0016,
      "step": 1550
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001964056980836605,
      "loss": 1.1161,
      "step": 1551
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.00019640105986829868,
      "loss": 0.9547,
      "step": 1552
    },
    {
      "epoch": 0.34,
      "learning_rate": 0.0001963964187170451,
      "loss": 0.9992,
      "step": 1553
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019639177463004113,
      "loss": 0.9966,
      "step": 1554
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.0001963871276074282,
      "loss": 0.9506,
      "step": 1555
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019638247764934777,
      "loss": 0.9461,
      "step": 1556
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019637782475594157,
      "loss": 1.0335,
      "step": 1557
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019637316892735126,
      "loss": 1.0184,
      "step": 1558
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019636851016371858,
      "loss": 0.8883,
      "step": 1559
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019636384846518547,
      "loss": 0.9465,
      "step": 1560
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.0001963591838318939,
      "loss": 1.0045,
      "step": 1561
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.0001963545162639859,
      "loss": 1.1091,
      "step": 1562
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019634984576160361,
      "loss": 0.9972,
      "step": 1563
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019634517232488933,
      "loss": 0.9527,
      "step": 1564
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019634049595398533,
      "loss": 0.9381,
      "step": 1565
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019633581664903408,
      "loss": 1.163,
      "step": 1566
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019633113441017806,
      "loss": 0.8677,
      "step": 1567
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019632644923755986,
      "loss": 0.9472,
      "step": 1568
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019632176113132217,
      "loss": 1.0003,
      "step": 1569
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019631707009160778,
      "loss": 0.9905,
      "step": 1570
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019631237611855956,
      "loss": 0.9636,
      "step": 1571
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019630767921232045,
      "loss": 1.0619,
      "step": 1572
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019630297937303347,
      "loss": 0.9904,
      "step": 1573
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.0001962982766008418,
      "loss": 0.8911,
      "step": 1574
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019629357089588864,
      "loss": 0.9798,
      "step": 1575
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019628886225831732,
      "loss": 0.9763,
      "step": 1576
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.0001962841506882712,
      "loss": 1.0315,
      "step": 1577
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019627943618589385,
      "loss": 0.9111,
      "step": 1578
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019627471875132874,
      "loss": 1.0051,
      "step": 1579
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019626999838471965,
      "loss": 1.0039,
      "step": 1580
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019626527508621023,
      "loss": 1.0194,
      "step": 1581
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.0001962605488559444,
      "loss": 1.1598,
      "step": 1582
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019625581969406612,
      "loss": 0.8454,
      "step": 1583
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019625108760071936,
      "loss": 1.0626,
      "step": 1584
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.0001962463525760482,
      "loss": 1.0466,
      "step": 1585
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019624161462019696,
      "loss": 1.1413,
      "step": 1586
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019623687373330985,
      "loss": 0.9904,
      "step": 1587
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019623212991553128,
      "loss": 0.9809,
      "step": 1588
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019622738316700574,
      "loss": 1.0385,
      "step": 1589
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019622263348787776,
      "loss": 1.1696,
      "step": 1590
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019621788087829196,
      "loss": 1.0724,
      "step": 1591
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019621312533839316,
      "loss": 1.0216,
      "step": 1592
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019620836686832615,
      "loss": 0.9404,
      "step": 1593
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019620360546823587,
      "loss": 0.9555,
      "step": 1594
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019619884113826727,
      "loss": 0.9024,
      "step": 1595
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019619407387856552,
      "loss": 1.203,
      "step": 1596
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.00019618930368927578,
      "loss": 0.8759,
      "step": 1597
    },
    {
      "epoch": 0.35,
      "learning_rate": 0.0001961845305705433,
      "loss": 1.063,
      "step": 1598
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019617975452251347,
      "loss": 0.9876,
      "step": 1599
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019617497554533174,
      "loss": 0.8945,
      "step": 1600
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019617019363914366,
      "loss": 0.868,
      "step": 1601
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019616540880409484,
      "loss": 0.9972,
      "step": 1602
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019616062104033105,
      "loss": 1.0123,
      "step": 1603
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019615583034799804,
      "loss": 0.9405,
      "step": 1604
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019615103672724176,
      "loss": 0.9357,
      "step": 1605
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019614624017820815,
      "loss": 1.0716,
      "step": 1606
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019614144070104333,
      "loss": 0.9732,
      "step": 1607
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019613663829589348,
      "loss": 1.002,
      "step": 1608
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019613183296290484,
      "loss": 0.8887,
      "step": 1609
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019612702470222373,
      "loss": 1.086,
      "step": 1610
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019612221351399662,
      "loss": 0.9211,
      "step": 1611
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019611739939837,
      "loss": 1.121,
      "step": 1612
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.0001961125823554905,
      "loss": 1.1447,
      "step": 1613
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019610776238550485,
      "loss": 0.9142,
      "step": 1614
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.0001961029394885598,
      "loss": 0.8862,
      "step": 1615
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019609811366480225,
      "loss": 0.9412,
      "step": 1616
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.0001960932849143792,
      "loss": 1.0139,
      "step": 1617
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019608845323743765,
      "loss": 0.9604,
      "step": 1618
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019608361863412478,
      "loss": 0.9842,
      "step": 1619
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019607878110458783,
      "loss": 0.9519,
      "step": 1620
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019607394064897416,
      "loss": 0.9162,
      "step": 1621
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.0001960690972674311,
      "loss": 1.101,
      "step": 1622
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019606425096010624,
      "loss": 1.0219,
      "step": 1623
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.0001960594017271471,
      "loss": 1.0355,
      "step": 1624
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019605454956870145,
      "loss": 1.0514,
      "step": 1625
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019604969448491695,
      "loss": 1.0456,
      "step": 1626
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019604483647594155,
      "loss": 0.9415,
      "step": 1627
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019603997554192321,
      "loss": 1.0404,
      "step": 1628
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019603511168300993,
      "loss": 1.0897,
      "step": 1629
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.0001960302448993498,
      "loss": 0.9752,
      "step": 1630
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019602537519109112,
      "loss": 0.949,
      "step": 1631
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019602050255838215,
      "loss": 1.013,
      "step": 1632
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019601562700137127,
      "loss": 1.0755,
      "step": 1633
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019601074852020704,
      "loss": 0.9366,
      "step": 1634
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019600586711503794,
      "loss": 1.0683,
      "step": 1635
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019600098278601272,
      "loss": 1.0545,
      "step": 1636
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019599609553328006,
      "loss": 0.8883,
      "step": 1637
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019599120535698883,
      "loss": 0.9779,
      "step": 1638
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019598631225728794,
      "loss": 1.0288,
      "step": 1639
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019598141623432643,
      "loss": 0.838,
      "step": 1640
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019597651728825346,
      "loss": 1.0169,
      "step": 1641
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.00019597161541921813,
      "loss": 1.1296,
      "step": 1642
    },
    {
      "epoch": 0.36,
      "learning_rate": 0.0001959667106273698,
      "loss": 1.0205,
      "step": 1643
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019596180291285779,
      "loss": 1.0153,
      "step": 1644
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001959568922758316,
      "loss": 0.9956,
      "step": 1645
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019595197871644077,
      "loss": 1.0087,
      "step": 1646
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019594706223483496,
      "loss": 0.969,
      "step": 1647
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001959421428311639,
      "loss": 1.1736,
      "step": 1648
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001959372205055774,
      "loss": 1.0379,
      "step": 1649
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019593229525822532,
      "loss": 0.8886,
      "step": 1650
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019592736708925774,
      "loss": 0.9927,
      "step": 1651
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001959224359988247,
      "loss": 0.9186,
      "step": 1652
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019591750198707638,
      "loss": 1.1012,
      "step": 1653
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001959125650541631,
      "loss": 0.9053,
      "step": 1654
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001959076252002351,
      "loss": 0.9142,
      "step": 1655
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019590268242544297,
      "loss": 1.0965,
      "step": 1656
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001958977367299371,
      "loss": 1.0845,
      "step": 1657
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019589278811386822,
      "loss": 1.1324,
      "step": 1658
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019588783657738696,
      "loss": 1.0222,
      "step": 1659
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019588288212064417,
      "loss": 1.0235,
      "step": 1660
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019587792474379072,
      "loss": 0.9914,
      "step": 1661
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001958729644469776,
      "loss": 1.0821,
      "step": 1662
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019586800123035585,
      "loss": 0.8003,
      "step": 1663
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019586303509407663,
      "loss": 1.0425,
      "step": 1664
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001958580660382912,
      "loss": 1.0471,
      "step": 1665
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001958530940631509,
      "loss": 1.0131,
      "step": 1666
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019584811916880713,
      "loss": 1.0109,
      "step": 1667
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001958431413554114,
      "loss": 1.1009,
      "step": 1668
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001958381606231153,
      "loss": 1.0177,
      "step": 1669
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019583317697207056,
      "loss": 1.0699,
      "step": 1670
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019582819040242893,
      "loss": 1.0272,
      "step": 1671
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019582320091434226,
      "loss": 1.0114,
      "step": 1672
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019581820850796252,
      "loss": 1.0215,
      "step": 1673
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019581321318344177,
      "loss": 0.969,
      "step": 1674
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001958082149409321,
      "loss": 1.0669,
      "step": 1675
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001958032137805858,
      "loss": 0.9692,
      "step": 1676
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001957982097025551,
      "loss": 1.0718,
      "step": 1677
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019579320270699245,
      "loss": 0.8677,
      "step": 1678
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019578819279405035,
      "loss": 0.8024,
      "step": 1679
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019578317996388133,
      "loss": 1.0551,
      "step": 1680
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019577816421663809,
      "loss": 1.0642,
      "step": 1681
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019577314555247334,
      "loss": 1.0526,
      "step": 1682
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019576812397154,
      "loss": 0.9721,
      "step": 1683
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019576309947399095,
      "loss": 0.963,
      "step": 1684
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001957580720599792,
      "loss": 1.1111,
      "step": 1685
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001957530417296579,
      "loss": 1.0044,
      "step": 1686
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.0001957480084831802,
      "loss": 1.0441,
      "step": 1687
    },
    {
      "epoch": 0.37,
      "learning_rate": 0.00019574297232069943,
      "loss": 0.9566,
      "step": 1688
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019573793324236896,
      "loss": 0.9976,
      "step": 1689
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019573289124834222,
      "loss": 0.8713,
      "step": 1690
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019572784633877278,
      "loss": 0.8668,
      "step": 1691
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019572279851381435,
      "loss": 0.9325,
      "step": 1692
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019571774777362054,
      "loss": 0.9455,
      "step": 1693
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019571269411834528,
      "loss": 0.9559,
      "step": 1694
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019570763754814244,
      "loss": 0.9043,
      "step": 1695
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019570257806316596,
      "loss": 0.9645,
      "step": 1696
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019569751566357002,
      "loss": 1.0774,
      "step": 1697
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019569245034950874,
      "loss": 0.9029,
      "step": 1698
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019568738212113638,
      "loss": 1.048,
      "step": 1699
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019568231097860731,
      "loss": 1.0559,
      "step": 1700
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.000195677236922076,
      "loss": 0.9535,
      "step": 1701
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019567215995169694,
      "loss": 1.0015,
      "step": 1702
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019566708006762474,
      "loss": 1.0181,
      "step": 1703
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019566199727001415,
      "loss": 1.0748,
      "step": 1704
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019565691155901992,
      "loss": 1.0213,
      "step": 1705
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.000195651822934797,
      "loss": 0.9629,
      "step": 1706
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001956467313975003,
      "loss": 1.0426,
      "step": 1707
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019564163694728488,
      "loss": 1.0839,
      "step": 1708
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019563653958430596,
      "loss": 1.0829,
      "step": 1709
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001956314393087187,
      "loss": 0.956,
      "step": 1710
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019562633612067848,
      "loss": 0.9292,
      "step": 1711
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001956212300203407,
      "loss": 1.0063,
      "step": 1712
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001956161210078609,
      "loss": 1.0009,
      "step": 1713
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001956110090833946,
      "loss": 1.0045,
      "step": 1714
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019560589424709758,
      "loss": 1.0134,
      "step": 1715
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019560077649912548,
      "loss": 1.1471,
      "step": 1716
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001955956558396343,
      "loss": 0.9803,
      "step": 1717
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019559053226877993,
      "loss": 0.9824,
      "step": 1718
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001955854057867184,
      "loss": 0.8947,
      "step": 1719
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019558027639360583,
      "loss": 1.0805,
      "step": 1720
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019557514408959849,
      "loss": 1.0106,
      "step": 1721
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001955700088748526,
      "loss": 1.0236,
      "step": 1722
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001955648707495246,
      "loss": 0.9592,
      "step": 1723
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.000195559729713771,
      "loss": 0.9746,
      "step": 1724
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019555458576774832,
      "loss": 1.0433,
      "step": 1725
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019554943891161327,
      "loss": 1.0068,
      "step": 1726
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019554428914552254,
      "loss": 0.8476,
      "step": 1727
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019553913646963298,
      "loss": 0.9837,
      "step": 1728
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019553398088410155,
      "loss": 0.9876,
      "step": 1729
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001955288223890852,
      "loss": 1.0296,
      "step": 1730
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001955236609847411,
      "loss": 0.968,
      "step": 1731
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.0001955184966712264,
      "loss": 0.9475,
      "step": 1732
    },
    {
      "epoch": 0.38,
      "learning_rate": 0.00019551332944869843,
      "loss": 0.8768,
      "step": 1733
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019550815931731447,
      "loss": 0.9493,
      "step": 1734
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019550298627723207,
      "loss": 0.9682,
      "step": 1735
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001954978103286087,
      "loss": 0.9827,
      "step": 1736
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019549263147160205,
      "loss": 1.0409,
      "step": 1737
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019548744970636977,
      "loss": 0.9936,
      "step": 1738
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019548226503306973,
      "loss": 1.0536,
      "step": 1739
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019547707745185984,
      "loss": 1.0944,
      "step": 1740
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019547188696289805,
      "loss": 0.9744,
      "step": 1741
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019546669356634245,
      "loss": 0.9646,
      "step": 1742
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001954614972623512,
      "loss": 0.871,
      "step": 1743
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019545629805108253,
      "loss": 1.0702,
      "step": 1744
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019545109593269484,
      "loss": 1.1104,
      "step": 1745
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019544589090734652,
      "loss": 0.9915,
      "step": 1746
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001954406829751961,
      "loss": 1.0264,
      "step": 1747
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019543547213640217,
      "loss": 1.0519,
      "step": 1748
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019543025839112348,
      "loss": 1.0043,
      "step": 1749
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019542504173951874,
      "loss": 0.8847,
      "step": 1750
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019541982218174685,
      "loss": 0.9636,
      "step": 1751
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001954145997179668,
      "loss": 1.091,
      "step": 1752
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001954093743483376,
      "loss": 0.9883,
      "step": 1753
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019540414607301844,
      "loss": 1.1087,
      "step": 1754
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019539891489216854,
      "loss": 1.0549,
      "step": 1755
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001953936808059471,
      "loss": 0.9007,
      "step": 1756
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019538844381451368,
      "loss": 0.9976,
      "step": 1757
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001953832039180277,
      "loss": 0.9706,
      "step": 1758
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019537796111664875,
      "loss": 0.9058,
      "step": 1759
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019537271541053647,
      "loss": 0.9094,
      "step": 1760
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019536746679985067,
      "loss": 1.0567,
      "step": 1761
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019536221528475118,
      "loss": 1.0348,
      "step": 1762
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019535696086539793,
      "loss": 1.0565,
      "step": 1763
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001953517035419509,
      "loss": 1.0954,
      "step": 1764
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019534644331457027,
      "loss": 0.9448,
      "step": 1765
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.0001953411801834162,
      "loss": 0.9476,
      "step": 1766
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.000195335914148649,
      "loss": 0.9789,
      "step": 1767
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019533064521042902,
      "loss": 0.9989,
      "step": 1768
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019532537336891678,
      "loss": 0.9726,
      "step": 1769
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019532009862427275,
      "loss": 1.0339,
      "step": 1770
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019531482097665762,
      "loss": 1.0733,
      "step": 1771
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019530954042623218,
      "loss": 1.0103,
      "step": 1772
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019530425697315712,
      "loss": 1.0745,
      "step": 1773
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019529897061759343,
      "loss": 1.014,
      "step": 1774
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019529368135970211,
      "loss": 0.9996,
      "step": 1775
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019528838919964422,
      "loss": 0.9314,
      "step": 1776
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019528309413758096,
      "loss": 1.0313,
      "step": 1777
    },
    {
      "epoch": 0.39,
      "learning_rate": 0.00019527779617367353,
      "loss": 0.9903,
      "step": 1778
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019527249530808334,
      "loss": 0.9942,
      "step": 1779
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001952671915409718,
      "loss": 1.0443,
      "step": 1780
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019526188487250043,
      "loss": 1.0099,
      "step": 1781
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019525657530283086,
      "loss": 0.9789,
      "step": 1782
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019525126283212482,
      "loss": 1.0524,
      "step": 1783
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019524594746054403,
      "loss": 1.0136,
      "step": 1784
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019524062918825044,
      "loss": 0.8856,
      "step": 1785
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019523530801540594,
      "loss": 0.9423,
      "step": 1786
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001952299839421727,
      "loss": 0.9743,
      "step": 1787
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019522465696871275,
      "loss": 0.9357,
      "step": 1788
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001952193270951884,
      "loss": 0.8932,
      "step": 1789
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019521399432176193,
      "loss": 1.1029,
      "step": 1790
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019520865864859578,
      "loss": 0.9825,
      "step": 1791
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019520332007585237,
      "loss": 0.9014,
      "step": 1792
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019519797860369443,
      "loss": 1.0615,
      "step": 1793
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019519263423228449,
      "loss": 0.9983,
      "step": 1794
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019518728696178538,
      "loss": 0.9242,
      "step": 1795
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019518193679235997,
      "loss": 1.0737,
      "step": 1796
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019517658372417116,
      "loss": 1.0253,
      "step": 1797
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019517122775738197,
      "loss": 1.0227,
      "step": 1798
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019516586889215556,
      "loss": 0.9281,
      "step": 1799
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019516050712865512,
      "loss": 0.8593,
      "step": 1800
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001951551424670439,
      "loss": 1.1585,
      "step": 1801
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019514977490748536,
      "loss": 1.0935,
      "step": 1802
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019514440445014288,
      "loss": 0.9704,
      "step": 1803
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019513903109518008,
      "loss": 1.1091,
      "step": 1804
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019513365484276056,
      "loss": 0.9114,
      "step": 1805
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001951282756930481,
      "loss": 0.8545,
      "step": 1806
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019512289364620653,
      "loss": 1.0773,
      "step": 1807
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001951175087023997,
      "loss": 0.9429,
      "step": 1808
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019511212086179163,
      "loss": 1.0488,
      "step": 1809
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019510673012454645,
      "loss": 1.0435,
      "step": 1810
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019510133649082824,
      "loss": 0.8364,
      "step": 1811
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019509593996080136,
      "loss": 0.9923,
      "step": 1812
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001950905405346301,
      "loss": 1.0052,
      "step": 1813
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019508513821247898,
      "loss": 1.015,
      "step": 1814
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019507973299451244,
      "loss": 1.0449,
      "step": 1815
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019507432488089513,
      "loss": 1.1019,
      "step": 1816
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019506891387179173,
      "loss": 1.0237,
      "step": 1817
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019506349996736705,
      "loss": 0.9909,
      "step": 1818
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019505808316778601,
      "loss": 1.036,
      "step": 1819
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019505266347321355,
      "loss": 0.8712,
      "step": 1820
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019504724088381466,
      "loss": 0.9092,
      "step": 1821
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001950418153997546,
      "loss": 1.0169,
      "step": 1822
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.0001950363870211985,
      "loss": 1.1006,
      "step": 1823
    },
    {
      "epoch": 0.4,
      "learning_rate": 0.00019503095574831177,
      "loss": 1.0215,
      "step": 1824
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019502552158125975,
      "loss": 1.0658,
      "step": 1825
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019502008452020796,
      "loss": 1.1082,
      "step": 1826
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019501464456532204,
      "loss": 1.0192,
      "step": 1827
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019500920171676756,
      "loss": 1.0442,
      "step": 1828
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019500375597471034,
      "loss": 1.0004,
      "step": 1829
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019499830733931623,
      "loss": 0.9652,
      "step": 1830
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019499285581075118,
      "loss": 0.9051,
      "step": 1831
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.0001949874013891812,
      "loss": 1.0361,
      "step": 1832
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.0001949819440747724,
      "loss": 1.1564,
      "step": 1833
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019497648386769098,
      "loss": 0.9934,
      "step": 1834
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019497102076810322,
      "loss": 0.9877,
      "step": 1835
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019496555477617556,
      "loss": 1.0338,
      "step": 1836
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019496008589207437,
      "loss": 1.0085,
      "step": 1837
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019495461411596628,
      "loss": 1.0704,
      "step": 1838
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019494913944801792,
      "loss": 1.0671,
      "step": 1839
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.000194943661888396,
      "loss": 0.9743,
      "step": 1840
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019493818143726733,
      "loss": 0.9017,
      "step": 1841
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019493269809479888,
      "loss": 1.1351,
      "step": 1842
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019492721186115756,
      "loss": 1.0233,
      "step": 1843
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.0001949217227365105,
      "loss": 1.0484,
      "step": 1844
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019491623072102486,
      "loss": 0.9846,
      "step": 1845
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019491073581486793,
      "loss": 1.0046,
      "step": 1846
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019490523801820705,
      "loss": 1.0717,
      "step": 1847
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019489973733120958,
      "loss": 1.0395,
      "step": 1848
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019489423375404315,
      "loss": 0.9258,
      "step": 1849
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.0001948887272868753,
      "loss": 0.9815,
      "step": 1850
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019488321792987377,
      "loss": 0.8637,
      "step": 1851
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.0001948777056832063,
      "loss": 1.0724,
      "step": 1852
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.0001948721905470408,
      "loss": 1.0274,
      "step": 1853
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019486667252154524,
      "loss": 0.9142,
      "step": 1854
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019486115160688764,
      "loss": 0.959,
      "step": 1855
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019485562780323617,
      "loss": 0.8675,
      "step": 1856
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019485010111075903,
      "loss": 1.0416,
      "step": 1857
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019484457152962458,
      "loss": 1.1091,
      "step": 1858
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019483903906000117,
      "loss": 0.9196,
      "step": 1859
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.0001948335037020573,
      "loss": 0.9064,
      "step": 1860
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.0001948279654559616,
      "loss": 1.005,
      "step": 1861
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019482242432188268,
      "loss": 1.0241,
      "step": 1862
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019481688029998932,
      "loss": 0.9696,
      "step": 1863
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019481133339045037,
      "loss": 0.9335,
      "step": 1864
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019480578359343476,
      "loss": 1.0167,
      "step": 1865
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019480023090911146,
      "loss": 1.0334,
      "step": 1866
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019479467533764963,
      "loss": 0.8853,
      "step": 1867
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019478911687921847,
      "loss": 1.0298,
      "step": 1868
    },
    {
      "epoch": 0.41,
      "learning_rate": 0.00019478355553398722,
      "loss": 1.0157,
      "step": 1869
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019477799130212527,
      "loss": 0.9295,
      "step": 1870
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.0001947724241838021,
      "loss": 0.9939,
      "step": 1871
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019476685417918726,
      "loss": 1.0347,
      "step": 1872
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019476128128845032,
      "loss": 0.8973,
      "step": 1873
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019475570551176106,
      "loss": 1.144,
      "step": 1874
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019475012684928928,
      "loss": 0.9658,
      "step": 1875
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019474454530120488,
      "loss": 0.9404,
      "step": 1876
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019473896086767781,
      "loss": 0.9696,
      "step": 1877
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019473337354887818,
      "loss": 0.9067,
      "step": 1878
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.0001947277833449762,
      "loss": 0.9724,
      "step": 1879
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019472219025614201,
      "loss": 1.0052,
      "step": 1880
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.000194716594282546,
      "loss": 0.8851,
      "step": 1881
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019471099542435862,
      "loss": 0.993,
      "step": 1882
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019470539368175035,
      "loss": 1.0343,
      "step": 1883
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019469978905489185,
      "loss": 0.9899,
      "step": 1884
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.0001946941815439537,
      "loss": 0.897,
      "step": 1885
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019468857114910676,
      "loss": 0.9725,
      "step": 1886
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019468295787052184,
      "loss": 1.0217,
      "step": 1887
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019467734170836997,
      "loss": 0.9931,
      "step": 1888
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.0001946717226628221,
      "loss": 1.0113,
      "step": 1889
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019466610073404943,
      "loss": 1.0013,
      "step": 1890
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.0001946604759222231,
      "loss": 1.1052,
      "step": 1891
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.0001946548482275145,
      "loss": 1.0741,
      "step": 1892
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.000194649217650095,
      "loss": 0.8772,
      "step": 1893
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019464358419013603,
      "loss": 1.0945,
      "step": 1894
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019463794784780922,
      "loss": 1.1438,
      "step": 1895
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019463230862328614,
      "loss": 1.0315,
      "step": 1896
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019462666651673863,
      "loss": 0.9256,
      "step": 1897
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019462102152833846,
      "loss": 0.9463,
      "step": 1898
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019461537365825758,
      "loss": 0.9555,
      "step": 1899
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019460972290666795,
      "loss": 0.946,
      "step": 1900
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019460406927374169,
      "loss": 1.0297,
      "step": 1901
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.000194598412759651,
      "loss": 0.9769,
      "step": 1902
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019459275336456813,
      "loss": 0.9333,
      "step": 1903
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019458709108866545,
      "loss": 1.0293,
      "step": 1904
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019458142593211536,
      "loss": 1.0169,
      "step": 1905
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019457575789509046,
      "loss": 0.9419,
      "step": 1906
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019457008697776332,
      "loss": 0.7803,
      "step": 1907
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019456441318030664,
      "loss": 1.0529,
      "step": 1908
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019455873650289326,
      "loss": 1.0864,
      "step": 1909
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019455305694569605,
      "loss": 1.1737,
      "step": 1910
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019454737450888798,
      "loss": 1.0067,
      "step": 1911
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.0001945416891926421,
      "loss": 1.0207,
      "step": 1912
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019453600099713153,
      "loss": 0.8605,
      "step": 1913
    },
    {
      "epoch": 0.42,
      "learning_rate": 0.00019453030992252956,
      "loss": 0.9471,
      "step": 1914
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019452461596900945,
      "loss": 0.9972,
      "step": 1915
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019451891913674466,
      "loss": 1.0686,
      "step": 1916
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019451321942590868,
      "loss": 1.0528,
      "step": 1917
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019450751683667506,
      "loss": 0.8925,
      "step": 1918
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001945018113692175,
      "loss": 1.064,
      "step": 1919
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019449610302370976,
      "loss": 0.889,
      "step": 1920
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001944903918003257,
      "loss": 1.0651,
      "step": 1921
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019448467769923923,
      "loss": 1.1264,
      "step": 1922
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019447896072062438,
      "loss": 1.0887,
      "step": 1923
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019447324086465523,
      "loss": 1.0213,
      "step": 1924
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019446751813150605,
      "loss": 0.9762,
      "step": 1925
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019446179252135106,
      "loss": 0.9922,
      "step": 1926
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019445606403436467,
      "loss": 0.9927,
      "step": 1927
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019445033267072133,
      "loss": 0.931,
      "step": 1928
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019444459843059557,
      "loss": 1.0093,
      "step": 1929
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019443886131416207,
      "loss": 1.0516,
      "step": 1930
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001944331213215955,
      "loss": 0.7737,
      "step": 1931
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001944273784530707,
      "loss": 1.0385,
      "step": 1932
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001944216327087626,
      "loss": 1.1465,
      "step": 1933
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019441588408884613,
      "loss": 0.955,
      "step": 1934
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019441013259349638,
      "loss": 1.0006,
      "step": 1935
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019440437822288855,
      "loss": 1.0891,
      "step": 1936
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019439862097719784,
      "loss": 1.1088,
      "step": 1937
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001943928608565996,
      "loss": 0.9809,
      "step": 1938
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019438709786126927,
      "loss": 0.9992,
      "step": 1939
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019438133199138236,
      "loss": 0.9645,
      "step": 1940
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019437556324711444,
      "loss": 1.1127,
      "step": 1941
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019436979162864123,
      "loss": 1.0032,
      "step": 1942
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001943640171361385,
      "loss": 0.9896,
      "step": 1943
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019435823976978207,
      "loss": 0.9997,
      "step": 1944
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019435245952974798,
      "loss": 0.9897,
      "step": 1945
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019434667641621216,
      "loss": 1.1225,
      "step": 1946
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001943408904293508,
      "loss": 0.9963,
      "step": 1947
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001943351015693401,
      "loss": 0.8727,
      "step": 1948
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001943293098363564,
      "loss": 1.0832,
      "step": 1949
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.000194323515230576,
      "loss": 0.9911,
      "step": 1950
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019431771775217543,
      "loss": 0.955,
      "step": 1951
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019431191740133122,
      "loss": 1.0014,
      "step": 1952
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019430611417822007,
      "loss": 0.8227,
      "step": 1953
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019430030808301866,
      "loss": 0.9481,
      "step": 1954
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019429449911590387,
      "loss": 1.0541,
      "step": 1955
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019428868727705258,
      "loss": 1.1773,
      "step": 1956
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019428287256664176,
      "loss": 1.0008,
      "step": 1957
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.0001942770549848486,
      "loss": 1.003,
      "step": 1958
    },
    {
      "epoch": 0.43,
      "learning_rate": 0.00019427123453185014,
      "loss": 1.0416,
      "step": 1959
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019426541120782373,
      "loss": 0.9317,
      "step": 1960
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001942595850129467,
      "loss": 0.9574,
      "step": 1961
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019425375594739648,
      "loss": 0.9064,
      "step": 1962
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001942479240113506,
      "loss": 1.062,
      "step": 1963
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019424208920498667,
      "loss": 0.9436,
      "step": 1964
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019423625152848237,
      "loss": 0.9972,
      "step": 1965
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001942304109820155,
      "loss": 0.9068,
      "step": 1966
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019422456756576395,
      "loss": 1.0602,
      "step": 1967
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001942187212799057,
      "loss": 0.9551,
      "step": 1968
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019421287212461873,
      "loss": 0.9158,
      "step": 1969
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001942070201000812,
      "loss": 1.0254,
      "step": 1970
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019420116520647135,
      "loss": 0.9472,
      "step": 1971
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019419530744396753,
      "loss": 0.9337,
      "step": 1972
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019418944681274804,
      "loss": 1.0212,
      "step": 1973
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019418358331299145,
      "loss": 1.0588,
      "step": 1974
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019417771694487626,
      "loss": 0.8391,
      "step": 1975
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019417184770858124,
      "loss": 1.0849,
      "step": 1976
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019416597560428502,
      "loss": 0.8121,
      "step": 1977
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001941601006321665,
      "loss": 0.9066,
      "step": 1978
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001941542227924046,
      "loss": 0.9758,
      "step": 1979
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001941483420851783,
      "loss": 0.8931,
      "step": 1980
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019414245851066673,
      "loss": 1.0424,
      "step": 1981
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019413657206904903,
      "loss": 0.9463,
      "step": 1982
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001941306827605045,
      "loss": 0.8909,
      "step": 1983
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001941247905852125,
      "loss": 1.072,
      "step": 1984
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001941188955433525,
      "loss": 0.9221,
      "step": 1985
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019411299763510398,
      "loss": 1.0199,
      "step": 1986
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001941070968606466,
      "loss": 0.8926,
      "step": 1987
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019410119322016005,
      "loss": 1.0343,
      "step": 1988
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019409528671382413,
      "loss": 0.9838,
      "step": 1989
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019408937734181873,
      "loss": 1.0195,
      "step": 1990
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001940834651043238,
      "loss": 0.9841,
      "step": 1991
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019407755000151942,
      "loss": 1.0756,
      "step": 1992
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001940716320335857,
      "loss": 1.0505,
      "step": 1993
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019406571120070295,
      "loss": 1.0449,
      "step": 1994
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019405978750305138,
      "loss": 1.0549,
      "step": 1995
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019405386094081145,
      "loss": 0.8532,
      "step": 1996
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019404793151416366,
      "loss": 0.9926,
      "step": 1997
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019404199922328863,
      "loss": 1.1055,
      "step": 1998
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019403606406836693,
      "loss": 0.9538,
      "step": 1999
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001940301260495794,
      "loss": 0.9736,
      "step": 2000
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019402418516710682,
      "loss": 0.9153,
      "step": 2001
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.0001940182414211302,
      "loss": 1.1754,
      "step": 2002
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019401229481183046,
      "loss": 1.1609,
      "step": 2003
    },
    {
      "epoch": 0.44,
      "learning_rate": 0.00019400634533938874,
      "loss": 1.0047,
      "step": 2004
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019400039300398626,
      "loss": 0.9231,
      "step": 2005
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001939944378058043,
      "loss": 0.9602,
      "step": 2006
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019398847974502417,
      "loss": 1.107,
      "step": 2007
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019398251882182734,
      "loss": 1.0019,
      "step": 2008
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001939765550363954,
      "loss": 1.0037,
      "step": 2009
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019397058838890993,
      "loss": 0.9579,
      "step": 2010
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019396461887955267,
      "loss": 0.912,
      "step": 2011
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019395864650850538,
      "loss": 0.986,
      "step": 2012
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019395267127595003,
      "loss": 0.9479,
      "step": 2013
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001939466931820685,
      "loss": 1.0991,
      "step": 2014
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019394071222704292,
      "loss": 1.0301,
      "step": 2015
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019393472841105537,
      "loss": 1.1119,
      "step": 2016
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001939287417342882,
      "loss": 1.0107,
      "step": 2017
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001939227521969236,
      "loss": 0.9891,
      "step": 2018
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019391675979914407,
      "loss": 0.9367,
      "step": 2019
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019391076454113208,
      "loss": 1.0491,
      "step": 2020
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019390476642307025,
      "loss": 0.9784,
      "step": 2021
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019389876544514118,
      "loss": 1.0165,
      "step": 2022
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019389276160752773,
      "loss": 0.9441,
      "step": 2023
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019388675491041263,
      "loss": 0.9094,
      "step": 2024
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001938807453539789,
      "loss": 0.9322,
      "step": 2025
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019387473293840953,
      "loss": 1.0377,
      "step": 2026
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019386871766388764,
      "loss": 0.928,
      "step": 2027
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019386269953059642,
      "loss": 0.9137,
      "step": 2028
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019385667853871914,
      "loss": 0.9228,
      "step": 2029
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019385065468843917,
      "loss": 1.011,
      "step": 2030
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019384462797993998,
      "loss": 0.989,
      "step": 2031
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019383859841340512,
      "loss": 1.0259,
      "step": 2032
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001938325659890182,
      "loss": 0.8039,
      "step": 2033
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019382653070696294,
      "loss": 1.0337,
      "step": 2034
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001938204925674232,
      "loss": 0.9593,
      "step": 2035
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019381445157058274,
      "loss": 1.0367,
      "step": 2036
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019380840771662566,
      "loss": 0.9563,
      "step": 2037
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.000193802361005736,
      "loss": 0.8675,
      "step": 2038
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019379631143809787,
      "loss": 0.8572,
      "step": 2039
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019379025901389554,
      "loss": 0.9291,
      "step": 2040
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019378420373331333,
      "loss": 1.0037,
      "step": 2041
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001937781455965357,
      "loss": 0.9724,
      "step": 2042
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019377208460374706,
      "loss": 0.9284,
      "step": 2043
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019376602075513207,
      "loss": 0.8702,
      "step": 2044
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019375995405087536,
      "loss": 0.9158,
      "step": 2045
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019375388449116172,
      "loss": 1.0224,
      "step": 2046
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.00019374781207617597,
      "loss": 1.0363,
      "step": 2047
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001937417368061031,
      "loss": 1.1012,
      "step": 2048
    },
    {
      "epoch": 0.45,
      "learning_rate": 0.0001937356586811281,
      "loss": 1.0711,
      "step": 2049
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019372957770143602,
      "loss": 0.9952,
      "step": 2050
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019372349386721216,
      "loss": 0.9262,
      "step": 2051
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001937174071786417,
      "loss": 1.0356,
      "step": 2052
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019371131763591012,
      "loss": 1.1124,
      "step": 2053
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001937052252392028,
      "loss": 0.9899,
      "step": 2054
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001936991299887053,
      "loss": 0.9177,
      "step": 2055
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019369303188460326,
      "loss": 0.9319,
      "step": 2056
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001936869309270824,
      "loss": 0.9709,
      "step": 2057
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019368082711632853,
      "loss": 1.0485,
      "step": 2058
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019367472045252751,
      "loss": 1.0685,
      "step": 2059
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019366861093586532,
      "loss": 0.9058,
      "step": 2060
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019366249856652809,
      "loss": 0.9453,
      "step": 2061
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019365638334470188,
      "loss": 0.9094,
      "step": 2062
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.000193650265270573,
      "loss": 1.0097,
      "step": 2063
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019364414434432773,
      "loss": 0.9863,
      "step": 2064
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001936380205661525,
      "loss": 1.046,
      "step": 2065
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019363189393623384,
      "loss": 0.9647,
      "step": 2066
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001936257644547583,
      "loss": 0.9153,
      "step": 2067
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019361963212191253,
      "loss": 0.9531,
      "step": 2068
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019361349693788334,
      "loss": 1.0815,
      "step": 2069
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019360735890285757,
      "loss": 0.91,
      "step": 2070
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019360121801702214,
      "loss": 0.9042,
      "step": 2071
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019359507428056406,
      "loss": 1.0263,
      "step": 2072
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019358892769367046,
      "loss": 1.0439,
      "step": 2073
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001935827782565285,
      "loss": 0.9894,
      "step": 2074
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019357662596932552,
      "loss": 1.0729,
      "step": 2075
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019357047083224882,
      "loss": 1.0581,
      "step": 2076
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019356431284548592,
      "loss": 1.0122,
      "step": 2077
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019355815200922428,
      "loss": 1.1223,
      "step": 2078
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001935519883236516,
      "loss": 1.0252,
      "step": 2079
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001935458217889556,
      "loss": 0.9183,
      "step": 2080
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019353965240532402,
      "loss": 0.9625,
      "step": 2081
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001935334801729448,
      "loss": 0.9331,
      "step": 2082
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019352730509200586,
      "loss": 0.9585,
      "step": 2083
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019352112716269532,
      "loss": 1.0105,
      "step": 2084
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019351494638520132,
      "loss": 0.9867,
      "step": 2085
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019350876275971209,
      "loss": 1.0158,
      "step": 2086
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001935025762864159,
      "loss": 0.987,
      "step": 2087
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019349638696550123,
      "loss": 0.9,
      "step": 2088
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019349019479715656,
      "loss": 0.8773,
      "step": 2089
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019348399978157043,
      "loss": 0.9757,
      "step": 2090
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019347780191893157,
      "loss": 1.0264,
      "step": 2091
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001934716012094287,
      "loss": 0.9823,
      "step": 2092
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.00019346539765325064,
      "loss": 0.8942,
      "step": 2093
    },
    {
      "epoch": 0.46,
      "learning_rate": 0.0001934591912505864,
      "loss": 0.9558,
      "step": 2094
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019345298200162492,
      "loss": 0.8608,
      "step": 2095
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019344676990655532,
      "loss": 1.0808,
      "step": 2096
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001934405549655668,
      "loss": 0.9549,
      "step": 2097
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001934343371788486,
      "loss": 1.0059,
      "step": 2098
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019342811654659013,
      "loss": 1.0148,
      "step": 2099
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019342189306898087,
      "loss": 0.9668,
      "step": 2100
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019341566674621028,
      "loss": 1.049,
      "step": 2101
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.000193409437578468,
      "loss": 1.0229,
      "step": 2102
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019340320556594375,
      "loss": 0.988,
      "step": 2103
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019339697070882731,
      "loss": 0.9942,
      "step": 2104
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019339073300730862,
      "loss": 0.9565,
      "step": 2105
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019338449246157757,
      "loss": 0.9543,
      "step": 2106
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019337824907182427,
      "loss": 0.9882,
      "step": 2107
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019337200283823884,
      "loss": 1.0428,
      "step": 2108
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019336575376101154,
      "loss": 1.0354,
      "step": 2109
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019335950184033263,
      "loss": 0.8947,
      "step": 2110
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019335324707639253,
      "loss": 0.9184,
      "step": 2111
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019334698946938178,
      "loss": 0.9195,
      "step": 2112
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001933407290194909,
      "loss": 1.0132,
      "step": 2113
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019333446572691054,
      "loss": 1.052,
      "step": 2114
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001933281995918315,
      "loss": 1.0483,
      "step": 2115
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019332193061444462,
      "loss": 0.8911,
      "step": 2116
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019331565879494075,
      "loss": 0.9345,
      "step": 2117
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019330938413351096,
      "loss": 0.9798,
      "step": 2118
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001933031066303463,
      "loss": 1.007,
      "step": 2119
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.000193296826285638,
      "loss": 0.9291,
      "step": 2120
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019329054309957731,
      "loss": 0.877,
      "step": 2121
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019328425707235556,
      "loss": 0.9171,
      "step": 2122
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019327796820416425,
      "loss": 0.9137,
      "step": 2123
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001932716764951948,
      "loss": 1.0237,
      "step": 2124
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019326538194563894,
      "loss": 1.1492,
      "step": 2125
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001932590845556883,
      "loss": 1.0233,
      "step": 2126
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019325278432553468,
      "loss": 0.9939,
      "step": 2127
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019324648125537,
      "loss": 0.9682,
      "step": 2128
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019324017534538615,
      "loss": 0.928,
      "step": 2129
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001932338665957752,
      "loss": 1.0144,
      "step": 2130
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001932275550067293,
      "loss": 1.061,
      "step": 2131
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019322124057844067,
      "loss": 0.9299,
      "step": 2132
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019321492331110158,
      "loss": 1.1439,
      "step": 2133
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019320860320490448,
      "loss": 0.9307,
      "step": 2134
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001932022802600418,
      "loss": 0.9673,
      "step": 2135
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.0001931959544767061,
      "loss": 1.0421,
      "step": 2136
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019318962585509008,
      "loss": 1.0606,
      "step": 2137
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.00019318329439538644,
      "loss": 1.0527,
      "step": 2138
    },
    {
      "epoch": 0.47,
      "learning_rate": 0.000193176960097788,
      "loss": 1.0037,
      "step": 2139
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019317062296248772,
      "loss": 1.0834,
      "step": 2140
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019316428298967855,
      "loss": 1.0249,
      "step": 2141
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019315794017955358,
      "loss": 1.0143,
      "step": 2142
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.000193151594532306,
      "loss": 0.9762,
      "step": 2143
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019314524604812904,
      "loss": 0.9669,
      "step": 2144
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019313889472721604,
      "loss": 0.9612,
      "step": 2145
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001931325405697605,
      "loss": 0.8986,
      "step": 2146
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019312618357595582,
      "loss": 1.0602,
      "step": 2147
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019311982374599568,
      "loss": 1.0251,
      "step": 2148
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019311346108007377,
      "loss": 1.06,
      "step": 2149
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019310709557838384,
      "loss": 0.8027,
      "step": 2150
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001931007272411198,
      "loss": 0.9615,
      "step": 2151
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019309435606847548,
      "loss": 0.9369,
      "step": 2152
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019308798206064503,
      "loss": 1.0805,
      "step": 2153
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001930816052178225,
      "loss": 0.9617,
      "step": 2154
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019307522554020217,
      "loss": 1.0116,
      "step": 2155
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019306884302797825,
      "loss": 0.9777,
      "step": 2156
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001930624576813452,
      "loss": 1.0857,
      "step": 2157
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001930560695004974,
      "loss": 0.8586,
      "step": 2158
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019304967848562948,
      "loss": 0.8639,
      "step": 2159
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.000193043284636936,
      "loss": 1.0095,
      "step": 2160
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019303688795461178,
      "loss": 0.8814,
      "step": 2161
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019303048843885155,
      "loss": 1.0404,
      "step": 2162
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019302408608985023,
      "loss": 0.9212,
      "step": 2163
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019301768090780282,
      "loss": 1.047,
      "step": 2164
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019301127289290439,
      "loss": 0.9821,
      "step": 2165
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001930048620453501,
      "loss": 0.9833,
      "step": 2166
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019299844836533515,
      "loss": 0.8858,
      "step": 2167
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019299203185305487,
      "loss": 0.9887,
      "step": 2168
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019298561250870476,
      "loss": 1.0067,
      "step": 2169
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019297919033248021,
      "loss": 1.0101,
      "step": 2170
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001929727653245769,
      "loss": 1.0802,
      "step": 2171
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019296633748519044,
      "loss": 0.8422,
      "step": 2172
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001929599068145166,
      "loss": 1.0433,
      "step": 2173
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019295347331275126,
      "loss": 0.911,
      "step": 2174
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001929470369800903,
      "loss": 1.0173,
      "step": 2175
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019294059781672983,
      "loss": 0.9517,
      "step": 2176
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019293415582286586,
      "loss": 1.0215,
      "step": 2177
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.0001929277109986946,
      "loss": 0.9704,
      "step": 2178
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019292126334441234,
      "loss": 1.0863,
      "step": 2179
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019291481286021545,
      "loss": 0.9483,
      "step": 2180
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019290835954630038,
      "loss": 0.9278,
      "step": 2181
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019290190340286365,
      "loss": 0.9514,
      "step": 2182
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019289544443010188,
      "loss": 0.996,
      "step": 2183
    },
    {
      "epoch": 0.48,
      "learning_rate": 0.00019288898262821182,
      "loss": 1.0558,
      "step": 2184
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019288251799739022,
      "loss": 1.0634,
      "step": 2185
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019287605053783396,
      "loss": 1.0716,
      "step": 2186
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019286958024974002,
      "loss": 0.9985,
      "step": 2187
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019286310713330544,
      "loss": 1.0714,
      "step": 2188
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019285663118872738,
      "loss": 0.9219,
      "step": 2189
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019285015241620308,
      "loss": 0.9778,
      "step": 2190
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001928436708159298,
      "loss": 0.8832,
      "step": 2191
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019283718638810497,
      "loss": 1.0275,
      "step": 2192
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019283069913292607,
      "loss": 0.9442,
      "step": 2193
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019282420905059064,
      "loss": 0.9151,
      "step": 2194
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019281771614129638,
      "loss": 1.0606,
      "step": 2195
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019281122040524102,
      "loss": 1.0199,
      "step": 2196
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019280472184262238,
      "loss": 0.899,
      "step": 2197
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019279822045363833,
      "loss": 0.9877,
      "step": 2198
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019279171623848694,
      "loss": 1.0479,
      "step": 2199
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019278520919736628,
      "loss": 0.7998,
      "step": 2200
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001927786993304745,
      "loss": 0.9011,
      "step": 2201
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019277218663800983,
      "loss": 0.9434,
      "step": 2202
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001927656711201707,
      "loss": 0.917,
      "step": 2203
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019275915277715548,
      "loss": 0.8733,
      "step": 2204
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001927526316091627,
      "loss": 0.9503,
      "step": 2205
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019274610761639096,
      "loss": 0.9859,
      "step": 2206
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019273958079903892,
      "loss": 0.9703,
      "step": 2207
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001927330511573054,
      "loss": 0.8689,
      "step": 2208
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019272651869138924,
      "loss": 1.0171,
      "step": 2209
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019271998340148941,
      "loss": 1.0023,
      "step": 2210
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019271344528780485,
      "loss": 0.928,
      "step": 2211
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019270690435053481,
      "loss": 0.943,
      "step": 2212
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019270036058987843,
      "loss": 1.0894,
      "step": 2213
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.000192693814006035,
      "loss": 0.9944,
      "step": 2214
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019268726459920386,
      "loss": 1.0579,
      "step": 2215
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019268071236958455,
      "loss": 1.0415,
      "step": 2216
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001926741573173765,
      "loss": 1.0605,
      "step": 2217
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019266759944277953,
      "loss": 1.0679,
      "step": 2218
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001926610387459932,
      "loss": 1.2277,
      "step": 2219
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019265447522721736,
      "loss": 0.9654,
      "step": 2220
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019264790888665192,
      "loss": 0.9098,
      "step": 2221
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019264133972449684,
      "loss": 1.0352,
      "step": 2222
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001926347677409522,
      "loss": 0.9677,
      "step": 2223
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019262819293621814,
      "loss": 1.004,
      "step": 2224
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019262161531049488,
      "loss": 1.0285,
      "step": 2225
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019261503486398275,
      "loss": 0.8849,
      "step": 2226
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.0001926084515968822,
      "loss": 0.8765,
      "step": 2227
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019260186550939366,
      "loss": 0.9182,
      "step": 2228
    },
    {
      "epoch": 0.49,
      "learning_rate": 0.00019259527660171774,
      "loss": 0.8799,
      "step": 2229
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001925886848740551,
      "loss": 0.9911,
      "step": 2230
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001925820903266065,
      "loss": 1.0164,
      "step": 2231
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019257549295957277,
      "loss": 0.9943,
      "step": 2232
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019256889277315483,
      "loss": 0.9732,
      "step": 2233
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001925622897675537,
      "loss": 1.1329,
      "step": 2234
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019255568394297044,
      "loss": 0.9437,
      "step": 2235
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001925490752996063,
      "loss": 1.0044,
      "step": 2236
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019254246383766245,
      "loss": 1.0494,
      "step": 2237
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001925358495573403,
      "loss": 1.1255,
      "step": 2238
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019252923245884128,
      "loss": 0.9667,
      "step": 2239
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019252261254236694,
      "loss": 0.894,
      "step": 2240
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019251598980811886,
      "loss": 1.0424,
      "step": 2241
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019250936425629873,
      "loss": 0.8505,
      "step": 2242
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019250273588710832,
      "loss": 0.9659,
      "step": 2243
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019249610470074954,
      "loss": 0.9633,
      "step": 2244
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019248947069742432,
      "loss": 0.9338,
      "step": 2245
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019248283387733467,
      "loss": 1.0264,
      "step": 2246
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019247619424068277,
      "loss": 0.9937,
      "step": 2247
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001924695517876708,
      "loss": 0.9373,
      "step": 2248
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019246290651850104,
      "loss": 1.0967,
      "step": 2249
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001924562584333759,
      "loss": 0.9418,
      "step": 2250
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019244960753249783,
      "loss": 0.8806,
      "step": 2251
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019244295381606942,
      "loss": 1.0279,
      "step": 2252
    },
    {
      "epoch": 0.5,
      "eval_loss": 0.6187470555305481,
      "eval_runtime": 322.9541,
      "eval_samples_per_second": 56.166,
      "eval_steps_per_second": 28.084,
      "step": 2252
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019243629728429325,
      "loss": 1.1856,
      "step": 2253
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019242963793737207,
      "loss": 1.0412,
      "step": 2254
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001924229757755087,
      "loss": 0.9558,
      "step": 2255
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.000192416310798906,
      "loss": 0.9817,
      "step": 2256
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019240964300776703,
      "loss": 0.9407,
      "step": 2257
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001924029724022948,
      "loss": 0.9469,
      "step": 2258
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019239629898269245,
      "loss": 1.0785,
      "step": 2259
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019238962274916322,
      "loss": 1.0259,
      "step": 2260
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001923829437019105,
      "loss": 0.9049,
      "step": 2261
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019237626184113763,
      "loss": 0.9227,
      "step": 2262
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019236957716704814,
      "loss": 0.8747,
      "step": 2263
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001923628896798456,
      "loss": 0.9309,
      "step": 2264
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019235619937973367,
      "loss": 0.8997,
      "step": 2265
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001923495062669161,
      "loss": 1.0323,
      "step": 2266
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019234281034159674,
      "loss": 0.9668,
      "step": 2267
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019233611160397954,
      "loss": 0.981,
      "step": 2268
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.0001923294100542685,
      "loss": 1.1254,
      "step": 2269
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019232270569266767,
      "loss": 0.8491,
      "step": 2270
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019231599851938125,
      "loss": 0.8864,
      "step": 2271
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019230928853461354,
      "loss": 0.9139,
      "step": 2272
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019230257573856887,
      "loss": 0.8401,
      "step": 2273
    },
    {
      "epoch": 0.5,
      "learning_rate": 0.00019229586013145167,
      "loss": 1.0594,
      "step": 2274
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019228914171346648,
      "loss": 0.9667,
      "step": 2275
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001922824204848179,
      "loss": 0.982,
      "step": 2276
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019227569644571062,
      "loss": 0.9874,
      "step": 2277
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019226896959634944,
      "loss": 0.8824,
      "step": 2278
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001922622399369392,
      "loss": 1.0304,
      "step": 2279
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019225550746768485,
      "loss": 1.1114,
      "step": 2280
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019224877218879146,
      "loss": 0.9353,
      "step": 2281
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019224203410046412,
      "loss": 0.9839,
      "step": 2282
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019223529320290807,
      "loss": 0.9491,
      "step": 2283
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001922285494963286,
      "loss": 0.9283,
      "step": 2284
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019222180298093106,
      "loss": 1.161,
      "step": 2285
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019221505365692095,
      "loss": 0.9717,
      "step": 2286
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019220830152450374,
      "loss": 1.0024,
      "step": 2287
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001922015465838852,
      "loss": 0.9105,
      "step": 2288
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019219478883527094,
      "loss": 0.9798,
      "step": 2289
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001921880282788668,
      "loss": 1.0659,
      "step": 2290
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001921812649148787,
      "loss": 0.9892,
      "step": 2291
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019217449874351256,
      "loss": 1.0361,
      "step": 2292
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019216772976497453,
      "loss": 1.0947,
      "step": 2293
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019216095797947066,
      "loss": 1.0533,
      "step": 2294
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019215418338720727,
      "loss": 1.0689,
      "step": 2295
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019214740598839063,
      "loss": 1.0003,
      "step": 2296
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019214062578322717,
      "loss": 1.0324,
      "step": 2297
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019213384277192336,
      "loss": 1.0301,
      "step": 2298
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001921270569546858,
      "loss": 1.0329,
      "step": 2299
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019212026833172112,
      "loss": 1.0277,
      "step": 2300
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019211347690323608,
      "loss": 1.0478,
      "step": 2301
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019210668266943755,
      "loss": 1.0367,
      "step": 2302
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019209988563053242,
      "loss": 0.9704,
      "step": 2303
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019209308578672763,
      "loss": 0.9897,
      "step": 2304
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001920862831382304,
      "loss": 0.9141,
      "step": 2305
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019207947768524778,
      "loss": 0.9729,
      "step": 2306
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001920726694279871,
      "loss": 1.0569,
      "step": 2307
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001920658583666557,
      "loss": 0.9646,
      "step": 2308
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.000192059044501461,
      "loss": 0.9604,
      "step": 2309
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001920522278326105,
      "loss": 0.9737,
      "step": 2310
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019204540836031183,
      "loss": 1.0229,
      "step": 2311
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019203858608477265,
      "loss": 1.092,
      "step": 2312
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001920317610062008,
      "loss": 0.9216,
      "step": 2313
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019202493312480402,
      "loss": 0.9925,
      "step": 2314
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019201810244079035,
      "loss": 0.9922,
      "step": 2315
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019201126895436777,
      "loss": 1.0126,
      "step": 2316
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019200443266574442,
      "loss": 0.9144,
      "step": 2317
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.0001919975935751285,
      "loss": 0.9459,
      "step": 2318
    },
    {
      "epoch": 0.51,
      "learning_rate": 0.00019199075168272825,
      "loss": 0.9634,
      "step": 2319
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019198390698875207,
      "loss": 0.9664,
      "step": 2320
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019197705949340846,
      "loss": 0.9753,
      "step": 2321
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019197020919690586,
      "loss": 0.9129,
      "step": 2322
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.000191963356099453,
      "loss": 1.0068,
      "step": 2323
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019195650020125852,
      "loss": 1.0667,
      "step": 2324
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019194964150253126,
      "loss": 1.0631,
      "step": 2325
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019194278000348006,
      "loss": 0.8465,
      "step": 2326
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.0001919359157043139,
      "loss": 0.8713,
      "step": 2327
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019192904860524187,
      "loss": 0.9928,
      "step": 2328
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019192217870647306,
      "loss": 0.9935,
      "step": 2329
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019191530600821673,
      "loss": 1.0142,
      "step": 2330
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019190843051068214,
      "loss": 0.8805,
      "step": 2331
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019190155221407874,
      "loss": 0.9415,
      "step": 2332
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019189467111861594,
      "loss": 1.0389,
      "step": 2333
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019188778722450337,
      "loss": 0.9585,
      "step": 2334
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019188090053195067,
      "loss": 1.0597,
      "step": 2335
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019187401104116752,
      "loss": 0.8868,
      "step": 2336
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.0001918671187523638,
      "loss": 0.988,
      "step": 2337
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019186022366574936,
      "loss": 1.034,
      "step": 2338
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019185332578153426,
      "loss": 0.9703,
      "step": 2339
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.0001918464250999285,
      "loss": 0.9331,
      "step": 2340
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.0001918395216211423,
      "loss": 0.9424,
      "step": 2341
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019183261534538585,
      "loss": 0.9836,
      "step": 2342
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019182570627286952,
      "loss": 0.8522,
      "step": 2343
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019181879440380374,
      "loss": 1.0359,
      "step": 2344
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019181187973839895,
      "loss": 0.9822,
      "step": 2345
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019180496227686578,
      "loss": 1.0865,
      "step": 2346
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019179804201941493,
      "loss": 1.0087,
      "step": 2347
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.0001917911189662571,
      "loss": 0.9934,
      "step": 2348
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019178419311760312,
      "loss": 1.0393,
      "step": 2349
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.000191777264473664,
      "loss": 0.9826,
      "step": 2350
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019177033303465065,
      "loss": 1.0749,
      "step": 2351
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019176339880077424,
      "loss": 1.0953,
      "step": 2352
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019175646177224591,
      "loss": 1.1179,
      "step": 2353
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019174952194927697,
      "loss": 0.9687,
      "step": 2354
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019174257933207876,
      "loss": 1.0982,
      "step": 2355
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019173563392086267,
      "loss": 0.961,
      "step": 2356
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019172868571584026,
      "loss": 0.9624,
      "step": 2357
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019172173471722315,
      "loss": 1.0337,
      "step": 2358
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.000191714780925223,
      "loss": 0.996,
      "step": 2359
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019170782434005162,
      "loss": 0.9655,
      "step": 2360
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019170086496192082,
      "loss": 1.1095,
      "step": 2361
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019169390279104266,
      "loss": 1.0724,
      "step": 2362
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019168693782762903,
      "loss": 0.8794,
      "step": 2363
    },
    {
      "epoch": 0.52,
      "learning_rate": 0.00019167997007189214,
      "loss": 0.9891,
      "step": 2364
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019167299952404417,
      "loss": 1.0665,
      "step": 2365
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019166602618429738,
      "loss": 0.9388,
      "step": 2366
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001916590500528642,
      "loss": 1.0873,
      "step": 2367
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019165207112995704,
      "loss": 0.8597,
      "step": 2368
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019164508941578847,
      "loss": 0.9765,
      "step": 2369
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001916381049105711,
      "loss": 0.9995,
      "step": 2370
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019163111761451768,
      "loss": 1.0162,
      "step": 2371
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019162412752784093,
      "loss": 0.9444,
      "step": 2372
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019161713465075378,
      "loss": 0.9427,
      "step": 2373
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019161013898346925,
      "loss": 0.8471,
      "step": 2374
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001916031405262003,
      "loss": 0.8535,
      "step": 2375
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001915961392791601,
      "loss": 1.0368,
      "step": 2376
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019158913524256193,
      "loss": 0.9767,
      "step": 2377
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.000191582128416619,
      "loss": 1.1243,
      "step": 2378
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019157511880154478,
      "loss": 0.8693,
      "step": 2379
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019156810639755275,
      "loss": 0.9954,
      "step": 2380
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001915610912048564,
      "loss": 1.0391,
      "step": 2381
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001915540732236694,
      "loss": 1.0324,
      "step": 2382
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019154705245420556,
      "loss": 1.063,
      "step": 2383
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001915400288966786,
      "loss": 1.0576,
      "step": 2384
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019153300255130246,
      "loss": 0.8391,
      "step": 2385
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019152597341829118,
      "loss": 1.1134,
      "step": 2386
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019151894149785874,
      "loss": 0.9382,
      "step": 2387
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019151190679021933,
      "loss": 0.9598,
      "step": 2388
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019150486929558723,
      "loss": 1.0382,
      "step": 2389
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019149782901417672,
      "loss": 1.0586,
      "step": 2390
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019149078594620221,
      "loss": 1.0192,
      "step": 2391
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019148374009187827,
      "loss": 0.9347,
      "step": 2392
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019147669145141936,
      "loss": 1.0639,
      "step": 2393
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019146964002504026,
      "loss": 1.0083,
      "step": 2394
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019146258581295567,
      "loss": 0.8173,
      "step": 2395
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001914555288153804,
      "loss": 1.0788,
      "step": 2396
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001914484690325294,
      "loss": 0.9956,
      "step": 2397
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019144140646461773,
      "loss": 0.9278,
      "step": 2398
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001914343411118604,
      "loss": 1.0002,
      "step": 2399
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001914272729744726,
      "loss": 1.0009,
      "step": 2400
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001914202020526696,
      "loss": 0.9471,
      "step": 2401
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019141312834666677,
      "loss": 1.0379,
      "step": 2402
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001914060518566795,
      "loss": 0.961,
      "step": 2403
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001913989725829233,
      "loss": 0.9484,
      "step": 2404
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001913918905256138,
      "loss": 1.075,
      "step": 2405
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001913848056849667,
      "loss": 1.0313,
      "step": 2406
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001913777180611977,
      "loss": 0.9957,
      "step": 2407
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.0001913706276545227,
      "loss": 0.9555,
      "step": 2408
    },
    {
      "epoch": 0.53,
      "learning_rate": 0.00019136353446515765,
      "loss": 0.9427,
      "step": 2409
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019135643849331856,
      "loss": 0.799,
      "step": 2410
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019134933973922154,
      "loss": 1.0327,
      "step": 2411
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019134223820308277,
      "loss": 0.9157,
      "step": 2412
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001913351338851185,
      "loss": 1.0805,
      "step": 2413
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019132802678554516,
      "loss": 0.9577,
      "step": 2414
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019132091690457915,
      "loss": 1.065,
      "step": 2415
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019131380424243703,
      "loss": 1.0058,
      "step": 2416
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001913066887993354,
      "loss": 1.0564,
      "step": 2417
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019129957057549093,
      "loss": 1.0272,
      "step": 2418
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019129244957112043,
      "loss": 1.0461,
      "step": 2419
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001912853257864408,
      "loss": 0.9603,
      "step": 2420
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019127819922166897,
      "loss": 1.0085,
      "step": 2421
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019127106987702194,
      "loss": 0.9983,
      "step": 2422
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019126393775271692,
      "loss": 0.9365,
      "step": 2423
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019125680284897106,
      "loss": 1.0009,
      "step": 2424
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019124966516600162,
      "loss": 1.054,
      "step": 2425
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019124252470402607,
      "loss": 1.0047,
      "step": 2426
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019123538146326182,
      "loss": 0.9532,
      "step": 2427
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019122823544392642,
      "loss": 1.0994,
      "step": 2428
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019122108664623748,
      "loss": 1.0057,
      "step": 2429
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019121393507041278,
      "loss": 1.0893,
      "step": 2430
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019120678071667008,
      "loss": 0.8817,
      "step": 2431
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019119962358522723,
      "loss": 0.8205,
      "step": 2432
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019119246367630224,
      "loss": 0.9115,
      "step": 2433
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019118530099011317,
      "loss": 0.9718,
      "step": 2434
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019117813552687818,
      "loss": 0.9416,
      "step": 2435
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019117096728681542,
      "loss": 1.031,
      "step": 2436
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001911637962701433,
      "loss": 0.9389,
      "step": 2437
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019115662247708013,
      "loss": 1.0206,
      "step": 2438
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019114944590784442,
      "loss": 0.9119,
      "step": 2439
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001911422665626547,
      "loss": 1.0173,
      "step": 2440
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019113508444172967,
      "loss": 0.8972,
      "step": 2441
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019112789954528803,
      "loss": 0.9298,
      "step": 2442
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001911207118735486,
      "loss": 0.9852,
      "step": 2443
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019111352142673027,
      "loss": 1.0158,
      "step": 2444
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019110632820505205,
      "loss": 1.0953,
      "step": 2445
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.000191099132208733,
      "loss": 1.0777,
      "step": 2446
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019109193343799224,
      "loss": 0.957,
      "step": 2447
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001910847318930491,
      "loss": 1.0025,
      "step": 2448
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001910775275741228,
      "loss": 1.0267,
      "step": 2449
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019107032048143276,
      "loss": 1.102,
      "step": 2450
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019106311061519856,
      "loss": 1.0434,
      "step": 2451
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019105589797563965,
      "loss": 0.9669,
      "step": 2452
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.00019104868256297582,
      "loss": 0.9829,
      "step": 2453
    },
    {
      "epoch": 0.54,
      "learning_rate": 0.0001910414643774267,
      "loss": 0.9927,
      "step": 2454
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019103424341921222,
      "loss": 1.1225,
      "step": 2455
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019102701968855222,
      "loss": 1.014,
      "step": 2456
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001910197931856667,
      "loss": 0.9329,
      "step": 2457
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019101256391077583,
      "loss": 0.9361,
      "step": 2458
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019100533186409968,
      "loss": 0.8985,
      "step": 2459
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019099809704585852,
      "loss": 0.898,
      "step": 2460
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019099085945627274,
      "loss": 1.0093,
      "step": 2461
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001909836190955627,
      "loss": 1.0061,
      "step": 2462
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019097637596394892,
      "loss": 0.9952,
      "step": 2463
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019096913006165202,
      "loss": 1.0558,
      "step": 2464
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019096188138889263,
      "loss": 0.9673,
      "step": 2465
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019095462994589155,
      "loss": 0.9914,
      "step": 2466
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001909473757328696,
      "loss": 1.001,
      "step": 2467
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001909401187500477,
      "loss": 1.072,
      "step": 2468
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019093285899764685,
      "loss": 1.0592,
      "step": 2469
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001909255964758882,
      "loss": 0.9439,
      "step": 2470
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019091833118499289,
      "loss": 0.9639,
      "step": 2471
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019091106312518218,
      "loss": 0.9976,
      "step": 2472
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019090379229667743,
      "loss": 0.9765,
      "step": 2473
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019089651869970008,
      "loss": 0.8628,
      "step": 2474
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019088924233447163,
      "loss": 0.9427,
      "step": 2475
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001908819632012137,
      "loss": 0.9681,
      "step": 2476
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019087468130014797,
      "loss": 0.9741,
      "step": 2477
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019086739663149617,
      "loss": 0.9247,
      "step": 2478
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019086010919548024,
      "loss": 1.0419,
      "step": 2479
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019085281899232205,
      "loss": 1.0188,
      "step": 2480
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019084552602224362,
      "loss": 1.0179,
      "step": 2481
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001908382302854671,
      "loss": 1.0476,
      "step": 2482
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019083093178221466,
      "loss": 0.9964,
      "step": 2483
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019082363051270857,
      "loss": 1.0127,
      "step": 2484
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001908163264771712,
      "loss": 1.0375,
      "step": 2485
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.000190809019675825,
      "loss": 1.022,
      "step": 2486
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019080171010889247,
      "loss": 0.9985,
      "step": 2487
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019079439777659624,
      "loss": 0.9163,
      "step": 2488
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019078708267915903,
      "loss": 1.0189,
      "step": 2489
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001907797648168036,
      "loss": 0.886,
      "step": 2490
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001907724441897528,
      "loss": 0.9139,
      "step": 2491
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019076512079822962,
      "loss": 0.9795,
      "step": 2492
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019075779464245704,
      "loss": 1.0582,
      "step": 2493
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019075046572265822,
      "loss": 1.0496,
      "step": 2494
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019074313403905633,
      "loss": 0.9422,
      "step": 2495
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019073579959187468,
      "loss": 1.0076,
      "step": 2496
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.00019072846238133665,
      "loss": 0.9756,
      "step": 2497
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001907211224076657,
      "loss": 0.9231,
      "step": 2498
    },
    {
      "epoch": 0.55,
      "learning_rate": 0.0001907137796710853,
      "loss": 0.9842,
      "step": 2499
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019070643417181914,
      "loss": 1.0645,
      "step": 2500
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001906990859100909,
      "loss": 0.9065,
      "step": 2501
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019069173488612441,
      "loss": 1.0204,
      "step": 2502
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001906843811001435,
      "loss": 0.9289,
      "step": 2503
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019067702455237214,
      "loss": 0.9034,
      "step": 2504
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019066966524303438,
      "loss": 1.0818,
      "step": 2505
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019066230317235433,
      "loss": 1.0259,
      "step": 2506
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019065493834055622,
      "loss": 1.0072,
      "step": 2507
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019064757074786437,
      "loss": 1.0875,
      "step": 2508
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001906402003945031,
      "loss": 0.9242,
      "step": 2509
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019063282728069692,
      "loss": 0.9116,
      "step": 2510
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019062545140667036,
      "loss": 1.1267,
      "step": 2511
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019061807277264805,
      "loss": 0.9767,
      "step": 2512
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001906106913788547,
      "loss": 0.9969,
      "step": 2513
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019060330722551515,
      "loss": 1.0102,
      "step": 2514
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019059592031285427,
      "loss": 0.9217,
      "step": 2515
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019058853064109695,
      "loss": 0.9869,
      "step": 2516
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001905811382104684,
      "loss": 0.943,
      "step": 2517
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019057374302119357,
      "loss": 1.1038,
      "step": 2518
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019056634507349783,
      "loss": 1.01,
      "step": 2519
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019055894436760643,
      "loss": 1.0496,
      "step": 2520
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019055154090374474,
      "loss": 0.8667,
      "step": 2521
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019054413468213826,
      "loss": 0.8922,
      "step": 2522
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001905367257030125,
      "loss": 0.9668,
      "step": 2523
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019052931396659317,
      "loss": 0.9635,
      "step": 2524
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019052189947310594,
      "loss": 0.9059,
      "step": 2525
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019051448222277663,
      "loss": 1.0271,
      "step": 2526
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019050706221583117,
      "loss": 1.0366,
      "step": 2527
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019049963945249546,
      "loss": 0.9152,
      "step": 2528
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019049221393299565,
      "loss": 1.0026,
      "step": 2529
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019048478565755782,
      "loss": 1.019,
      "step": 2530
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019047735462640825,
      "loss": 0.9784,
      "step": 2531
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019046992083977316,
      "loss": 0.8982,
      "step": 2532
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019046248429787906,
      "loss": 1.0533,
      "step": 2533
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019045504500095234,
      "loss": 0.9733,
      "step": 2534
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001904476029492196,
      "loss": 0.8271,
      "step": 2535
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019044015814290751,
      "loss": 0.9662,
      "step": 2536
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019043271058224277,
      "loss": 1.1361,
      "step": 2537
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001904252602674522,
      "loss": 0.8412,
      "step": 2538
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001904178071987627,
      "loss": 0.8089,
      "step": 2539
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019041035137640127,
      "loss": 0.9908,
      "step": 2540
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019040289280059493,
      "loss": 0.9844,
      "step": 2541
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.0001903954314715709,
      "loss": 0.9681,
      "step": 2542
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019038796738955632,
      "loss": 0.9267,
      "step": 2543
    },
    {
      "epoch": 0.56,
      "learning_rate": 0.00019038050055477862,
      "loss": 1.0669,
      "step": 2544
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019037303096746514,
      "loss": 1.0614,
      "step": 2545
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019036555862784335,
      "loss": 0.9289,
      "step": 2546
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019035808353614085,
      "loss": 1.0589,
      "step": 2547
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019035060569258533,
      "loss": 0.8234,
      "step": 2548
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019034312509740443,
      "loss": 0.8866,
      "step": 2549
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019033564175082606,
      "loss": 0.9899,
      "step": 2550
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019032815565307807,
      "loss": 0.8007,
      "step": 2551
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019032066680438846,
      "loss": 0.9737,
      "step": 2552
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019031317520498532,
      "loss": 0.9163,
      "step": 2553
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019030568085509684,
      "loss": 0.8406,
      "step": 2554
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019029818375495118,
      "loss": 0.9625,
      "step": 2555
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019029068390477672,
      "loss": 1.0849,
      "step": 2556
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019028318130480184,
      "loss": 1.0115,
      "step": 2557
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019027567595525507,
      "loss": 0.9449,
      "step": 2558
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019026816785636493,
      "loss": 0.9702,
      "step": 2559
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001902606570083601,
      "loss": 0.9516,
      "step": 2560
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019025314341146934,
      "loss": 0.9801,
      "step": 2561
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019024562706592148,
      "loss": 0.811,
      "step": 2562
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019023810797194542,
      "loss": 0.9662,
      "step": 2563
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019023058612977013,
      "loss": 0.9409,
      "step": 2564
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001902230615396247,
      "loss": 0.9479,
      "step": 2565
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019021553420173833,
      "loss": 0.9965,
      "step": 2566
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019020800411634022,
      "loss": 1.0099,
      "step": 2567
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001902004712836597,
      "loss": 0.9577,
      "step": 2568
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001901929357039262,
      "loss": 1.0607,
      "step": 2569
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001901853973773692,
      "loss": 0.9744,
      "step": 2570
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019017785630421835,
      "loss": 1.0394,
      "step": 2571
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019017031248470318,
      "loss": 1.0152,
      "step": 2572
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019016276591905354,
      "loss": 1.0175,
      "step": 2573
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019015521660749923,
      "loss": 0.9512,
      "step": 2574
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019014766455027017,
      "loss": 0.9977,
      "step": 2575
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019014010974759634,
      "loss": 0.919,
      "step": 2576
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019013255219970784,
      "loss": 0.9942,
      "step": 2577
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001901249919068348,
      "loss": 1.0108,
      "step": 2578
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019011742886920754,
      "loss": 0.9731,
      "step": 2579
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019010986308705632,
      "loss": 0.8974,
      "step": 2580
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001901022945606116,
      "loss": 0.9797,
      "step": 2581
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019009472329010386,
      "loss": 1.0166,
      "step": 2582
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001900871492757637,
      "loss": 1.0621,
      "step": 2583
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019007957251782176,
      "loss": 0.9087,
      "step": 2584
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.0001900719930165088,
      "loss": 0.9499,
      "step": 2585
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019006441077205568,
      "loss": 1.0229,
      "step": 2586
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019005682578469325,
      "loss": 1.0341,
      "step": 2587
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019004923805465257,
      "loss": 1.0762,
      "step": 2588
    },
    {
      "epoch": 0.57,
      "learning_rate": 0.00019004164758216474,
      "loss": 0.9772,
      "step": 2589
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00019003405436746087,
      "loss": 0.9206,
      "step": 2590
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00019002645841077225,
      "loss": 1.0224,
      "step": 2591
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001900188597123302,
      "loss": 0.8794,
      "step": 2592
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001900112582723661,
      "loss": 0.9865,
      "step": 2593
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00019000365409111157,
      "loss": 0.9653,
      "step": 2594
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018999604716879803,
      "loss": 1.0074,
      "step": 2595
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018998843750565728,
      "loss": 0.9965,
      "step": 2596
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018998082510192105,
      "loss": 1.0759,
      "step": 2597
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018997320995782114,
      "loss": 1.0551,
      "step": 2598
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018996559207358943,
      "loss": 0.9376,
      "step": 2599
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018995797144945805,
      "loss": 1.0226,
      "step": 2600
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018995034808565894,
      "loss": 0.9578,
      "step": 2601
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001899427219824244,
      "loss": 1.0126,
      "step": 2602
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001899350931399866,
      "loss": 0.9469,
      "step": 2603
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001899274615585779,
      "loss": 0.9809,
      "step": 2604
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018991982723843068,
      "loss": 1.0192,
      "step": 2605
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018991219017977756,
      "loss": 1.0003,
      "step": 2606
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.000189904550382851,
      "loss": 0.866,
      "step": 2607
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018989690784788373,
      "loss": 0.9788,
      "step": 2608
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001898892625751085,
      "loss": 1.119,
      "step": 2609
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018988161456475809,
      "loss": 0.9508,
      "step": 2610
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001898739638170655,
      "loss": 0.9641,
      "step": 2611
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018986631033226373,
      "loss": 1.034,
      "step": 2612
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001898586541105858,
      "loss": 1.1043,
      "step": 2613
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001898509951522649,
      "loss": 0.8689,
      "step": 2614
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018984333345753432,
      "loss": 1.0814,
      "step": 2615
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001898356690266274,
      "loss": 0.9343,
      "step": 2616
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001898280018597775,
      "loss": 0.99,
      "step": 2617
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001898203319572182,
      "loss": 0.979,
      "step": 2618
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018981265931918305,
      "loss": 0.9675,
      "step": 2619
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001898049839459057,
      "loss": 1.0068,
      "step": 2620
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001897973058376199,
      "loss": 1.055,
      "step": 2621
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018978962499455952,
      "loss": 0.9725,
      "step": 2622
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001897819414169585,
      "loss": 0.9691,
      "step": 2623
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018977425510505075,
      "loss": 0.993,
      "step": 2624
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018976656605907048,
      "loss": 1.075,
      "step": 2625
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018975887427925177,
      "loss": 1.0335,
      "step": 2626
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001897511797658289,
      "loss": 0.9429,
      "step": 2627
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001897434825190362,
      "loss": 0.9312,
      "step": 2628
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001897357825391081,
      "loss": 0.9613,
      "step": 2629
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.0001897280798262791,
      "loss": 0.9233,
      "step": 2630
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018972037438078377,
      "loss": 1.0922,
      "step": 2631
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018971266620285683,
      "loss": 1.0399,
      "step": 2632
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.00018970495529273292,
      "loss": 1.0168,
      "step": 2633
    },
    {
      "epoch": 0.58,
      "learning_rate": 0.000189697241650647,
      "loss": 0.8943,
      "step": 2634
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018968952527683396,
      "loss": 0.9167,
      "step": 2635
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001896818061715288,
      "loss": 0.9567,
      "step": 2636
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018967408433496653,
      "loss": 1.0159,
      "step": 2637
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018966635976738237,
      "loss": 1.0702,
      "step": 2638
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018965863246901162,
      "loss": 0.8841,
      "step": 2639
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018965090244008956,
      "loss": 1.108,
      "step": 2640
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018964316968085162,
      "loss": 1.0654,
      "step": 2641
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018963543419153327,
      "loss": 0.7772,
      "step": 2642
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018962769597237014,
      "loss": 1.0071,
      "step": 2643
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018961995502359788,
      "loss": 0.9285,
      "step": 2644
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018961221134545226,
      "loss": 0.8565,
      "step": 2645
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001896044649381691,
      "loss": 0.9842,
      "step": 2646
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018959671580198427,
      "loss": 0.9986,
      "step": 2647
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018958896393713386,
      "loss": 0.9367,
      "step": 2648
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018958120934385388,
      "loss": 0.8552,
      "step": 2649
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018957345202238053,
      "loss": 0.9628,
      "step": 2650
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018956569197295004,
      "loss": 0.9595,
      "step": 2651
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018955792919579876,
      "loss": 1.0462,
      "step": 2652
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001895501636911631,
      "loss": 0.8916,
      "step": 2653
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018954239545927954,
      "loss": 0.9747,
      "step": 2654
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001895346245003847,
      "loss": 1.1022,
      "step": 2655
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001895268508147152,
      "loss": 0.8942,
      "step": 2656
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001895190744025078,
      "loss": 0.9098,
      "step": 2657
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018951129526399935,
      "loss": 0.9911,
      "step": 2658
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018950351339942678,
      "loss": 1.1645,
      "step": 2659
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018949572880902702,
      "loss": 0.9208,
      "step": 2660
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001894879414930372,
      "loss": 0.8985,
      "step": 2661
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018948015145169446,
      "loss": 0.9542,
      "step": 2662
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018947235868523607,
      "loss": 0.9815,
      "step": 2663
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018946456319389934,
      "loss": 0.9694,
      "step": 2664
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001894567649779217,
      "loss": 1.0149,
      "step": 2665
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018944896403754063,
      "loss": 1.0543,
      "step": 2666
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018944116037299368,
      "loss": 1.0116,
      "step": 2667
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018943335398451856,
      "loss": 1.0393,
      "step": 2668
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018942554487235298,
      "loss": 0.8918,
      "step": 2669
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018941773303673477,
      "loss": 1.0242,
      "step": 2670
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001894099184779019,
      "loss": 1.0228,
      "step": 2671
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018940210119609225,
      "loss": 0.9935,
      "step": 2672
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.000189394281191544,
      "loss": 1.0107,
      "step": 2673
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018938645846449523,
      "loss": 0.9237,
      "step": 2674
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018937863301518422,
      "loss": 1.011,
      "step": 2675
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.0001893708048438493,
      "loss": 1.0117,
      "step": 2676
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018936297395072884,
      "loss": 0.9418,
      "step": 2677
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018935514033606137,
      "loss": 0.9509,
      "step": 2678
    },
    {
      "epoch": 0.59,
      "learning_rate": 0.00018934730400008544,
      "loss": 0.9946,
      "step": 2679
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001893394649430397,
      "loss": 0.8825,
      "step": 2680
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018933162316516297,
      "loss": 1.0351,
      "step": 2681
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018932377866669393,
      "loss": 0.9701,
      "step": 2682
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018931593144787154,
      "loss": 0.8896,
      "step": 2683
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018930808150893484,
      "loss": 0.9099,
      "step": 2684
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018930022885012287,
      "loss": 1.0401,
      "step": 2685
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018929237347167476,
      "loss": 0.9797,
      "step": 2686
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018928451537382975,
      "loss": 1.016,
      "step": 2687
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001892766545568272,
      "loss": 0.9317,
      "step": 2688
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018926879102090644,
      "loss": 1.0037,
      "step": 2689
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.000189260924766307,
      "loss": 1.0048,
      "step": 2690
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018925305579326843,
      "loss": 0.9099,
      "step": 2691
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018924518410203044,
      "loss": 1.0058,
      "step": 2692
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018923730969283266,
      "loss": 1.0469,
      "step": 2693
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018922943256591496,
      "loss": 0.9725,
      "step": 2694
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018922155272151726,
      "loss": 0.8171,
      "step": 2695
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001892136701598795,
      "loss": 0.9545,
      "step": 2696
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018920578488124178,
      "loss": 1.0656,
      "step": 2697
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018919789688584418,
      "loss": 0.9875,
      "step": 2698
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018919000617392698,
      "loss": 1.1312,
      "step": 2699
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001891821127457305,
      "loss": 0.9652,
      "step": 2700
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001891742166014951,
      "loss": 0.9664,
      "step": 2701
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001891663177414613,
      "loss": 1.0002,
      "step": 2702
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018915841616586962,
      "loss": 1.0625,
      "step": 2703
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001891505118749607,
      "loss": 0.8867,
      "step": 2704
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001891426048689753,
      "loss": 0.9655,
      "step": 2705
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018913469514815422,
      "loss": 0.9609,
      "step": 2706
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001891267827127383,
      "loss": 0.8887,
      "step": 2707
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018911886756296857,
      "loss": 1.0813,
      "step": 2708
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018911094969908607,
      "loss": 1.0378,
      "step": 2709
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018910302912133196,
      "loss": 0.9596,
      "step": 2710
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018909510582994742,
      "loss": 1.0556,
      "step": 2711
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018908717982517374,
      "loss": 1.112,
      "step": 2712
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018907925110725238,
      "loss": 0.8725,
      "step": 2713
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018907131967642473,
      "loss": 1.021,
      "step": 2714
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001890633855329324,
      "loss": 0.8008,
      "step": 2715
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.000189055448677017,
      "loss": 0.9296,
      "step": 2716
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018904750910892022,
      "loss": 1.0362,
      "step": 2717
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018903956682888394,
      "loss": 0.8448,
      "step": 2718
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018903162183714993,
      "loss": 1.0534,
      "step": 2719
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018902367413396024,
      "loss": 0.9572,
      "step": 2720
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.0001890157237195569,
      "loss": 0.9016,
      "step": 2721
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.000189007770594182,
      "loss": 0.8768,
      "step": 2722
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018899981475807782,
      "loss": 0.9924,
      "step": 2723
    },
    {
      "epoch": 0.6,
      "learning_rate": 0.00018899185621148662,
      "loss": 0.9555,
      "step": 2724
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018898389495465074,
      "loss": 0.9988,
      "step": 2725
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001889759309878127,
      "loss": 0.8864,
      "step": 2726
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.000188967964311215,
      "loss": 0.9694,
      "step": 2727
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001889599949251003,
      "loss": 1.0984,
      "step": 2728
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018895202282971128,
      "loss": 0.9291,
      "step": 2729
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018894404802529072,
      "loss": 0.9392,
      "step": 2730
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018893607051208156,
      "loss": 0.9264,
      "step": 2731
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018892809029032667,
      "loss": 1.1114,
      "step": 2732
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018892010736026914,
      "loss": 0.986,
      "step": 2733
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018891212172215206,
      "loss": 1.006,
      "step": 2734
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018890413337621867,
      "loss": 0.9929,
      "step": 2735
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001888961423227122,
      "loss": 1.0351,
      "step": 2736
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018888814856187606,
      "loss": 0.983,
      "step": 2737
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018888015209395372,
      "loss": 1.0114,
      "step": 2738
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018887215291918863,
      "loss": 1.026,
      "step": 2739
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018886415103782449,
      "loss": 1.0171,
      "step": 2740
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018885614645010494,
      "loss": 1.1592,
      "step": 2741
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001888481391562738,
      "loss": 0.9578,
      "step": 2742
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001888401291565749,
      "loss": 0.9917,
      "step": 2743
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018883211645125223,
      "loss": 0.8561,
      "step": 2744
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018882410104054974,
      "loss": 1.0113,
      "step": 2745
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001888160829247116,
      "loss": 0.9387,
      "step": 2746
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.000188808062103982,
      "loss": 0.9551,
      "step": 2747
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001888000385786052,
      "loss": 0.9669,
      "step": 2748
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018879201234882557,
      "loss": 0.9023,
      "step": 2749
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001887839834148875,
      "loss": 0.9232,
      "step": 2750
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018877595177703554,
      "loss": 0.908,
      "step": 2751
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001887679174355143,
      "loss": 1.0193,
      "step": 2752
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018875988039056848,
      "loss": 0.8206,
      "step": 2753
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018875184064244283,
      "loss": 1.2381,
      "step": 2754
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018874379819138222,
      "loss": 0.8815,
      "step": 2755
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018873575303763156,
      "loss": 0.9627,
      "step": 2756
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018872770518143584,
      "loss": 1.0334,
      "step": 2757
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018871965462304022,
      "loss": 1.0136,
      "step": 2758
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001887116013626898,
      "loss": 0.9631,
      "step": 2759
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018870354540062996,
      "loss": 1.0226,
      "step": 2760
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018869548673710592,
      "loss": 0.9357,
      "step": 2761
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001886874253723632,
      "loss": 0.9072,
      "step": 2762
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018867936130664723,
      "loss": 1.0399,
      "step": 2763
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018867129454020365,
      "loss": 1.0671,
      "step": 2764
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018866322507327815,
      "loss": 1.11,
      "step": 2765
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018865515290611643,
      "loss": 0.9469,
      "step": 2766
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018864707803896433,
      "loss": 0.9817,
      "step": 2767
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.00018863900047206783,
      "loss": 1.0617,
      "step": 2768
    },
    {
      "epoch": 0.61,
      "learning_rate": 0.0001886309202056729,
      "loss": 1.0579,
      "step": 2769
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.0001886228372400256,
      "loss": 0.9277,
      "step": 2770
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018861475157537215,
      "loss": 1.1224,
      "step": 2771
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018860666321195873,
      "loss": 1.0267,
      "step": 2772
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018859857215003172,
      "loss": 0.9033,
      "step": 2773
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018859047838983752,
      "loss": 0.8849,
      "step": 2774
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018858238193162263,
      "loss": 0.8589,
      "step": 2775
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018857428277563364,
      "loss": 1.0767,
      "step": 2776
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018856618092211714,
      "loss": 1.0424,
      "step": 2777
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018855807637132,
      "loss": 1.0249,
      "step": 2778
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.0001885499691234889,
      "loss": 0.9475,
      "step": 2779
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018854185917887084,
      "loss": 1.0818,
      "step": 2780
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018853374653771278,
      "loss": 1.0002,
      "step": 2781
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.0001885256312002618,
      "loss": 0.986,
      "step": 2782
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018851751316676505,
      "loss": 1.0356,
      "step": 2783
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018850939243746976,
      "loss": 1.1801,
      "step": 2784
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018850126901262323,
      "loss": 1.0511,
      "step": 2785
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018849314289247292,
      "loss": 1.0368,
      "step": 2786
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018848501407726622,
      "loss": 1.0153,
      "step": 2787
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018847688256725073,
      "loss": 0.8257,
      "step": 2788
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018846874836267414,
      "loss": 0.9443,
      "step": 2789
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018846061146378411,
      "loss": 0.8177,
      "step": 2790
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.0001884524718708285,
      "loss": 0.9639,
      "step": 2791
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018844432958405518,
      "loss": 0.9095,
      "step": 2792
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018843618460371211,
      "loss": 0.9628,
      "step": 2793
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018842803693004735,
      "loss": 0.986,
      "step": 2794
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018841988656330907,
      "loss": 0.9891,
      "step": 2795
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018841173350374546,
      "loss": 0.9831,
      "step": 2796
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018840357775160485,
      "loss": 0.9591,
      "step": 2797
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018839541930713556,
      "loss": 0.8924,
      "step": 2798
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.0001883872581705861,
      "loss": 1.0116,
      "step": 2799
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018837909434220502,
      "loss": 0.9285,
      "step": 2800
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018837092782224095,
      "loss": 0.9329,
      "step": 2801
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.0001883627586109426,
      "loss": 0.7499,
      "step": 2802
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018835458670855872,
      "loss": 0.9982,
      "step": 2803
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018834641211533826,
      "loss": 0.9776,
      "step": 2804
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018833823483153011,
      "loss": 1.0871,
      "step": 2805
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018833005485738335,
      "loss": 0.9005,
      "step": 2806
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.0001883218721931471,
      "loss": 0.962,
      "step": 2807
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018831368683907052,
      "loss": 0.9526,
      "step": 2808
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018830549879540292,
      "loss": 0.883,
      "step": 2809
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.0001882973080623937,
      "loss": 0.975,
      "step": 2810
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018828911464029228,
      "loss": 1.0392,
      "step": 2811
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018828091852934818,
      "loss": 0.9814,
      "step": 2812
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018827271972981103,
      "loss": 1.0303,
      "step": 2813
    },
    {
      "epoch": 0.62,
      "learning_rate": 0.00018826451824193051,
      "loss": 1.0212,
      "step": 2814
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018825631406595644,
      "loss": 0.9908,
      "step": 2815
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018824810720213862,
      "loss": 0.9537,
      "step": 2816
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018823989765072698,
      "loss": 0.9336,
      "step": 2817
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018823168541197159,
      "loss": 0.9335,
      "step": 2818
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018822347048612253,
      "loss": 0.9722,
      "step": 2819
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018821525287343,
      "loss": 1.1006,
      "step": 2820
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001882070325741443,
      "loss": 0.8459,
      "step": 2821
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018819880958851568,
      "loss": 1.032,
      "step": 2822
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018819058391679466,
      "loss": 1.05,
      "step": 2823
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001881823555592317,
      "loss": 1.0307,
      "step": 2824
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018817412451607743,
      "loss": 0.8432,
      "step": 2825
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018816589078758252,
      "loss": 0.8641,
      "step": 2826
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018815765437399772,
      "loss": 1.1001,
      "step": 2827
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018814941527557383,
      "loss": 0.9957,
      "step": 2828
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018814117349256183,
      "loss": 1.1903,
      "step": 2829
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018813292902521272,
      "loss": 1.0366,
      "step": 2830
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001881246818737776,
      "loss": 0.9229,
      "step": 2831
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018811643203850756,
      "loss": 0.9674,
      "step": 2832
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001881081795196539,
      "loss": 1.0241,
      "step": 2833
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018809992431746795,
      "loss": 1.066,
      "step": 2834
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001880916664322011,
      "loss": 0.9577,
      "step": 2835
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018808340586410488,
      "loss": 0.9285,
      "step": 2836
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018807514261343083,
      "loss": 0.9619,
      "step": 2837
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018806687668043067,
      "loss": 1.0512,
      "step": 2838
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018805860806535605,
      "loss": 0.9926,
      "step": 2839
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018805033676845884,
      "loss": 0.9326,
      "step": 2840
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018804206278999095,
      "loss": 0.9118,
      "step": 2841
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018803378613020436,
      "loss": 1.069,
      "step": 2842
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001880255067893511,
      "loss": 0.8093,
      "step": 2843
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018801722476768332,
      "loss": 0.9856,
      "step": 2844
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001880089400654533,
      "loss": 1.1013,
      "step": 2845
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018800065268291332,
      "loss": 0.8929,
      "step": 2846
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018799236262031577,
      "loss": 1.1038,
      "step": 2847
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018798406987791312,
      "loss": 0.8575,
      "step": 2848
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018797577445595792,
      "loss": 0.8608,
      "step": 2849
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018796747635470282,
      "loss": 0.8414,
      "step": 2850
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018795917557440055,
      "loss": 1.174,
      "step": 2851
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001879508721153039,
      "loss": 1.0122,
      "step": 2852
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018794256597766572,
      "loss": 0.9329,
      "step": 2853
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.000187934257161739,
      "loss": 1.0227,
      "step": 2854
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018792594566777683,
      "loss": 0.9625,
      "step": 2855
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001879176314960323,
      "loss": 0.9195,
      "step": 2856
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.00018790931464675856,
      "loss": 0.9383,
      "step": 2857
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.000187900995120209,
      "loss": 0.8838,
      "step": 2858
    },
    {
      "epoch": 0.63,
      "learning_rate": 0.0001878926729166369,
      "loss": 0.9828,
      "step": 2859
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018788434803629575,
      "loss": 0.9581,
      "step": 2860
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001878760204794391,
      "loss": 0.9438,
      "step": 2861
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018786769024632056,
      "loss": 0.9805,
      "step": 2862
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001878593573371938,
      "loss": 0.9647,
      "step": 2863
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018785102175231263,
      "loss": 0.9442,
      "step": 2864
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001878426834919309,
      "loss": 0.9177,
      "step": 2865
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018783434255630256,
      "loss": 1.0569,
      "step": 2866
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018782599894568162,
      "loss": 1.1094,
      "step": 2867
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001878176526603222,
      "loss": 0.9511,
      "step": 2868
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018780930370047844,
      "loss": 0.961,
      "step": 2869
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018780095206640467,
      "loss": 0.9882,
      "step": 2870
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018779259775835518,
      "loss": 0.8547,
      "step": 2871
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018778424077658446,
      "loss": 1.0485,
      "step": 2872
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018777588112134694,
      "loss": 0.9144,
      "step": 2873
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018776751879289732,
      "loss": 0.9614,
      "step": 2874
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001877591537914902,
      "loss": 1.1598,
      "step": 2875
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018775078611738035,
      "loss": 0.988,
      "step": 2876
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001877424157708226,
      "loss": 1.0419,
      "step": 2877
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001877340427520719,
      "loss": 1.0072,
      "step": 2878
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001877256670613832,
      "loss": 0.8651,
      "step": 2879
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018771728869901167,
      "loss": 1.0449,
      "step": 2880
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018770890766521236,
      "loss": 0.9097,
      "step": 2881
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001877005239602406,
      "loss": 0.978,
      "step": 2882
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001876921375843517,
      "loss": 0.9564,
      "step": 2883
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.000187683748537801,
      "loss": 0.9835,
      "step": 2884
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018767535682084408,
      "loss": 0.98,
      "step": 2885
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018766696243373648,
      "loss": 0.9613,
      "step": 2886
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018765856537673382,
      "loss": 0.8857,
      "step": 2887
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018765016565009182,
      "loss": 1.0746,
      "step": 2888
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018764176325406634,
      "loss": 1.0777,
      "step": 2889
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018763335818891327,
      "loss": 0.9293,
      "step": 2890
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001876249504548886,
      "loss": 1.0939,
      "step": 2891
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018761654005224835,
      "loss": 1.0166,
      "step": 2892
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018760812698124867,
      "loss": 1.032,
      "step": 2893
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001875997112421458,
      "loss": 1.0241,
      "step": 2894
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018759129283519598,
      "loss": 1.0202,
      "step": 2895
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018758287176065565,
      "loss": 0.9149,
      "step": 2896
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018757444801878128,
      "loss": 0.9707,
      "step": 2897
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001875660216098294,
      "loss": 1.0363,
      "step": 2898
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001875575925340566,
      "loss": 1.0094,
      "step": 2899
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018754916079171964,
      "loss": 1.0242,
      "step": 2900
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018754072638307525,
      "loss": 1.0827,
      "step": 2901
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.00018753228930838036,
      "loss": 1.0685,
      "step": 2902
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001875238495678919,
      "loss": 0.9755,
      "step": 2903
    },
    {
      "epoch": 0.64,
      "learning_rate": 0.0001875154071618669,
      "loss": 1.0303,
      "step": 2904
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018750696209056245,
      "loss": 1.0027,
      "step": 2905
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018749851435423582,
      "loss": 0.9263,
      "step": 2906
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001874900639531442,
      "loss": 0.8596,
      "step": 2907
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018748161088754498,
      "loss": 1.0702,
      "step": 2908
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018747315515769557,
      "loss": 0.8703,
      "step": 2909
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018746469676385354,
      "loss": 0.9811,
      "step": 2910
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018745623570627645,
      "loss": 0.9062,
      "step": 2911
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018744777198522204,
      "loss": 1.0529,
      "step": 2912
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018743930560094797,
      "loss": 0.9912,
      "step": 2913
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001874308365537122,
      "loss": 0.9394,
      "step": 2914
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018742236484377257,
      "loss": 1.029,
      "step": 2915
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001874138904713871,
      "loss": 0.9632,
      "step": 2916
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018740541343681392,
      "loss": 1.052,
      "step": 2917
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018739693374031114,
      "loss": 0.9536,
      "step": 2918
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018738845138213702,
      "loss": 0.8343,
      "step": 2919
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018737996636254995,
      "loss": 0.8484,
      "step": 2920
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018737147868180828,
      "loss": 0.8796,
      "step": 2921
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018736298834017053,
      "loss": 0.9295,
      "step": 2922
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018735449533789528,
      "loss": 1.0938,
      "step": 2923
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001873459996752411,
      "loss": 0.9673,
      "step": 2924
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018733750135246682,
      "loss": 0.9206,
      "step": 2925
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018732900036983128,
      "loss": 0.8784,
      "step": 2926
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018732049672759326,
      "loss": 0.9461,
      "step": 2927
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018731199042601183,
      "loss": 0.9875,
      "step": 2928
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018730348146534605,
      "loss": 1.0181,
      "step": 2929
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.000187294969845855,
      "loss": 0.9425,
      "step": 2930
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018728645556779795,
      "loss": 1.0379,
      "step": 2931
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001872779386314342,
      "loss": 1.1348,
      "step": 2932
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001872694190370231,
      "loss": 1.1125,
      "step": 2933
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018726089678482413,
      "loss": 0.8314,
      "step": 2934
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018725237187509683,
      "loss": 1.1156,
      "step": 2935
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018724384430810083,
      "loss": 0.9777,
      "step": 2936
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001872353140840959,
      "loss": 0.9661,
      "step": 2937
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001872267812033417,
      "loss": 1.0461,
      "step": 2938
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001872182456660982,
      "loss": 1.0821,
      "step": 2939
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018720970747262533,
      "loss": 0.971,
      "step": 2940
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018720116662318306,
      "loss": 1.0001,
      "step": 2941
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001871926231180316,
      "loss": 1.0186,
      "step": 2942
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018718407695743108,
      "loss": 1.0104,
      "step": 2943
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018717552814164176,
      "loss": 0.983,
      "step": 2944
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018716697667092404,
      "loss": 0.9716,
      "step": 2945
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001871584225455383,
      "loss": 1.0032,
      "step": 2946
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018714986576574515,
      "loss": 1.0893,
      "step": 2947
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.0001871413063318051,
      "loss": 0.9114,
      "step": 2948
    },
    {
      "epoch": 0.65,
      "learning_rate": 0.00018713274424397885,
      "loss": 1.1302,
      "step": 2949
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018712417950252715,
      "loss": 1.0874,
      "step": 2950
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018711561210771086,
      "loss": 1.0258,
      "step": 2951
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001871070420597909,
      "loss": 0.9079,
      "step": 2952
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018709846935902822,
      "loss": 1.0061,
      "step": 2953
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.000187089894005684,
      "loss": 1.0028,
      "step": 2954
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001870813160000193,
      "loss": 0.9332,
      "step": 2955
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018707273534229542,
      "loss": 0.9611,
      "step": 2956
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018706415203277366,
      "loss": 0.9754,
      "step": 2957
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018705556607171543,
      "loss": 0.9033,
      "step": 2958
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018704697745938224,
      "loss": 1.0006,
      "step": 2959
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018703838619603565,
      "loss": 0.9979,
      "step": 2960
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018702979228193726,
      "loss": 1.0145,
      "step": 2961
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018702119571734887,
      "loss": 0.9253,
      "step": 2962
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018701259650253223,
      "loss": 0.9937,
      "step": 2963
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018700399463774924,
      "loss": 0.9338,
      "step": 2964
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018699539012326187,
      "loss": 0.8953,
      "step": 2965
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018698678295933218,
      "loss": 1.0217,
      "step": 2966
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001869781731462223,
      "loss": 1.0427,
      "step": 2967
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018696956068419446,
      "loss": 0.9629,
      "step": 2968
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001869609455735109,
      "loss": 0.9244,
      "step": 2969
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.000186952327814434,
      "loss": 0.9063,
      "step": 2970
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018694370740722632,
      "loss": 1.0583,
      "step": 2971
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018693508435215026,
      "loss": 0.978,
      "step": 2972
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001869264586494685,
      "loss": 1.0215,
      "step": 2973
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018691783029944371,
      "loss": 0.9848,
      "step": 2974
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001869091993023387,
      "loss": 0.8606,
      "step": 2975
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018690056565841628,
      "loss": 0.927,
      "step": 2976
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018689192936793947,
      "loss": 0.9188,
      "step": 2977
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018688329043117116,
      "loss": 1.0169,
      "step": 2978
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018687464884837457,
      "loss": 0.9943,
      "step": 2979
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001868660046198128,
      "loss": 0.924,
      "step": 2980
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018685735774574917,
      "loss": 1.0427,
      "step": 2981
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018684870822644695,
      "loss": 1.1846,
      "step": 2982
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018684005606216963,
      "loss": 0.9554,
      "step": 2983
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018683140125318068,
      "loss": 1.0807,
      "step": 2984
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018682274379974367,
      "loss": 0.9654,
      "step": 2985
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001868140837021223,
      "loss": 1.0683,
      "step": 2986
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018680542096058023,
      "loss": 0.976,
      "step": 2987
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018679675557538143,
      "loss": 0.8819,
      "step": 2988
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018678808754678966,
      "loss": 0.9958,
      "step": 2989
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018677941687506898,
      "loss": 0.9417,
      "step": 2990
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018677074356048342,
      "loss": 0.8873,
      "step": 2991
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018676206760329716,
      "loss": 0.9636,
      "step": 2992
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.0001867533890037744,
      "loss": 1.0728,
      "step": 2993
    },
    {
      "epoch": 0.66,
      "learning_rate": 0.00018674470776217948,
      "loss": 1.0625,
      "step": 2994
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001867360238787767,
      "loss": 0.9043,
      "step": 2995
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018672733735383066,
      "loss": 0.9007,
      "step": 2996
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001867186481876058,
      "loss": 1.0385,
      "step": 2997
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001867099563803668,
      "loss": 1.0614,
      "step": 2998
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018670126193237835,
      "loss": 0.9757,
      "step": 2999
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018669256484390523,
      "loss": 0.9254,
      "step": 3000
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018668386511521234,
      "loss": 0.8526,
      "step": 3001
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001866751627465646,
      "loss": 1.0738,
      "step": 3002
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018666645773822706,
      "loss": 0.9617,
      "step": 3003
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001866577500904648,
      "loss": 0.9865,
      "step": 3004
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018664903980354308,
      "loss": 0.8618,
      "step": 3005
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001866403268777271,
      "loss": 0.9779,
      "step": 3006
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018663161131328223,
      "loss": 0.9834,
      "step": 3007
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018662289311047395,
      "loss": 1.1623,
      "step": 3008
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001866141722695677,
      "loss": 0.9772,
      "step": 3009
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018660544879082913,
      "loss": 1.0087,
      "step": 3010
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018659672267452385,
      "loss": 1.1028,
      "step": 3011
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018658799392091768,
      "loss": 0.9022,
      "step": 3012
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018657926253027644,
      "loss": 0.9854,
      "step": 3013
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018657052850286603,
      "loss": 0.9599,
      "step": 3014
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018656179183895244,
      "loss": 0.9611,
      "step": 3015
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018655305253880173,
      "loss": 0.838,
      "step": 3016
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018654431060268013,
      "loss": 1.0147,
      "step": 3017
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018653556603085377,
      "loss": 0.9666,
      "step": 3018
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018652681882358902,
      "loss": 0.9545,
      "step": 3019
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001865180689811523,
      "loss": 0.9936,
      "step": 3020
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018650931650381004,
      "loss": 1.1216,
      "step": 3021
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018650056139182884,
      "loss": 0.92,
      "step": 3022
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018649180364547528,
      "loss": 0.9706,
      "step": 3023
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018648304326501615,
      "loss": 0.8704,
      "step": 3024
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018647428025071817,
      "loss": 0.8762,
      "step": 3025
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018646551460284826,
      "loss": 0.8774,
      "step": 3026
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001864567463216734,
      "loss": 0.9014,
      "step": 3027
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018644797540746057,
      "loss": 1.0085,
      "step": 3028
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018643920186047695,
      "loss": 0.8545,
      "step": 3029
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001864304256809897,
      "loss": 0.961,
      "step": 3030
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018642164686926606,
      "loss": 1.0072,
      "step": 3031
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018641286542557347,
      "loss": 1.0437,
      "step": 3032
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018640408135017932,
      "loss": 0.8153,
      "step": 3033
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018639529464335115,
      "loss": 1.0075,
      "step": 3034
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018638650530535653,
      "loss": 1.0133,
      "step": 3035
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.0001863777133364632,
      "loss": 1.001,
      "step": 3036
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018636891873693884,
      "loss": 0.9529,
      "step": 3037
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018636012150705133,
      "loss": 0.9817,
      "step": 3038
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018635132164706862,
      "loss": 0.8795,
      "step": 3039
    },
    {
      "epoch": 0.67,
      "learning_rate": 0.00018634251915725862,
      "loss": 1.0489,
      "step": 3040
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018633371403788948,
      "loss": 0.9559,
      "step": 3041
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018632490628922937,
      "loss": 1.1209,
      "step": 3042
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001863160959115465,
      "loss": 0.9223,
      "step": 3043
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001863072829051092,
      "loss": 1.015,
      "step": 3044
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018629846727018584,
      "loss": 1.0835,
      "step": 3045
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018628964900704493,
      "loss": 0.972,
      "step": 3046
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018628082811595505,
      "loss": 0.9202,
      "step": 3047
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001862720045971848,
      "loss": 0.8944,
      "step": 3048
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001862631784510029,
      "loss": 0.9366,
      "step": 3049
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018625434967767815,
      "loss": 0.9216,
      "step": 3050
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001862455182774795,
      "loss": 0.8417,
      "step": 3051
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018623668425067578,
      "loss": 1.1885,
      "step": 3052
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018622784759753618,
      "loss": 0.9859,
      "step": 3053
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018621900831832972,
      "loss": 1.0304,
      "step": 3054
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001862101664133256,
      "loss": 0.9296,
      "step": 3055
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018620132188279317,
      "loss": 1.0985,
      "step": 3056
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001861924747270017,
      "loss": 0.8983,
      "step": 3057
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018618362494622067,
      "loss": 0.8865,
      "step": 3058
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018617477254071965,
      "loss": 0.9917,
      "step": 3059
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018616591751076817,
      "loss": 0.906,
      "step": 3060
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018615705985663592,
      "loss": 0.9764,
      "step": 3061
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018614819957859271,
      "loss": 1.09,
      "step": 3062
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018613933667690832,
      "loss": 1.1331,
      "step": 3063
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018613047115185268,
      "loss": 0.8764,
      "step": 3064
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001861216030036958,
      "loss": 0.9217,
      "step": 3065
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018611273223270779,
      "loss": 1.03,
      "step": 3066
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018610385883915877,
      "loss": 0.8718,
      "step": 3067
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018609498282331897,
      "loss": 0.9704,
      "step": 3068
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018608610418545873,
      "loss": 0.9687,
      "step": 3069
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018607722292584845,
      "loss": 0.8967,
      "step": 3070
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001860683390447586,
      "loss": 1.022,
      "step": 3071
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001860594525424598,
      "loss": 0.8978,
      "step": 3072
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018605056341922257,
      "loss": 0.9411,
      "step": 3073
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018604167167531773,
      "loss": 1.0432,
      "step": 3074
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.000186032777311016,
      "loss": 0.8866,
      "step": 3075
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001860238803265883,
      "loss": 0.8723,
      "step": 3076
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018601498072230558,
      "loss": 0.9497,
      "step": 3077
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018600607849843893,
      "loss": 0.8617,
      "step": 3078
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018599717365525934,
      "loss": 0.9416,
      "step": 3079
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018598826619303815,
      "loss": 0.9255,
      "step": 3080
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018597935611204652,
      "loss": 0.9524,
      "step": 3081
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.0001859704434125559,
      "loss": 0.9164,
      "step": 3082
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018596152809483764,
      "loss": 1.0281,
      "step": 3083
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018595261015916332,
      "loss": 0.8547,
      "step": 3084
    },
    {
      "epoch": 0.68,
      "learning_rate": 0.00018594368960580453,
      "loss": 0.955,
      "step": 3085
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001859347664350329,
      "loss": 1.0195,
      "step": 3086
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018592584064712023,
      "loss": 0.9934,
      "step": 3087
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001859169122423383,
      "loss": 0.9812,
      "step": 3088
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001859079812209591,
      "loss": 0.9534,
      "step": 3089
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018589904758325461,
      "loss": 0.9487,
      "step": 3090
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018589011132949686,
      "loss": 0.9736,
      "step": 3091
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.000185881172459958,
      "loss": 0.8925,
      "step": 3092
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001858722309749103,
      "loss": 0.9104,
      "step": 3093
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018586328687462608,
      "loss": 1.0915,
      "step": 3094
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018585434015937772,
      "loss": 0.9695,
      "step": 3095
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018584539082943763,
      "loss": 0.9549,
      "step": 3096
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018583643888507844,
      "loss": 0.9674,
      "step": 3097
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018582748432657278,
      "loss": 0.9539,
      "step": 3098
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001858185271541933,
      "loss": 1.0522,
      "step": 3099
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018580956736821285,
      "loss": 1.1333,
      "step": 3100
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018580060496890428,
      "loss": 0.9384,
      "step": 3101
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018579163995654052,
      "loss": 0.8628,
      "step": 3102
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018578267233139464,
      "loss": 0.9562,
      "step": 3103
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001857737020937397,
      "loss": 0.9503,
      "step": 3104
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018576472924384895,
      "loss": 0.9671,
      "step": 3105
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001857557537819956,
      "loss": 1.0269,
      "step": 3106
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.000185746775708453,
      "loss": 0.9781,
      "step": 3107
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018573779502349463,
      "loss": 0.9533,
      "step": 3108
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018572881172739393,
      "loss": 0.7373,
      "step": 3109
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018571982582042456,
      "loss": 0.9792,
      "step": 3110
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001857108373028601,
      "loss": 0.8765,
      "step": 3111
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018570184617497436,
      "loss": 0.8512,
      "step": 3112
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018569285243704114,
      "loss": 1.0222,
      "step": 3113
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018568385608933437,
      "loss": 1.0529,
      "step": 3114
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.000185674857132128,
      "loss": 0.9839,
      "step": 3115
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001856658555656961,
      "loss": 0.9704,
      "step": 3116
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018565685139031282,
      "loss": 1.0503,
      "step": 3117
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018564784460625236,
      "loss": 0.9451,
      "step": 3118
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018563883521378907,
      "loss": 1.0024,
      "step": 3119
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001856298232131973,
      "loss": 0.9269,
      "step": 3120
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001856208086047515,
      "loss": 0.9674,
      "step": 3121
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018561179138872622,
      "loss": 1.0417,
      "step": 3122
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018560277156539606,
      "loss": 0.867,
      "step": 3123
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018559374913503578,
      "loss": 1.0283,
      "step": 3124
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018558472409792008,
      "loss": 0.944,
      "step": 3125
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018557569645432387,
      "loss": 0.8935,
      "step": 3126
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018556666620452207,
      "loss": 0.9705,
      "step": 3127
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.0001855576333487897,
      "loss": 0.8764,
      "step": 3128
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018554859788740187,
      "loss": 0.8866,
      "step": 3129
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00018553955982063372,
      "loss": 0.9759,
      "step": 3130
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001855305191487605,
      "loss": 1.004,
      "step": 3131
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001855214758720576,
      "loss": 0.9752,
      "step": 3132
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018551242999080035,
      "loss": 0.916,
      "step": 3133
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018550338150526434,
      "loss": 0.9526,
      "step": 3134
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018549433041572505,
      "loss": 1.0936,
      "step": 3135
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001854852767224582,
      "loss": 0.9771,
      "step": 3136
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018547622042573947,
      "loss": 1.1076,
      "step": 3137
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001854671615258447,
      "loss": 0.9686,
      "step": 3138
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018545810002304976,
      "loss": 1.0679,
      "step": 3139
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018544903591763065,
      "loss": 0.9314,
      "step": 3140
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001854399692098634,
      "loss": 0.9457,
      "step": 3141
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001854308999000241,
      "loss": 1.0127,
      "step": 3142
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.000185421827988389,
      "loss": 1.0716,
      "step": 3143
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018541275347523436,
      "loss": 0.8045,
      "step": 3144
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018540367636083656,
      "loss": 1.0305,
      "step": 3145
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018539459664547204,
      "loss": 0.8621,
      "step": 3146
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018538551432941734,
      "loss": 0.9259,
      "step": 3147
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.000185376429412949,
      "loss": 1.0005,
      "step": 3148
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018536734189634376,
      "loss": 0.8689,
      "step": 3149
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018535825177987838,
      "loss": 0.9874,
      "step": 3150
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018534915906382967,
      "loss": 0.937,
      "step": 3151
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018534006374847455,
      "loss": 0.9217,
      "step": 3152
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018533096583409005,
      "loss": 0.8964,
      "step": 3153
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018532186532095322,
      "loss": 0.9722,
      "step": 3154
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018531276220934122,
      "loss": 0.8432,
      "step": 3155
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018530365649953128,
      "loss": 0.8951,
      "step": 3156
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001852945481918007,
      "loss": 0.913,
      "step": 3157
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018528543728642694,
      "loss": 0.9997,
      "step": 3158
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018527632378368737,
      "loss": 0.9352,
      "step": 3159
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018526720768385967,
      "loss": 0.9168,
      "step": 3160
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018525808898722134,
      "loss": 1.0242,
      "step": 3161
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001852489676940502,
      "loss": 1.1251,
      "step": 3162
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001852398438046239,
      "loss": 0.9986,
      "step": 3163
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018523071731922045,
      "loss": 1.1238,
      "step": 3164
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018522158823811776,
      "loss": 0.9119,
      "step": 3165
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018521245656159382,
      "loss": 0.9249,
      "step": 3166
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018520332228992673,
      "loss": 0.9851,
      "step": 3167
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.0001851941854233947,
      "loss": 1.042,
      "step": 3168
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018518504596227601,
      "loss": 0.9133,
      "step": 3169
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.000185175903906849,
      "loss": 0.9305,
      "step": 3170
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018516675925739202,
      "loss": 1.0342,
      "step": 3171
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018515761201418364,
      "loss": 0.9089,
      "step": 3172
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018514846217750243,
      "loss": 0.8941,
      "step": 3173
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018513930974762703,
      "loss": 0.9822,
      "step": 3174
    },
    {
      "epoch": 0.7,
      "learning_rate": 0.00018513015472483623,
      "loss": 0.8111,
      "step": 3175
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018512099710940873,
      "loss": 1.6494,
      "step": 3176
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018511183690162356,
      "loss": 0.8781,
      "step": 3177
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018510267410175958,
      "loss": 0.9974,
      "step": 3178
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001850935087100959,
      "loss": 0.9887,
      "step": 3179
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018508434072691168,
      "loss": 0.9619,
      "step": 3180
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018507517015248608,
      "loss": 0.9519,
      "step": 3181
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001850659969870984,
      "loss": 0.9892,
      "step": 3182
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018505682123102802,
      "loss": 0.9876,
      "step": 3183
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018504764288455438,
      "loss": 0.9673,
      "step": 3184
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.000185038461947957,
      "loss": 0.9155,
      "step": 3185
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018502927842151552,
      "loss": 0.9289,
      "step": 3186
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018502009230550955,
      "loss": 0.972,
      "step": 3187
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018501090360021895,
      "loss": 0.8786,
      "step": 3188
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018500171230592349,
      "loss": 0.9952,
      "step": 3189
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001849925184229031,
      "loss": 0.9752,
      "step": 3190
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018498332195143781,
      "loss": 0.8393,
      "step": 3191
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001849741228918077,
      "loss": 0.9951,
      "step": 3192
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018496492124429287,
      "loss": 1.0805,
      "step": 3193
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018495571700917363,
      "loss": 0.9127,
      "step": 3194
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018494651018673023,
      "loss": 0.9935,
      "step": 3195
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001849373007772431,
      "loss": 1.0497,
      "step": 3196
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001849280887809927,
      "loss": 0.9538,
      "step": 3197
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018491887419825958,
      "loss": 1.0308,
      "step": 3198
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001849096570293244,
      "loss": 1.0034,
      "step": 3199
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018490043727446782,
      "loss": 1.0667,
      "step": 3200
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018489121493397065,
      "loss": 0.9283,
      "step": 3201
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018488199000811376,
      "loss": 0.9581,
      "step": 3202
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001848727624971781,
      "loss": 1.2201,
      "step": 3203
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001848635324014447,
      "loss": 1.0359,
      "step": 3204
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018485429972119462,
      "loss": 1.0542,
      "step": 3205
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001848450644567091,
      "loss": 1.0171,
      "step": 3206
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018483582660826936,
      "loss": 0.9998,
      "step": 3207
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001848265861761567,
      "loss": 1.1871,
      "step": 3208
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018481734316065263,
      "loss": 1.0547,
      "step": 3209
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001848080975620386,
      "loss": 1.0069,
      "step": 3210
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018479884938059617,
      "loss": 0.9845,
      "step": 3211
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.000184789598616607,
      "loss": 0.8941,
      "step": 3212
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018478034527035287,
      "loss": 0.96,
      "step": 3213
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018477108934211552,
      "loss": 0.9297,
      "step": 3214
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018476183083217688,
      "loss": 1.0623,
      "step": 3215
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018475256974081886,
      "loss": 1.066,
      "step": 3216
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018474330606832362,
      "loss": 1.0525,
      "step": 3217
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001847340398149732,
      "loss": 0.9354,
      "step": 3218
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.0001847247709810498,
      "loss": 1.1632,
      "step": 3219
    },
    {
      "epoch": 0.71,
      "learning_rate": 0.00018471549956683574,
      "loss": 0.9631,
      "step": 3220
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018470622557261335,
      "loss": 0.8371,
      "step": 3221
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001846969489986651,
      "loss": 0.9746,
      "step": 3222
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001846876698452735,
      "loss": 0.8794,
      "step": 3223
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001846783881127211,
      "loss": 0.9075,
      "step": 3224
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018466910380129066,
      "loss": 0.99,
      "step": 3225
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018465981691126484,
      "loss": 0.9853,
      "step": 3226
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018465052744292654,
      "loss": 0.8311,
      "step": 3227
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018464123539655865,
      "loss": 0.9839,
      "step": 3228
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018463194077244415,
      "loss": 1.0167,
      "step": 3229
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018462264357086615,
      "loss": 0.9835,
      "step": 3230
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001846133437921077,
      "loss": 1.0103,
      "step": 3231
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001846040414364521,
      "loss": 1.0635,
      "step": 3232
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018459473650418268,
      "loss": 1.0594,
      "step": 3233
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018458542899558276,
      "loss": 0.9074,
      "step": 3234
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001845761189109358,
      "loss": 0.9589,
      "step": 3235
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018456680625052538,
      "loss": 0.9827,
      "step": 3236
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018455749101463508,
      "loss": 1.0443,
      "step": 3237
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018454817320354863,
      "loss": 0.9487,
      "step": 3238
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018453885281754977,
      "loss": 0.9138,
      "step": 3239
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018452952985692237,
      "loss": 1.0598,
      "step": 3240
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018452020432195037,
      "loss": 1.0865,
      "step": 3241
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018451087621291774,
      "loss": 0.8558,
      "step": 3242
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018450154553010858,
      "loss": 0.9862,
      "step": 3243
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018449221227380714,
      "loss": 0.9819,
      "step": 3244
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018448287644429754,
      "loss": 0.8498,
      "step": 3245
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018447353804186415,
      "loss": 1.0307,
      "step": 3246
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001844641970667914,
      "loss": 0.9978,
      "step": 3247
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001844548535193637,
      "loss": 0.9029,
      "step": 3248
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001844455073998657,
      "loss": 0.9746,
      "step": 3249
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018443615870858198,
      "loss": 0.9893,
      "step": 3250
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018442680744579722,
      "loss": 1.0224,
      "step": 3251
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018441745361179632,
      "loss": 0.9188,
      "step": 3252
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018440809720686406,
      "loss": 0.7969,
      "step": 3253
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001843987382312854,
      "loss": 0.9287,
      "step": 3254
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001843893766853454,
      "loss": 0.9754,
      "step": 3255
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018438001256932914,
      "loss": 0.935,
      "step": 3256
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018437064588352185,
      "loss": 1.0683,
      "step": 3257
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001843612766282087,
      "loss": 0.8732,
      "step": 3258
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001843519048036751,
      "loss": 0.9745,
      "step": 3259
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018434253041020647,
      "loss": 0.8603,
      "step": 3260
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001843331534480883,
      "loss": 0.8326,
      "step": 3261
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018432377391760612,
      "loss": 0.8998,
      "step": 3262
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018431439181904562,
      "loss": 1.0757,
      "step": 3263
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.00018430500715269253,
      "loss": 0.945,
      "step": 3264
    },
    {
      "epoch": 0.72,
      "learning_rate": 0.0001842956199188327,
      "loss": 0.9206,
      "step": 3265
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018428623011775192,
      "loss": 0.9517,
      "step": 3266
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018427683774973626,
      "loss": 1.0542,
      "step": 3267
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001842674428150717,
      "loss": 0.9049,
      "step": 3268
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018425804531404437,
      "loss": 1.0552,
      "step": 3269
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001842486452469405,
      "loss": 0.9127,
      "step": 3270
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018423924261404633,
      "loss": 0.8513,
      "step": 3271
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018422983741564825,
      "loss": 1.0504,
      "step": 3272
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018422042965203267,
      "loss": 0.9816,
      "step": 3273
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018421101932348613,
      "loss": 1.021,
      "step": 3274
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018420160643029522,
      "loss": 0.9404,
      "step": 3275
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001841921909727466,
      "loss": 0.975,
      "step": 3276
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018418277295112698,
      "loss": 0.8937,
      "step": 3277
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018417335236572323,
      "loss": 0.9632,
      "step": 3278
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018416392921682224,
      "loss": 1.0139,
      "step": 3279
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018415450350471103,
      "loss": 0.9735,
      "step": 3280
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018414507522967658,
      "loss": 1.0015,
      "step": 3281
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001841356443920061,
      "loss": 0.9374,
      "step": 3282
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018412621099198675,
      "loss": 0.8918,
      "step": 3283
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018411677502990588,
      "loss": 0.8518,
      "step": 3284
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018410733650605084,
      "loss": 0.9676,
      "step": 3285
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018409789542070902,
      "loss": 0.9639,
      "step": 3286
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018408845177416807,
      "loss": 1.0319,
      "step": 3287
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001840790055667155,
      "loss": 0.8457,
      "step": 3288
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018406955679863902,
      "loss": 0.86,
      "step": 3289
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018406010547022638,
      "loss": 0.8967,
      "step": 3290
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018405065158176543,
      "loss": 0.8928,
      "step": 3291
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001840411951335441,
      "loss": 1.0091,
      "step": 3292
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018403173612585043,
      "loss": 0.853,
      "step": 3293
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001840222745589724,
      "loss": 0.8769,
      "step": 3294
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001840128104331982,
      "loss": 1.0464,
      "step": 3295
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018400334374881608,
      "loss": 0.957,
      "step": 3296
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001839938745061143,
      "loss": 0.7981,
      "step": 3297
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001839844027053813,
      "loss": 1.0585,
      "step": 3298
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018397492834690553,
      "loss": 0.968,
      "step": 3299
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018396545143097546,
      "loss": 1.062,
      "step": 3300
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018395597195787985,
      "loss": 1.0226,
      "step": 3301
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001839464899279073,
      "loss": 0.9793,
      "step": 3302
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001839370053413466,
      "loss": 1.0762,
      "step": 3303
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018392751819848658,
      "loss": 0.9709,
      "step": 3304
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018391802849961622,
      "loss": 0.983,
      "step": 3305
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018390853624502447,
      "loss": 0.9942,
      "step": 3306
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.00018389904143500049,
      "loss": 0.9867,
      "step": 3307
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001838895440698334,
      "loss": 1.0906,
      "step": 3308
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001838800441498124,
      "loss": 1.0805,
      "step": 3309
    },
    {
      "epoch": 0.73,
      "learning_rate": 0.0001838705416752269,
      "loss": 0.9748,
      "step": 3310
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018386103664636626,
      "loss": 1.0005,
      "step": 3311
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018385152906351992,
      "loss": 0.9412,
      "step": 3312
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018384201892697748,
      "loss": 0.9746,
      "step": 3313
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018383250623702857,
      "loss": 1.0051,
      "step": 3314
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018382299099396288,
      "loss": 0.9629,
      "step": 3315
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018381347319807017,
      "loss": 0.9609,
      "step": 3316
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018380395284964035,
      "loss": 0.984,
      "step": 3317
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018379442994896335,
      "loss": 0.9875,
      "step": 3318
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018378490449632917,
      "loss": 1.0113,
      "step": 3319
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018377537649202794,
      "loss": 1.1338,
      "step": 3320
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018376584593634982,
      "loss": 1.0425,
      "step": 3321
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018375631282958505,
      "loss": 1.0318,
      "step": 3322
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.000183746777172024,
      "loss": 1.0972,
      "step": 3323
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018373723896395697,
      "loss": 1.093,
      "step": 3324
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.0001837276982056746,
      "loss": 1.0247,
      "step": 3325
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018371815489746736,
      "loss": 0.8205,
      "step": 3326
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018370860903962593,
      "loss": 0.8085,
      "step": 3327
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018369906063244097,
      "loss": 0.9749,
      "step": 3328
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018368950967620332,
      "loss": 1.0765,
      "step": 3329
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.0001836799561712039,
      "loss": 1.0438,
      "step": 3330
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018367040011773352,
      "loss": 0.8861,
      "step": 3331
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.0001836608415160834,
      "loss": 1.09,
      "step": 3332
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.0001836512803665445,
      "loss": 1.0937,
      "step": 3333
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018364171666940805,
      "loss": 1.0251,
      "step": 3334
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.0001836321504249653,
      "loss": 0.9774,
      "step": 3335
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018362258163350762,
      "loss": 0.9331,
      "step": 3336
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.0001836130102953264,
      "loss": 1.0194,
      "step": 3337
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018360343641071316,
      "loss": 0.9297,
      "step": 3338
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018359385997995947,
      "loss": 0.834,
      "step": 3339
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018358428100335693,
      "loss": 0.9742,
      "step": 3340
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018357469948119734,
      "loss": 1.0019,
      "step": 3341
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018356511541377246,
      "loss": 0.924,
      "step": 3342
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018355552880137418,
      "loss": 1.03,
      "step": 3343
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018354593964429447,
      "loss": 1.0865,
      "step": 3344
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018353634794282536,
      "loss": 1.0527,
      "step": 3345
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018352675369725895,
      "loss": 1.0261,
      "step": 3346
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018351715690788747,
      "loss": 0.9537,
      "step": 3347
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018350755757500314,
      "loss": 0.9632,
      "step": 3348
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018349795569889838,
      "loss": 1.0271,
      "step": 3349
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018348835127986554,
      "loss": 1.0093,
      "step": 3350
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018347874431819716,
      "loss": 0.9981,
      "step": 3351
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018346913481418584,
      "loss": 0.9764,
      "step": 3352
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018345952276812417,
      "loss": 0.9488,
      "step": 3353
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018344990818030494,
      "loss": 0.9942,
      "step": 3354
    },
    {
      "epoch": 0.74,
      "learning_rate": 0.00018344029105102095,
      "loss": 1.0037,
      "step": 3355
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001834306713805651,
      "loss": 0.8987,
      "step": 3356
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001834210491692303,
      "loss": 1.0266,
      "step": 3357
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018341142441730964,
      "loss": 1.0351,
      "step": 3358
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018340179712509626,
      "loss": 1.0296,
      "step": 3359
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018339216729288334,
      "loss": 0.8576,
      "step": 3360
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018338253492096416,
      "loss": 0.9629,
      "step": 3361
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018337290000963207,
      "loss": 0.9055,
      "step": 3362
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018336326255918048,
      "loss": 0.8976,
      "step": 3363
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018335362256990292,
      "loss": 0.9898,
      "step": 3364
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018334398004209295,
      "loss": 0.9555,
      "step": 3365
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001833343349760443,
      "loss": 0.9187,
      "step": 3366
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018332468737205067,
      "loss": 1.0737,
      "step": 3367
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018331503723040583,
      "loss": 1.0777,
      "step": 3368
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018330538455140375,
      "loss": 0.9789,
      "step": 3369
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018329572933533834,
      "loss": 0.9163,
      "step": 3370
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001832860715825037,
      "loss": 0.9027,
      "step": 3371
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018327641129319396,
      "loss": 0.9101,
      "step": 3372
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018326674846770325,
      "loss": 1.1397,
      "step": 3373
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018325708310632592,
      "loss": 0.9931,
      "step": 3374
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001832474152093563,
      "loss": 0.8859,
      "step": 3375
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018323774477708887,
      "loss": 1.0686,
      "step": 3376
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018322807180981806,
      "loss": 0.9081,
      "step": 3377
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018321839630783854,
      "loss": 0.8918,
      "step": 3378
    },
    {
      "epoch": 0.75,
      "eval_loss": 0.6041999459266663,
      "eval_runtime": 322.3612,
      "eval_samples_per_second": 56.269,
      "eval_steps_per_second": 28.136,
      "step": 3378
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018320871827144495,
      "loss": 0.9068,
      "step": 3379
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.000183199037700932,
      "loss": 0.912,
      "step": 3380
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018318935459659457,
      "loss": 1.0322,
      "step": 3381
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018317966895872753,
      "loss": 1.0102,
      "step": 3382
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018316998078762585,
      "loss": 0.9198,
      "step": 3383
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018316029008358454,
      "loss": 0.9931,
      "step": 3384
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018315059684689881,
      "loss": 1.0367,
      "step": 3385
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018314090107786387,
      "loss": 0.8943,
      "step": 3386
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018313120277677492,
      "loss": 1.073,
      "step": 3387
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001831215019439274,
      "loss": 1.0005,
      "step": 3388
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018311179857961673,
      "loss": 0.9407,
      "step": 3389
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018310209268413837,
      "loss": 0.8238,
      "step": 3390
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.000183092384257788,
      "loss": 0.9657,
      "step": 3391
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018308267330086124,
      "loss": 1.064,
      "step": 3392
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018307295981365385,
      "loss": 0.8524,
      "step": 3393
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018306324379646163,
      "loss": 1.0694,
      "step": 3394
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001830535252495805,
      "loss": 0.9469,
      "step": 3395
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018304380417330645,
      "loss": 1.0101,
      "step": 3396
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018303408056793554,
      "loss": 0.8617,
      "step": 3397
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018302435443376386,
      "loss": 0.9432,
      "step": 3398
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.00018301462577108765,
      "loss": 0.9931,
      "step": 3399
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001830048945802032,
      "loss": 1.1204,
      "step": 3400
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018299516086140686,
      "loss": 0.9282,
      "step": 3401
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018298542461499509,
      "loss": 0.9589,
      "step": 3402
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018297568584126433,
      "loss": 0.9292,
      "step": 3403
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001829659445405113,
      "loss": 0.9519,
      "step": 3404
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018295620071303258,
      "loss": 0.9114,
      "step": 3405
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018294645435912497,
      "loss": 1.0064,
      "step": 3406
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018293670547908522,
      "loss": 0.9706,
      "step": 3407
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018292695407321033,
      "loss": 0.9635,
      "step": 3408
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018291720014179723,
      "loss": 1.0364,
      "step": 3409
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018290744368514294,
      "loss": 0.9166,
      "step": 3410
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018289768470354466,
      "loss": 1.0661,
      "step": 3411
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018288792319729954,
      "loss": 1.0569,
      "step": 3412
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001828781591667049,
      "loss": 0.9662,
      "step": 3413
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018286839261205814,
      "loss": 0.967,
      "step": 3414
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018285862353365658,
      "loss": 1.0278,
      "step": 3415
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001828488519317979,
      "loss": 1.1957,
      "step": 3416
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018283907780677956,
      "loss": 0.8776,
      "step": 3417
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001828293011588993,
      "loss": 1.0013,
      "step": 3418
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001828195219884548,
      "loss": 1.0163,
      "step": 3419
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.000182809740295744,
      "loss": 0.9119,
      "step": 3420
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001827999560810647,
      "loss": 0.9259,
      "step": 3421
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001827901693447149,
      "loss": 1.0132,
      "step": 3422
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018278038008699268,
      "loss": 1.0237,
      "step": 3423
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018277058830819614,
      "loss": 0.8932,
      "step": 3424
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018276079400862354,
      "loss": 0.9767,
      "step": 3425
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018275099718857309,
      "loss": 1.0698,
      "step": 3426
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018274119784834322,
      "loss": 0.9283,
      "step": 3427
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018273139598823233,
      "loss": 0.9128,
      "step": 3428
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018272159160853896,
      "loss": 0.9056,
      "step": 3429
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018271178470956169,
      "loss": 1.0638,
      "step": 3430
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018270197529159915,
      "loss": 0.9286,
      "step": 3431
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018269216335495015,
      "loss": 0.868,
      "step": 3432
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001826823488999135,
      "loss": 0.8834,
      "step": 3433
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018267253192678806,
      "loss": 0.9848,
      "step": 3434
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018266271243587285,
      "loss": 0.9403,
      "step": 3435
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018265289042746687,
      "loss": 0.9984,
      "step": 3436
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018264306590186932,
      "loss": 1.0413,
      "step": 3437
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018263323885937935,
      "loss": 1.0002,
      "step": 3438
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018262340930029627,
      "loss": 0.9511,
      "step": 3439
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.0001826135772249194,
      "loss": 0.8693,
      "step": 3440
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018260374263354826,
      "loss": 0.9748,
      "step": 3441
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018259390552648224,
      "loss": 0.9934,
      "step": 3442
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018258406590402102,
      "loss": 0.9239,
      "step": 3443
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018257422376646425,
      "loss": 0.962,
      "step": 3444
    },
    {
      "epoch": 0.76,
      "learning_rate": 0.00018256437911411165,
      "loss": 0.9402,
      "step": 3445
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018255453194726307,
      "loss": 1.0421,
      "step": 3446
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018254468226621838,
      "loss": 1.0537,
      "step": 3447
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018253483007127754,
      "loss": 0.9875,
      "step": 3448
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018252497536274062,
      "loss": 1.1031,
      "step": 3449
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018251511814090777,
      "loss": 1.009,
      "step": 3450
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018250525840607913,
      "loss": 0.9683,
      "step": 3451
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.000182495396158555,
      "loss": 1.1105,
      "step": 3452
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.0001824855313986358,
      "loss": 1.0652,
      "step": 3453
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018247566412662186,
      "loss": 1.0165,
      "step": 3454
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018246579434281376,
      "loss": 0.8782,
      "step": 3455
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018245592204751203,
      "loss": 1.0315,
      "step": 3456
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018244604724101737,
      "loss": 0.832,
      "step": 3457
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018243616992363052,
      "loss": 0.9764,
      "step": 3458
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018242629009565227,
      "loss": 0.9327,
      "step": 3459
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018241640775738352,
      "loss": 0.9203,
      "step": 3460
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.0001824065229091252,
      "loss": 0.9751,
      "step": 3461
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018239663555117842,
      "loss": 0.964,
      "step": 3462
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018238674568384427,
      "loss": 0.9605,
      "step": 3463
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018237685330742395,
      "loss": 1.1392,
      "step": 3464
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018236695842221873,
      "loss": 1.0049,
      "step": 3465
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018235706102852993,
      "loss": 1.0553,
      "step": 3466
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.000182347161126659,
      "loss": 0.996,
      "step": 3467
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018233725871690743,
      "loss": 1.0419,
      "step": 3468
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018232735379957683,
      "loss": 0.8903,
      "step": 3469
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018231744637496882,
      "loss": 1.0283,
      "step": 3470
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018230753644338514,
      "loss": 1.0249,
      "step": 3471
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.0001822976240051276,
      "loss": 0.8141,
      "step": 3472
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018228770906049809,
      "loss": 1.0569,
      "step": 3473
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018227779160979855,
      "loss": 0.8443,
      "step": 3474
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018226787165333104,
      "loss": 1.052,
      "step": 3475
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018225794919139761,
      "loss": 0.89,
      "step": 3476
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018224802422430055,
      "loss": 1.0733,
      "step": 3477
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018223809675234204,
      "loss": 0.9495,
      "step": 3478
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018222816677582445,
      "loss": 1.1676,
      "step": 3479
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018221823429505026,
      "loss": 0.991,
      "step": 3480
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018220829931032184,
      "loss": 0.9211,
      "step": 3481
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018219836182194183,
      "loss": 0.9358,
      "step": 3482
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018218842183021286,
      "loss": 0.9295,
      "step": 3483
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.0001821784793354377,
      "loss": 0.8412,
      "step": 3484
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.0001821685343379191,
      "loss": 0.9214,
      "step": 3485
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018215858683795993,
      "loss": 0.9055,
      "step": 3486
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018214863683586313,
      "loss": 1.0417,
      "step": 3487
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018213868433193176,
      "loss": 0.9754,
      "step": 3488
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018212872932646894,
      "loss": 0.9855,
      "step": 3489
    },
    {
      "epoch": 0.77,
      "learning_rate": 0.00018211877181977784,
      "loss": 0.907,
      "step": 3490
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018210881181216165,
      "loss": 0.8236,
      "step": 3491
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018209884930392377,
      "loss": 0.866,
      "step": 3492
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001820888842953676,
      "loss": 1.0306,
      "step": 3493
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018207891678679664,
      "loss": 1.0092,
      "step": 3494
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018206894677851436,
      "loss": 1.007,
      "step": 3495
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018205897427082447,
      "loss": 0.9447,
      "step": 3496
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001820489992640307,
      "loss": 0.973,
      "step": 3497
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018203902175843682,
      "loss": 0.9987,
      "step": 3498
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018202904175434665,
      "loss": 1.0319,
      "step": 3499
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001820190592520642,
      "loss": 0.8523,
      "step": 3500
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018200907425189344,
      "loss": 1.0844,
      "step": 3501
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018199908675413848,
      "loss": 0.9109,
      "step": 3502
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018198909675910346,
      "loss": 0.9259,
      "step": 3503
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018197910426709268,
      "loss": 1.0141,
      "step": 3504
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001819691092784104,
      "loss": 0.9525,
      "step": 3505
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001819591117933611,
      "loss": 0.9109,
      "step": 3506
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018194911181224917,
      "loss": 0.9446,
      "step": 3507
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018193910933537918,
      "loss": 0.8252,
      "step": 3508
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018192910436305577,
      "loss": 0.9583,
      "step": 3509
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018191909689558363,
      "loss": 0.9944,
      "step": 3510
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001819090869332676,
      "loss": 1.0338,
      "step": 3511
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001818990744764124,
      "loss": 0.9611,
      "step": 3512
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018188905952532309,
      "loss": 0.9712,
      "step": 3513
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018187904208030463,
      "loss": 0.9959,
      "step": 3514
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018186902214166204,
      "loss": 1.0547,
      "step": 3515
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018185899970970054,
      "loss": 0.9675,
      "step": 3516
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001818489747847254,
      "loss": 0.9208,
      "step": 3517
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018183894736704183,
      "loss": 0.9516,
      "step": 3518
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018182891745695528,
      "loss": 0.8643,
      "step": 3519
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001818188850547712,
      "loss": 0.9263,
      "step": 3520
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001818088501607951,
      "loss": 1.081,
      "step": 3521
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018179881277533268,
      "loss": 0.935,
      "step": 3522
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018178877289868952,
      "loss": 0.9374,
      "step": 3523
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018177873053117142,
      "loss": 0.9763,
      "step": 3524
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018176868567308424,
      "loss": 1.0686,
      "step": 3525
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018175863832473388,
      "loss": 0.872,
      "step": 3526
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018174858848642636,
      "loss": 0.9879,
      "step": 3527
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.0001817385361584677,
      "loss": 0.9455,
      "step": 3528
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018172848134116406,
      "loss": 0.9198,
      "step": 3529
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018171842403482167,
      "loss": 0.9712,
      "step": 3530
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018170836423974683,
      "loss": 1.0764,
      "step": 3531
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018169830195624592,
      "loss": 0.8457,
      "step": 3532
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018168823718462532,
      "loss": 0.9827,
      "step": 3533
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018167816992519162,
      "loss": 0.8398,
      "step": 3534
    },
    {
      "epoch": 0.78,
      "learning_rate": 0.00018166810017825142,
      "loss": 1.0648,
      "step": 3535
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018165802794411134,
      "loss": 0.9839,
      "step": 3536
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001816479532230782,
      "loss": 1.0256,
      "step": 3537
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018163787601545875,
      "loss": 1.0138,
      "step": 3538
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018162779632155998,
      "loss": 0.9665,
      "step": 3539
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018161771414168878,
      "loss": 0.9688,
      "step": 3540
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018160762947615222,
      "loss": 0.9693,
      "step": 3541
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018159754232525749,
      "loss": 0.8987,
      "step": 3542
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018158745268931172,
      "loss": 0.9845,
      "step": 3543
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018157736056862223,
      "loss": 0.9793,
      "step": 3544
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018156726596349634,
      "loss": 0.8193,
      "step": 3545
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018155716887424155,
      "loss": 1.077,
      "step": 3546
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018154706930116529,
      "loss": 1.1485,
      "step": 3547
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001815369672445752,
      "loss": 1.1227,
      "step": 3548
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018152686270477887,
      "loss": 0.8763,
      "step": 3549
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001815167556820841,
      "loss": 0.9977,
      "step": 3550
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018150664617679868,
      "loss": 0.947,
      "step": 3551
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001814965341892305,
      "loss": 0.9373,
      "step": 3552
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001814864197196875,
      "loss": 1.1264,
      "step": 3553
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001814763027684777,
      "loss": 0.9221,
      "step": 3554
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018146618333590928,
      "loss": 0.9984,
      "step": 3555
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018145606142229038,
      "loss": 0.8354,
      "step": 3556
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018144593702792926,
      "loss": 1.0977,
      "step": 3557
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018143581015313425,
      "loss": 0.9923,
      "step": 3558
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001814256807982138,
      "loss": 0.916,
      "step": 3559
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018141554896347636,
      "loss": 1.0893,
      "step": 3560
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018140541464923052,
      "loss": 1.0371,
      "step": 3561
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001813952778557849,
      "loss": 0.9493,
      "step": 3562
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018138513858344826,
      "loss": 1.0417,
      "step": 3563
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018137499683252935,
      "loss": 0.97,
      "step": 3564
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018136485260333702,
      "loss": 0.9163,
      "step": 3565
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018135470589618027,
      "loss": 0.9747,
      "step": 3566
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018134455671136806,
      "loss": 0.9508,
      "step": 3567
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018133440504920954,
      "loss": 0.9878,
      "step": 3568
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018132425091001384,
      "loss": 0.9817,
      "step": 3569
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018131409429409021,
      "loss": 0.9499,
      "step": 3570
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018130393520174797,
      "loss": 0.9748,
      "step": 3571
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018129377363329652,
      "loss": 0.9601,
      "step": 3572
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018128360958904533,
      "loss": 1.0032,
      "step": 3573
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018127344306930393,
      "loss": 1.0672,
      "step": 3574
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018126327407438198,
      "loss": 0.883,
      "step": 3575
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001812531026045891,
      "loss": 0.9691,
      "step": 3576
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.0001812429286602352,
      "loss": 0.8727,
      "step": 3577
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018123275224163,
      "loss": 1.0601,
      "step": 3578
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018122257334908341,
      "loss": 0.9926,
      "step": 3579
    },
    {
      "epoch": 0.79,
      "learning_rate": 0.00018121239198290554,
      "loss": 1.0321,
      "step": 3580
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001812022081434064,
      "loss": 0.8955,
      "step": 3581
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001811920218308961,
      "loss": 0.9989,
      "step": 3582
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018118183304568494,
      "loss": 0.9299,
      "step": 3583
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001811716417880832,
      "loss": 0.9004,
      "step": 3584
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001811614480584012,
      "loss": 1.0376,
      "step": 3585
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018115125185694947,
      "loss": 1.062,
      "step": 3586
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018114105318403848,
      "loss": 0.9698,
      "step": 3587
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018113085203997882,
      "loss": 0.9465,
      "step": 3588
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001811206484250812,
      "loss": 0.9555,
      "step": 3589
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001811104423396564,
      "loss": 0.9527,
      "step": 3590
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018110023378401516,
      "loss": 1.1098,
      "step": 3591
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018109002275846844,
      "loss": 0.9095,
      "step": 3592
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018107980926332723,
      "loss": 1.123,
      "step": 3593
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018106959329890253,
      "loss": 0.9078,
      "step": 3594
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018105937486550551,
      "loss": 1.0554,
      "step": 3595
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018104915396344735,
      "loss": 0.9053,
      "step": 3596
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018103893059303932,
      "loss": 1.0208,
      "step": 3597
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018102870475459278,
      "loss": 1.1568,
      "step": 3598
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001810184764484192,
      "loss": 0.9423,
      "step": 3599
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018100824567483,
      "loss": 0.9478,
      "step": 3600
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018099801243413687,
      "loss": 1.0352,
      "step": 3601
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018098777672665136,
      "loss": 0.9727,
      "step": 3602
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018097753855268522,
      "loss": 1.0355,
      "step": 3603
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001809672979125503,
      "loss": 0.9563,
      "step": 3604
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018095705480655842,
      "loss": 0.9206,
      "step": 3605
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018094680923502157,
      "loss": 1.0199,
      "step": 3606
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018093656119825177,
      "loss": 0.9696,
      "step": 3607
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018092631069656113,
      "loss": 0.8419,
      "step": 3608
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001809160577302618,
      "loss": 0.922,
      "step": 3609
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001809058022996661,
      "loss": 0.8865,
      "step": 3610
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018089554440508626,
      "loss": 0.9845,
      "step": 3611
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001808852840468348,
      "loss": 0.9169,
      "step": 3612
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018087502122522407,
      "loss": 1.1185,
      "step": 3613
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018086475594056674,
      "loss": 1.112,
      "step": 3614
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018085448819317535,
      "loss": 0.911,
      "step": 3615
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018084421798336266,
      "loss": 1.0229,
      "step": 3616
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018083394531144146,
      "loss": 0.9511,
      "step": 3617
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018082367017772458,
      "loss": 0.9441,
      "step": 3618
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001808133925825249,
      "loss": 0.9246,
      "step": 3619
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018080311252615546,
      "loss": 1.0581,
      "step": 3620
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.0001807928300089294,
      "loss": 0.915,
      "step": 3621
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018078254503115982,
      "loss": 1.0232,
      "step": 3622
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018077225759315993,
      "loss": 0.9033,
      "step": 3623
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018076196769524304,
      "loss": 0.8919,
      "step": 3624
    },
    {
      "epoch": 0.8,
      "learning_rate": 0.00018075167533772256,
      "loss": 0.8696,
      "step": 3625
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018074138052091195,
      "loss": 0.9939,
      "step": 3626
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018073108324512472,
      "loss": 1.1388,
      "step": 3627
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018072078351067444,
      "loss": 0.9846,
      "step": 3628
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018071048131787482,
      "loss": 1.0443,
      "step": 3629
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018070017666703961,
      "loss": 0.9431,
      "step": 3630
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018068986955848264,
      "loss": 0.9016,
      "step": 3631
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018067955999251782,
      "loss": 0.8772,
      "step": 3632
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001806692479694591,
      "loss": 0.9322,
      "step": 3633
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018065893348962055,
      "loss": 0.9338,
      "step": 3634
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018064861655331632,
      "loss": 0.9885,
      "step": 3635
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001806382971608606,
      "loss": 0.9347,
      "step": 3636
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018062797531256762,
      "loss": 1.0665,
      "step": 3637
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018061765100875176,
      "loss": 0.8618,
      "step": 3638
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001806073242497275,
      "loss": 1.0358,
      "step": 3639
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018059699503580924,
      "loss": 0.9058,
      "step": 3640
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018058666336731165,
      "loss": 0.9686,
      "step": 3641
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018057632924454935,
      "loss": 0.9673,
      "step": 3642
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018056599266783703,
      "loss": 0.9373,
      "step": 3643
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018055565363748953,
      "loss": 0.8195,
      "step": 3644
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001805453121538217,
      "loss": 0.9897,
      "step": 3645
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018053496821714854,
      "loss": 0.9544,
      "step": 3646
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.000180524621827785,
      "loss": 0.9951,
      "step": 3647
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018051427298604623,
      "loss": 0.8935,
      "step": 3648
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018050392169224736,
      "loss": 0.9332,
      "step": 3649
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018049356794670374,
      "loss": 0.8887,
      "step": 3650
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018048321174973054,
      "loss": 1.1156,
      "step": 3651
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018047285310164327,
      "loss": 0.9634,
      "step": 3652
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001804624920027574,
      "loss": 0.9403,
      "step": 3653
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018045212845338844,
      "loss": 1.0341,
      "step": 3654
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018044176245385197,
      "loss": 1.09,
      "step": 3655
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001804313940044638,
      "loss": 0.9615,
      "step": 3656
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001804210231055396,
      "loss": 1.0561,
      "step": 3657
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018041064975739523,
      "loss": 0.9713,
      "step": 3658
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018040027396034667,
      "loss": 0.8541,
      "step": 3659
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018038989571470988,
      "loss": 1.0265,
      "step": 3660
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001803795150208009,
      "loss": 0.9412,
      "step": 3661
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001803691318789359,
      "loss": 1.0001,
      "step": 3662
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018035874628943111,
      "loss": 1.0619,
      "step": 3663
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018034835825260284,
      "loss": 1.0296,
      "step": 3664
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.0001803379677687674,
      "loss": 0.9775,
      "step": 3665
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018032757483824123,
      "loss": 1.0712,
      "step": 3666
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018031717946134093,
      "loss": 0.9167,
      "step": 3667
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018030678163838298,
      "loss": 0.901,
      "step": 3668
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018029638136968416,
      "loss": 0.9014,
      "step": 3669
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00018028597865556113,
      "loss": 1.0816,
      "step": 3670
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018027557349633072,
      "loss": 0.9834,
      "step": 3671
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018026516589230983,
      "loss": 1.0476,
      "step": 3672
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018025475584381543,
      "loss": 0.9895,
      "step": 3673
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018024434335116456,
      "loss": 1.0127,
      "step": 3674
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001802339284146743,
      "loss": 0.8752,
      "step": 3675
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018022351103466185,
      "loss": 1.0525,
      "step": 3676
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018021309121144446,
      "loss": 1.0404,
      "step": 3677
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001802026689453395,
      "loss": 0.9187,
      "step": 3678
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018019224423666437,
      "loss": 0.9486,
      "step": 3679
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018018181708573657,
      "loss": 0.9664,
      "step": 3680
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001801713874928736,
      "loss": 0.9814,
      "step": 3681
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018016095545839313,
      "loss": 0.9798,
      "step": 3682
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018015052098261286,
      "loss": 1.1809,
      "step": 3683
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001801400840658506,
      "loss": 1.0592,
      "step": 3684
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018012964470842416,
      "loss": 1.063,
      "step": 3685
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001801192029106515,
      "loss": 0.9198,
      "step": 3686
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018010875867285065,
      "loss": 0.93,
      "step": 3687
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018009831199533962,
      "loss": 0.9862,
      "step": 3688
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018008786287843662,
      "loss": 1.1241,
      "step": 3689
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018007741132245982,
      "loss": 1.0411,
      "step": 3690
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001800669573277276,
      "loss": 1.0503,
      "step": 3691
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001800565008945583,
      "loss": 0.9602,
      "step": 3692
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018004604202327037,
      "loss": 0.8753,
      "step": 3693
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001800355807141823,
      "loss": 1.054,
      "step": 3694
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018002511696761273,
      "loss": 0.9768,
      "step": 3695
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018001465078388033,
      "loss": 0.8944,
      "step": 3696
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00018000418216330383,
      "loss": 0.9442,
      "step": 3697
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017999371110620206,
      "loss": 1.0152,
      "step": 3698
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017998323761289395,
      "loss": 0.872,
      "step": 3699
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001799727616836984,
      "loss": 1.004,
      "step": 3700
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001799622833189345,
      "loss": 1.0524,
      "step": 3701
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017995180251892138,
      "loss": 1.0933,
      "step": 3702
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001799413192839782,
      "loss": 1.0284,
      "step": 3703
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017993083361442425,
      "loss": 0.8963,
      "step": 3704
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017992034551057883,
      "loss": 0.9361,
      "step": 3705
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001799098549727614,
      "loss": 0.947,
      "step": 3706
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017989936200129146,
      "loss": 1.0471,
      "step": 3707
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017988886659648853,
      "loss": 1.003,
      "step": 3708
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017987836875867227,
      "loss": 1.0316,
      "step": 3709
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017986786848816236,
      "loss": 0.9394,
      "step": 3710
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017985736578527862,
      "loss": 0.8616,
      "step": 3711
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.0001798468606503409,
      "loss": 0.9866,
      "step": 3712
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017983635308366916,
      "loss": 0.9935,
      "step": 3713
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017982584308558335,
      "loss": 0.9583,
      "step": 3714
    },
    {
      "epoch": 0.82,
      "learning_rate": 0.00017981533065640362,
      "loss": 0.8774,
      "step": 3715
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017980481579645005,
      "loss": 0.9005,
      "step": 3716
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017979429850604293,
      "loss": 0.9851,
      "step": 3717
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017978377878550254,
      "loss": 0.9196,
      "step": 3718
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.0001797732566351493,
      "loss": 1.0356,
      "step": 3719
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017976273205530356,
      "loss": 0.988,
      "step": 3720
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017975220504628595,
      "loss": 1.0433,
      "step": 3721
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.000179741675608417,
      "loss": 1.032,
      "step": 3722
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017973114374201743,
      "loss": 0.9239,
      "step": 3723
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017972060944740795,
      "loss": 0.8542,
      "step": 3724
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017971007272490943,
      "loss": 0.9528,
      "step": 3725
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017969953357484272,
      "loss": 1.0172,
      "step": 3726
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017968899199752883,
      "loss": 1.0021,
      "step": 3727
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017967844799328874,
      "loss": 1.0239,
      "step": 3728
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017966790156244365,
      "loss": 1.0437,
      "step": 3729
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.0001796573527053147,
      "loss": 0.9666,
      "step": 3730
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017964680142222315,
      "loss": 1.0281,
      "step": 3731
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017963624771349034,
      "loss": 1.0121,
      "step": 3732
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017962569157943772,
      "loss": 0.9449,
      "step": 3733
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017961513302038675,
      "loss": 0.8758,
      "step": 3734
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017960457203665896,
      "loss": 0.9431,
      "step": 3735
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017959400862857606,
      "loss": 0.9819,
      "step": 3736
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.0001795834427964597,
      "loss": 0.8586,
      "step": 3737
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017957287454063167,
      "loss": 1.0063,
      "step": 3738
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017956230386141387,
      "loss": 1.001,
      "step": 3739
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017955173075912817,
      "loss": 0.9154,
      "step": 3740
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017954115523409657,
      "loss": 0.8675,
      "step": 3741
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017953057728664122,
      "loss": 1.0721,
      "step": 3742
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.0001795199969170842,
      "loss": 1.0271,
      "step": 3743
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017950941412574775,
      "loss": 0.7502,
      "step": 3744
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017949882891295422,
      "loss": 0.9442,
      "step": 3745
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017948824127902592,
      "loss": 0.8288,
      "step": 3746
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017947765122428532,
      "loss": 0.8865,
      "step": 3747
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017946705874905493,
      "loss": 0.9369,
      "step": 3748
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017945646385365737,
      "loss": 1.0022,
      "step": 3749
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.0001794458665384153,
      "loss": 0.9491,
      "step": 3750
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017943526680365142,
      "loss": 0.8115,
      "step": 3751
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017942466464968858,
      "loss": 0.9015,
      "step": 3752
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017941406007684964,
      "loss": 0.9301,
      "step": 3753
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017940345308545762,
      "loss": 1.1204,
      "step": 3754
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.0001793928436758355,
      "loss": 0.9384,
      "step": 3755
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017938223184830643,
      "loss": 0.9337,
      "step": 3756
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017937161760319358,
      "loss": 0.9621,
      "step": 3757
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017936100094082015,
      "loss": 1.0032,
      "step": 3758
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017935038186150956,
      "loss": 0.9007,
      "step": 3759
    },
    {
      "epoch": 0.83,
      "learning_rate": 0.00017933976036558518,
      "loss": 1.0344,
      "step": 3760
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017932913645337046,
      "loss": 0.9468,
      "step": 3761
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017931851012518898,
      "loss": 1.0411,
      "step": 3762
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017930788138136432,
      "loss": 0.9639,
      "step": 3763
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017929725022222025,
      "loss": 0.8659,
      "step": 3764
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017928661664808052,
      "loss": 0.913,
      "step": 3765
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017927598065926894,
      "loss": 0.8508,
      "step": 3766
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017926534225610943,
      "loss": 0.8101,
      "step": 3767
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017925470143892604,
      "loss": 1.0102,
      "step": 3768
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.0001792440582080428,
      "loss": 1.0804,
      "step": 3769
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.0001792334125637838,
      "loss": 0.9579,
      "step": 3770
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017922276450647333,
      "loss": 0.9351,
      "step": 3771
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017921211403643564,
      "loss": 0.8716,
      "step": 3772
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017920146115399513,
      "loss": 0.8891,
      "step": 3773
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017919080585947615,
      "loss": 0.8904,
      "step": 3774
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017918014815320328,
      "loss": 0.9294,
      "step": 3775
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017916948803550108,
      "loss": 0.9604,
      "step": 3776
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017915882550669418,
      "loss": 0.9218,
      "step": 3777
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017914816056710734,
      "loss": 0.9362,
      "step": 3778
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017913749321706534,
      "loss": 0.8767,
      "step": 3779
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017912682345689308,
      "loss": 1.0258,
      "step": 3780
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017911615128691547,
      "loss": 0.9886,
      "step": 3781
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017910547670745757,
      "loss": 1.0153,
      "step": 3782
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017909479971884445,
      "loss": 0.9233,
      "step": 3783
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017908412032140126,
      "loss": 1.0104,
      "step": 3784
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017907343851545325,
      "loss": 1.0077,
      "step": 3785
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.0001790627543013258,
      "loss": 0.8929,
      "step": 3786
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017905206767934416,
      "loss": 0.8973,
      "step": 3787
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017904137864983394,
      "loss": 0.9054,
      "step": 3788
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017903068721312058,
      "loss": 0.9656,
      "step": 3789
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017901999336952974,
      "loss": 0.9592,
      "step": 3790
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017900929711938708,
      "loss": 0.9028,
      "step": 3791
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.0001789985984630183,
      "loss": 1.0485,
      "step": 3792
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017898789740074933,
      "loss": 0.8474,
      "step": 3793
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.000178977193932906,
      "loss": 0.9613,
      "step": 3794
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.0001789664880598143,
      "loss": 0.9342,
      "step": 3795
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017895577978180026,
      "loss": 0.9543,
      "step": 3796
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017894506909919,
      "loss": 0.9154,
      "step": 3797
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017893435601230978,
      "loss": 1.0614,
      "step": 3798
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017892364052148583,
      "loss": 0.9096,
      "step": 3799
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017891292262704446,
      "loss": 0.8733,
      "step": 3800
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.0001789022023293121,
      "loss": 0.9392,
      "step": 3801
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017889147962861523,
      "loss": 0.858,
      "step": 3802
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.00017888075452528044,
      "loss": 0.9226,
      "step": 3803
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.0001788700270196343,
      "loss": 0.9629,
      "step": 3804
    },
    {
      "epoch": 0.84,
      "learning_rate": 0.0001788592971120036,
      "loss": 1.0822,
      "step": 3805
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017884856480271507,
      "loss": 1.0201,
      "step": 3806
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017883783009209556,
      "loss": 0.9937,
      "step": 3807
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.000178827092980472,
      "loss": 1.0254,
      "step": 3808
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017881635346817142,
      "loss": 0.9419,
      "step": 3809
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017880561155552083,
      "loss": 0.9318,
      "step": 3810
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001787948672428474,
      "loss": 0.9963,
      "step": 3811
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017878412053047837,
      "loss": 0.9254,
      "step": 3812
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017877337141874105,
      "loss": 1.0121,
      "step": 3813
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017876261990796272,
      "loss": 1.0132,
      "step": 3814
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001787518659984709,
      "loss": 0.9132,
      "step": 3815
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017874110969059306,
      "loss": 1.0523,
      "step": 3816
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017873035098465678,
      "loss": 0.9072,
      "step": 3817
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017871958988098974,
      "loss": 0.7759,
      "step": 3818
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017870882637991965,
      "loss": 1.1936,
      "step": 3819
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017869806048177432,
      "loss": 0.8644,
      "step": 3820
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017868729218688162,
      "loss": 0.8999,
      "step": 3821
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017867652149556953,
      "loss": 1.0791,
      "step": 3822
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.000178665748408166,
      "loss": 0.9442,
      "step": 3823
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001786549729249992,
      "loss": 0.8944,
      "step": 3824
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017864419504639724,
      "loss": 0.9895,
      "step": 3825
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001786334147726884,
      "loss": 0.9801,
      "step": 3826
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017862263210420096,
      "loss": 0.9249,
      "step": 3827
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017861184704126334,
      "loss": 0.9954,
      "step": 3828
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.000178601059584204,
      "loss": 0.9708,
      "step": 3829
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017859026973335141,
      "loss": 0.8449,
      "step": 3830
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017857947748903423,
      "loss": 1.0638,
      "step": 3831
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017856868285158112,
      "loss": 0.9721,
      "step": 3832
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017855788582132087,
      "loss": 0.8243,
      "step": 3833
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017854708639858225,
      "loss": 0.9005,
      "step": 3834
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017853628458369415,
      "loss": 0.831,
      "step": 3835
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017852548037698563,
      "loss": 0.9801,
      "step": 3836
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001785146737787856,
      "loss": 0.9795,
      "step": 3837
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017850386478942328,
      "loss": 1.0158,
      "step": 3838
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017849305340922778,
      "loss": 1.0465,
      "step": 3839
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017848223963852844,
      "loss": 1.0437,
      "step": 3840
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017847142347765453,
      "loss": 1.0147,
      "step": 3841
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017846060492693547,
      "loss": 0.9854,
      "step": 3842
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017844978398670077,
      "loss": 0.8482,
      "step": 3843
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017843896065727994,
      "loss": 0.9864,
      "step": 3844
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017842813493900263,
      "loss": 0.9137,
      "step": 3845
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001784173068321985,
      "loss": 0.9554,
      "step": 3846
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001784064763371974,
      "loss": 0.8646,
      "step": 3847
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001783956434543291,
      "loss": 0.9281,
      "step": 3848
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.00017838480818392353,
      "loss": 1.0063,
      "step": 3849
    },
    {
      "epoch": 0.85,
      "learning_rate": 0.0001783739705263107,
      "loss": 1.0198,
      "step": 3850
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001783631304818206,
      "loss": 1.0194,
      "step": 3851
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017835228805078348,
      "loss": 0.8931,
      "step": 3852
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017834144323352946,
      "loss": 0.9791,
      "step": 3853
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017833059603038884,
      "loss": 0.947,
      "step": 3854
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017831974644169198,
      "loss": 0.9093,
      "step": 3855
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001783088944677693,
      "loss": 0.8984,
      "step": 3856
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001782980401089513,
      "loss": 0.9343,
      "step": 3857
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001782871833655685,
      "loss": 1.0041,
      "step": 3858
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017827632423795164,
      "loss": 0.9826,
      "step": 3859
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017826546272643135,
      "loss": 0.946,
      "step": 3860
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017825459883133847,
      "loss": 0.8757,
      "step": 3861
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017824373255300382,
      "loss": 0.9332,
      "step": 3862
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017823286389175835,
      "loss": 0.9121,
      "step": 3863
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017822199284793307,
      "loss": 0.9927,
      "step": 3864
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017821111942185904,
      "loss": 0.845,
      "step": 3865
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017820024361386744,
      "loss": 0.9588,
      "step": 3866
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017818936542428944,
      "loss": 0.8574,
      "step": 3867
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001781784848534564,
      "loss": 0.8919,
      "step": 3868
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017816760190169964,
      "loss": 1.0092,
      "step": 3869
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001781567165693506,
      "loss": 1.0174,
      "step": 3870
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017814582885674086,
      "loss": 0.9973,
      "step": 3871
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001781349387642019,
      "loss": 0.9125,
      "step": 3872
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017812404629206547,
      "loss": 1.0339,
      "step": 3873
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017811315144066324,
      "loss": 0.9715,
      "step": 3874
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017810225421032702,
      "loss": 1.1383,
      "step": 3875
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001780913546013887,
      "loss": 0.957,
      "step": 3876
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017808045261418024,
      "loss": 0.8561,
      "step": 3877
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017806954824903365,
      "loss": 1.01,
      "step": 3878
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017805864150628102,
      "loss": 1.0431,
      "step": 3879
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001780477323862545,
      "loss": 0.9252,
      "step": 3880
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017803682088928633,
      "loss": 0.9988,
      "step": 3881
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017802590701570885,
      "loss": 0.9212,
      "step": 3882
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017801499076585442,
      "loss": 1.1108,
      "step": 3883
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017800407214005548,
      "loss": 1.0681,
      "step": 3884
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017799315113864456,
      "loss": 0.8719,
      "step": 3885
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017798222776195427,
      "loss": 0.9814,
      "step": 3886
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001779713020103173,
      "loss": 0.8766,
      "step": 3887
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017796037388406638,
      "loss": 0.867,
      "step": 3888
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001779494433835343,
      "loss": 0.793,
      "step": 3889
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.000177938510509054,
      "loss": 1.0618,
      "step": 3890
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017792757526095837,
      "loss": 0.9119,
      "step": 3891
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017791663763958048,
      "loss": 0.8895,
      "step": 3892
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017790569764525345,
      "loss": 0.9502,
      "step": 3893
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.00017789475527831044,
      "loss": 0.9699,
      "step": 3894
    },
    {
      "epoch": 0.86,
      "learning_rate": 0.0001778838105390847,
      "loss": 1.0607,
      "step": 3895
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017787286342790955,
      "loss": 1.0614,
      "step": 3896
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001778619139451184,
      "loss": 1.0082,
      "step": 3897
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001778509620910447,
      "loss": 0.9608,
      "step": 3898
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.000177840007866022,
      "loss": 0.9294,
      "step": 3899
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001778290512703839,
      "loss": 0.996,
      "step": 3900
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017781809230446406,
      "loss": 1.0582,
      "step": 3901
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017780713096859628,
      "loss": 0.9456,
      "step": 3902
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017779616726311441,
      "loss": 0.9673,
      "step": 3903
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017778520118835224,
      "loss": 0.9172,
      "step": 3904
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017777423274464385,
      "loss": 0.9072,
      "step": 3905
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017776326193232324,
      "loss": 1.0204,
      "step": 3906
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001777522887517245,
      "loss": 0.9981,
      "step": 3907
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017774131320318187,
      "loss": 0.9276,
      "step": 3908
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001777303352870296,
      "loss": 0.8912,
      "step": 3909
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.000177719355003602,
      "loss": 0.9682,
      "step": 3910
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017770837235323348,
      "loss": 1.0863,
      "step": 3911
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017769738733625852,
      "loss": 0.9151,
      "step": 3912
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017768639995301166,
      "loss": 1.0366,
      "step": 3913
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017767541020382755,
      "loss": 0.9137,
      "step": 3914
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017766441808904083,
      "loss": 0.8975,
      "step": 3915
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017765342360898632,
      "loss": 0.9011,
      "step": 3916
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001776424267639988,
      "loss": 1.0071,
      "step": 3917
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017763142755441324,
      "loss": 0.8934,
      "step": 3918
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001776204259805646,
      "loss": 1.1554,
      "step": 3919
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001776094220427879,
      "loss": 0.864,
      "step": 3920
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001775984157414183,
      "loss": 1.038,
      "step": 3921
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017758740707679097,
      "loss": 0.8711,
      "step": 3922
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001775763960492412,
      "loss": 0.9909,
      "step": 3923
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017756538265910435,
      "loss": 0.9643,
      "step": 3924
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017755436690671577,
      "loss": 1.0109,
      "step": 3925
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.000177543348792411,
      "loss": 1.0296,
      "step": 3926
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017753232831652557,
      "loss": 0.8411,
      "step": 3927
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017752130547939513,
      "loss": 1.027,
      "step": 3928
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017751028028135536,
      "loss": 0.9419,
      "step": 3929
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017749925272274206,
      "loss": 0.9264,
      "step": 3930
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017748822280389098,
      "loss": 0.9486,
      "step": 3931
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017747719052513817,
      "loss": 0.8744,
      "step": 3932
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017746615588681955,
      "loss": 0.9452,
      "step": 3933
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001774551188892712,
      "loss": 0.9082,
      "step": 3934
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001774440795328292,
      "loss": 1.038,
      "step": 3935
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001774330378178298,
      "loss": 0.9712,
      "step": 3936
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001774219937446093,
      "loss": 0.9345,
      "step": 3937
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017741094731350398,
      "loss": 1.0057,
      "step": 3938
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.0001773998985248503,
      "loss": 1.0346,
      "step": 3939
    },
    {
      "epoch": 0.87,
      "learning_rate": 0.00017738884737898475,
      "loss": 0.8498,
      "step": 3940
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017737779387624384,
      "loss": 1.1082,
      "step": 3941
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001773667380169643,
      "loss": 1.0784,
      "step": 3942
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017735567980148276,
      "loss": 1.0556,
      "step": 3943
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017734461923013604,
      "loss": 0.9296,
      "step": 3944
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017733355630326095,
      "loss": 0.8886,
      "step": 3945
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017732249102119446,
      "loss": 0.9366,
      "step": 3946
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001773114233842735,
      "loss": 0.9748,
      "step": 3947
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001773003533928352,
      "loss": 0.9884,
      "step": 3948
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017728928104721666,
      "loss": 1.0351,
      "step": 3949
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017727820634775508,
      "loss": 0.7973,
      "step": 3950
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017726712929478774,
      "loss": 0.9887,
      "step": 3951
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017725604988865206,
      "loss": 0.939,
      "step": 3952
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017724496812968537,
      "loss": 1.0253,
      "step": 3953
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001772338840182252,
      "loss": 0.9347,
      "step": 3954
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001772227975546091,
      "loss": 0.8774,
      "step": 3955
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017721170873917478,
      "loss": 0.9289,
      "step": 3956
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017720061757225985,
      "loss": 1.152,
      "step": 3957
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017718952405420217,
      "loss": 1.001,
      "step": 3958
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017717842818533956,
      "loss": 1.0007,
      "step": 3959
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017716732996600994,
      "loss": 0.9844,
      "step": 3960
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001771562293965513,
      "loss": 1.0136,
      "step": 3961
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017714512647730172,
      "loss": 0.9481,
      "step": 3962
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017713402120859937,
      "loss": 0.9352,
      "step": 3963
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001771229135907824,
      "loss": 1.0407,
      "step": 3964
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017711180362418912,
      "loss": 1.0053,
      "step": 3965
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017710069130915786,
      "loss": 0.9823,
      "step": 3966
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001770895766460271,
      "loss": 0.9703,
      "step": 3967
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017707845963513532,
      "loss": 0.9027,
      "step": 3968
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017706734027682106,
      "loss": 0.908,
      "step": 3969
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017705621857142298,
      "loss": 1.0586,
      "step": 3970
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017704509451927977,
      "loss": 1.0102,
      "step": 3971
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017703396812073025,
      "loss": 1.0377,
      "step": 3972
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017702283937611323,
      "loss": 0.9851,
      "step": 3973
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017701170828576769,
      "loss": 0.9909,
      "step": 3974
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017700057485003256,
      "loss": 0.9981,
      "step": 3975
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017698943906924695,
      "loss": 0.9784,
      "step": 3976
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017697830094375,
      "loss": 0.9241,
      "step": 3977
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017696716047388094,
      "loss": 1.0256,
      "step": 3978
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.000176956017659979,
      "loss": 0.9924,
      "step": 3979
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017694487250238355,
      "loss": 0.9396,
      "step": 3980
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017693372500143405,
      "loss": 0.9746,
      "step": 3981
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017692257515747,
      "loss": 0.8875,
      "step": 3982
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.0001769114229708309,
      "loss": 0.8912,
      "step": 3983
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017690026844185643,
      "loss": 0.901,
      "step": 3984
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00017688911157088633,
      "loss": 1.0095,
      "step": 3985
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017687795235826035,
      "loss": 1.0739,
      "step": 3986
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017686679080431832,
      "loss": 0.9814,
      "step": 3987
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017685562690940022,
      "loss": 1.0664,
      "step": 3988
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017684446067384602,
      "loss": 1.0606,
      "step": 3989
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017683329209799577,
      "loss": 0.958,
      "step": 3990
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017682212118218967,
      "loss": 0.9883,
      "step": 3991
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017681094792676785,
      "loss": 0.8766,
      "step": 3992
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.0001767997723320706,
      "loss": 0.9555,
      "step": 3993
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017678859439843834,
      "loss": 1.026,
      "step": 3994
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017677741412621144,
      "loss": 0.9784,
      "step": 3995
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.0001767662315157304,
      "loss": 0.9896,
      "step": 3996
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.0001767550465673358,
      "loss": 0.9588,
      "step": 3997
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.0001767438592813683,
      "loss": 0.7832,
      "step": 3998
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017673266965816855,
      "loss": 0.9414,
      "step": 3999
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017672147769807737,
      "loss": 0.9895,
      "step": 4000
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017671028340143557,
      "loss": 0.9295,
      "step": 4001
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017669908676858412,
      "loss": 0.9958,
      "step": 4002
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017668788779986403,
      "loss": 0.8445,
      "step": 4003
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.0001766766864956163,
      "loss": 1.0238,
      "step": 4004
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.0001766654828561821,
      "loss": 0.8982,
      "step": 4005
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017665427688190263,
      "loss": 0.9623,
      "step": 4006
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017664306857311917,
      "loss": 1.1182,
      "step": 4007
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017663185793017307,
      "loss": 1.0286,
      "step": 4008
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017662064495340576,
      "loss": 0.9265,
      "step": 4009
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017660942964315869,
      "loss": 0.9916,
      "step": 4010
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017659821199977345,
      "loss": 1.0274,
      "step": 4011
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017658699202359172,
      "loss": 0.9152,
      "step": 4012
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017657576971495513,
      "loss": 0.8001,
      "step": 4013
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017656454507420546,
      "loss": 1.0342,
      "step": 4014
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017655331810168462,
      "loss": 0.9589,
      "step": 4015
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017654208879773443,
      "loss": 1.1064,
      "step": 4016
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.000176530857162697,
      "loss": 0.856,
      "step": 4017
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.0001765196231969143,
      "loss": 0.8979,
      "step": 4018
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017650838690072847,
      "loss": 0.9084,
      "step": 4019
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017649714827448174,
      "loss": 1.0358,
      "step": 4020
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017648590731851637,
      "loss": 0.9725,
      "step": 4021
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017647466403317467,
      "loss": 0.9389,
      "step": 4022
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017646341841879911,
      "loss": 0.8947,
      "step": 4023
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017645217047573215,
      "loss": 0.8862,
      "step": 4024
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017644092020431632,
      "loss": 0.872,
      "step": 4025
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.0001764296676048943,
      "loss": 0.9134,
      "step": 4026
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017641841267780877,
      "loss": 0.9934,
      "step": 4027
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017640715542340245,
      "loss": 0.9919,
      "step": 4028
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017639589584201825,
      "loss": 1.0758,
      "step": 4029
    },
    {
      "epoch": 0.89,
      "learning_rate": 0.00017638463393399901,
      "loss": 0.9655,
      "step": 4030
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001763733696996878,
      "loss": 0.9916,
      "step": 4031
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017636210313942758,
      "loss": 1.1009,
      "step": 4032
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017635083425356153,
      "loss": 0.8042,
      "step": 4033
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001763395630424328,
      "loss": 0.9405,
      "step": 4034
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017632828950638472,
      "loss": 0.9717,
      "step": 4035
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017631701364576057,
      "loss": 1.0353,
      "step": 4036
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017630573546090377,
      "loss": 0.8882,
      "step": 4037
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001762944549521578,
      "loss": 0.9442,
      "step": 4038
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001762831721198662,
      "loss": 0.9466,
      "step": 4039
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001762718869643726,
      "loss": 0.9091,
      "step": 4040
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001762605994860207,
      "loss": 0.982,
      "step": 4041
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017624930968515422,
      "loss": 0.8357,
      "step": 4042
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017623801756211702,
      "loss": 0.9872,
      "step": 4043
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.000176226723117253,
      "loss": 0.9427,
      "step": 4044
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017621542635090612,
      "loss": 1.0244,
      "step": 4045
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017620412726342046,
      "loss": 0.8943,
      "step": 4046
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001761928258551401,
      "loss": 0.913,
      "step": 4047
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001761815221264092,
      "loss": 0.9524,
      "step": 4048
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017617021607757206,
      "loss": 0.9263,
      "step": 4049
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017615890770897297,
      "loss": 0.9915,
      "step": 4050
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001761475970209564,
      "loss": 0.9603,
      "step": 4051
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017613628401386667,
      "loss": 0.963,
      "step": 4052
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001761249686880485,
      "loss": 0.9618,
      "step": 4053
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017611365104384634,
      "loss": 1.0047,
      "step": 4054
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017610233108160498,
      "loss": 1.0316,
      "step": 4055
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017609100880166907,
      "loss": 0.8897,
      "step": 4056
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017607968420438352,
      "loss": 0.9183,
      "step": 4057
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017606835729009322,
      "loss": 0.9555,
      "step": 4058
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017605702805914306,
      "loss": 0.9656,
      "step": 4059
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001760456965118781,
      "loss": 1.0842,
      "step": 4060
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017603436264864347,
      "loss": 0.8449,
      "step": 4061
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017602302646978427,
      "loss": 0.8974,
      "step": 4062
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017601168797564583,
      "loss": 0.9172,
      "step": 4063
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017600034716657342,
      "loss": 0.7991,
      "step": 4064
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017598900404291245,
      "loss": 0.9299,
      "step": 4065
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017597765860500838,
      "loss": 0.9678,
      "step": 4066
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017596631085320668,
      "loss": 1.0014,
      "step": 4067
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017595496078785295,
      "loss": 1.1735,
      "step": 4068
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.0001759436084092929,
      "loss": 1.0027,
      "step": 4069
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017593225371787224,
      "loss": 0.7985,
      "step": 4070
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017592089671393684,
      "loss": 1.0709,
      "step": 4071
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017590953739783248,
      "loss": 0.8418,
      "step": 4072
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017589817576990516,
      "loss": 1.0013,
      "step": 4073
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017588681183050087,
      "loss": 0.9751,
      "step": 4074
    },
    {
      "epoch": 0.9,
      "learning_rate": 0.00017587544557996573,
      "loss": 1.0283,
      "step": 4075
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017586407701864588,
      "loss": 1.0537,
      "step": 4076
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017585270614688757,
      "loss": 0.9685,
      "step": 4077
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001758413329650371,
      "loss": 0.9231,
      "step": 4078
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017582995747344077,
      "loss": 0.9152,
      "step": 4079
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017581857967244514,
      "loss": 0.9652,
      "step": 4080
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017580719956239663,
      "loss": 1.0342,
      "step": 4081
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017579581714364183,
      "loss": 0.8858,
      "step": 4082
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017578443241652743,
      "loss": 0.8264,
      "step": 4083
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001757730453814001,
      "loss": 0.9928,
      "step": 4084
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001757616560386067,
      "loss": 0.968,
      "step": 4085
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017575026438849402,
      "loss": 0.9761,
      "step": 4086
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017573887043140907,
      "loss": 0.8206,
      "step": 4087
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017572747416769876,
      "loss": 0.8446,
      "step": 4088
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017571607559771024,
      "loss": 0.7684,
      "step": 4089
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017570467472179062,
      "loss": 1.0795,
      "step": 4090
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017569327154028712,
      "loss": 0.9684,
      "step": 4091
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.000175681866053547,
      "loss": 0.9275,
      "step": 4092
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017567045826191767,
      "loss": 1.0101,
      "step": 4093
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017565904816574653,
      "loss": 1.0311,
      "step": 4094
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017564763576538104,
      "loss": 0.8849,
      "step": 4095
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017563622106116878,
      "loss": 0.8194,
      "step": 4096
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017562480405345737,
      "loss": 1.1313,
      "step": 4097
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017561338474259458,
      "loss": 0.8723,
      "step": 4098
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017560196312892815,
      "loss": 0.9354,
      "step": 4099
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017559053921280588,
      "loss": 0.9292,
      "step": 4100
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017557911299457575,
      "loss": 0.9929,
      "step": 4101
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001755676844745857,
      "loss": 1.0594,
      "step": 4102
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001755562536531838,
      "loss": 1.0932,
      "step": 4103
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017554482053071818,
      "loss": 1.0562,
      "step": 4104
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017553338510753705,
      "loss": 0.8865,
      "step": 4105
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017552194738398863,
      "loss": 0.963,
      "step": 4106
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017551050736042134,
      "loss": 0.9572,
      "step": 4107
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001754990650371835,
      "loss": 1.0094,
      "step": 4108
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001754876204146236,
      "loss": 0.9719,
      "step": 4109
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001754761734930902,
      "loss": 0.938,
      "step": 4110
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017546472427293192,
      "loss": 0.9171,
      "step": 4111
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017545327275449748,
      "loss": 0.9301,
      "step": 4112
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017544181893813557,
      "loss": 0.9707,
      "step": 4113
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017543036282419502,
      "loss": 1.0301,
      "step": 4114
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017541890441302477,
      "loss": 0.9988,
      "step": 4115
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.0001754074437049738,
      "loss": 0.9501,
      "step": 4116
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017539598070039108,
      "loss": 0.9486,
      "step": 4117
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017538451539962573,
      "loss": 1.0065,
      "step": 4118
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.00017537304780302696,
      "loss": 1.0659,
      "step": 4119
    },
    {
      "epoch": 0.91,
      "learning_rate": 0.000175361577910944,
      "loss": 0.9077,
      "step": 4120
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017535010572372617,
      "loss": 1.0285,
      "step": 4121
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017533863124172285,
      "loss": 0.9278,
      "step": 4122
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017532715446528347,
      "loss": 1.061,
      "step": 4123
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001753156753947576,
      "loss": 0.9754,
      "step": 4124
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017530419403049478,
      "loss": 1.0479,
      "step": 4125
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017529271037284474,
      "loss": 0.9816,
      "step": 4126
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017528122442215719,
      "loss": 0.9298,
      "step": 4127
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001752697361787819,
      "loss": 1.0366,
      "step": 4128
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017525824564306876,
      "loss": 0.865,
      "step": 4129
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017524675281536777,
      "loss": 0.9012,
      "step": 4130
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017523525769602883,
      "loss": 0.9168,
      "step": 4131
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017522376028540214,
      "loss": 1.0599,
      "step": 4132
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017521226058383782,
      "loss": 1.0548,
      "step": 4133
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017520075859168603,
      "loss": 0.9954,
      "step": 4134
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017518925430929714,
      "loss": 0.8689,
      "step": 4135
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017517774773702146,
      "loss": 0.9599,
      "step": 4136
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017516623887520947,
      "loss": 0.9727,
      "step": 4137
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017515472772421163,
      "loss": 0.8413,
      "step": 4138
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017514321428437857,
      "loss": 0.8427,
      "step": 4139
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017513169855606087,
      "loss": 0.9482,
      "step": 4140
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017512018053960927,
      "loss": 0.9008,
      "step": 4141
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001751086602353745,
      "loss": 0.9937,
      "step": 4142
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017509713764370747,
      "loss": 0.9253,
      "step": 4143
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017508561276495912,
      "loss": 0.9669,
      "step": 4144
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017507408559948038,
      "loss": 0.9046,
      "step": 4145
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017506255614762234,
      "loss": 1.0331,
      "step": 4146
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001750510244097361,
      "loss": 0.8915,
      "step": 4147
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001750394903861729,
      "loss": 0.8768,
      "step": 4148
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.000175027954077284,
      "loss": 1.0605,
      "step": 4149
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001750164154834207,
      "loss": 0.9542,
      "step": 4150
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017500487460493446,
      "loss": 0.9214,
      "step": 4151
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017499333144217673,
      "loss": 1.0135,
      "step": 4152
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017498178599549907,
      "loss": 0.955,
      "step": 4153
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017497023826525305,
      "loss": 0.9674,
      "step": 4154
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001749586882517904,
      "loss": 1.0081,
      "step": 4155
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017494713595546287,
      "loss": 1.0148,
      "step": 4156
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001749355813766223,
      "loss": 1.1226,
      "step": 4157
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017492402451562057,
      "loss": 0.9435,
      "step": 4158
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017491246537280962,
      "loss": 0.9002,
      "step": 4159
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.0001749009039485415,
      "loss": 1.0582,
      "step": 4160
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017488934024316831,
      "loss": 0.8601,
      "step": 4161
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017487777425704225,
      "loss": 0.9301,
      "step": 4162
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017486620599051555,
      "loss": 0.9243,
      "step": 4163
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017485463544394047,
      "loss": 0.9411,
      "step": 4164
    },
    {
      "epoch": 0.92,
      "learning_rate": 0.00017484306261766945,
      "loss": 0.8645,
      "step": 4165
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017483148751205497,
      "loss": 0.9397,
      "step": 4166
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017481991012744942,
      "loss": 0.9609,
      "step": 4167
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017480833046420552,
      "loss": 1.0506,
      "step": 4168
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017479674852267587,
      "loss": 1.0439,
      "step": 4169
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017478516430321323,
      "loss": 0.9251,
      "step": 4170
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017477357780617032,
      "loss": 0.9218,
      "step": 4171
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001747619890319001,
      "loss": 1.0396,
      "step": 4172
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017475039798075547,
      "loss": 0.9849,
      "step": 4173
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017473880465308943,
      "loss": 0.9739,
      "step": 4174
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017472720904925502,
      "loss": 0.9277,
      "step": 4175
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017471561116960547,
      "loss": 0.9663,
      "step": 4176
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017470401101449392,
      "loss": 0.8781,
      "step": 4177
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017469240858427365,
      "loss": 0.9268,
      "step": 4178
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017468080387929806,
      "loss": 1.0767,
      "step": 4179
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017466919689992057,
      "loss": 0.9001,
      "step": 4180
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001746575876464946,
      "loss": 0.9422,
      "step": 4181
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001746459761193738,
      "loss": 1.013,
      "step": 4182
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017463436231891173,
      "loss": 0.9715,
      "step": 4183
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001746227462454621,
      "loss": 0.9497,
      "step": 4184
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017461112789937875,
      "loss": 0.8965,
      "step": 4185
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017459950728101543,
      "loss": 0.8856,
      "step": 4186
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017458788439072607,
      "loss": 0.969,
      "step": 4187
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017457625922886463,
      "loss": 1.0753,
      "step": 4188
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001745646317957852,
      "loss": 0.9267,
      "step": 4189
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017455300209184187,
      "loss": 0.9991,
      "step": 4190
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017454137011738879,
      "loss": 1.066,
      "step": 4191
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017452973587278025,
      "loss": 0.9171,
      "step": 4192
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017451809935837057,
      "loss": 0.8958,
      "step": 4193
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001745064605745141,
      "loss": 1.0152,
      "step": 4194
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017449481952156536,
      "loss": 0.9556,
      "step": 4195
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017448317619987887,
      "loss": 1.0076,
      "step": 4196
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017447153060980917,
      "loss": 0.9348,
      "step": 4197
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017445988275171094,
      "loss": 0.9108,
      "step": 4198
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017444823262593895,
      "loss": 1.0939,
      "step": 4199
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.000174436580232848,
      "loss": 0.8934,
      "step": 4200
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017442492557279295,
      "loss": 1.0552,
      "step": 4201
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017441326864612875,
      "loss": 0.9994,
      "step": 4202
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001744016094532104,
      "loss": 0.9695,
      "step": 4203
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.000174389947994393,
      "loss": 0.9346,
      "step": 4204
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017437828427003166,
      "loss": 0.9224,
      "step": 4205
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017436661828048165,
      "loss": 1.058,
      "step": 4206
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001743549500260982,
      "loss": 0.911,
      "step": 4207
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017434327950723675,
      "loss": 1.01,
      "step": 4208
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.0001743316067242526,
      "loss": 0.9776,
      "step": 4209
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017431993167750138,
      "loss": 0.9411,
      "step": 4210
    },
    {
      "epoch": 0.93,
      "learning_rate": 0.00017430825436733858,
      "loss": 0.9595,
      "step": 4211
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017429657479411983,
      "loss": 1.0409,
      "step": 4212
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017428489295820084,
      "loss": 0.9731,
      "step": 4213
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017427320885993742,
      "loss": 0.9785,
      "step": 4214
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017426152249968535,
      "loss": 0.9351,
      "step": 4215
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017424983387780057,
      "loss": 0.9422,
      "step": 4216
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.000174238142994639,
      "loss": 1.0302,
      "step": 4217
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001742264498505568,
      "loss": 0.931,
      "step": 4218
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017421475444590997,
      "loss": 0.9112,
      "step": 4219
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017420305678105476,
      "loss": 1.0466,
      "step": 4220
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001741913568563474,
      "loss": 1.063,
      "step": 4221
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017417965467214424,
      "loss": 0.9161,
      "step": 4222
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017416795022880162,
      "loss": 0.9503,
      "step": 4223
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017415624352667603,
      "loss": 0.9915,
      "step": 4224
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.000174144534566124,
      "loss": 0.903,
      "step": 4225
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001741328233475021,
      "loss": 0.9295,
      "step": 4226
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.000174121109871167,
      "loss": 0.9484,
      "step": 4227
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017410939413747543,
      "loss": 1.0536,
      "step": 4228
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017409767614678424,
      "loss": 1.0457,
      "step": 4229
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017408595589945026,
      "loss": 0.9628,
      "step": 4230
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017407423339583047,
      "loss": 1.075,
      "step": 4231
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001740625086362818,
      "loss": 0.9557,
      "step": 4232
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001740507816211614,
      "loss": 0.9687,
      "step": 4233
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017403905235082636,
      "loss": 0.9506,
      "step": 4234
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017402732082563396,
      "loss": 1.0387,
      "step": 4235
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017401558704594142,
      "loss": 1.0465,
      "step": 4236
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017400385101210613,
      "loss": 0.9187,
      "step": 4237
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001739921127244855,
      "loss": 0.9208,
      "step": 4238
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017398037218343702,
      "loss": 0.9026,
      "step": 4239
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001739686293893182,
      "loss": 0.9068,
      "step": 4240
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017395688434248679,
      "loss": 0.9903,
      "step": 4241
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017394513704330038,
      "loss": 0.8842,
      "step": 4242
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017393338749211674,
      "loss": 1.0244,
      "step": 4243
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017392163568929374,
      "loss": 1.0164,
      "step": 4244
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017390988163518926,
      "loss": 0.9028,
      "step": 4245
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001738981253301613,
      "loss": 0.904,
      "step": 4246
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017388636677456785,
      "loss": 0.9567,
      "step": 4247
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017387460596876702,
      "loss": 0.9645,
      "step": 4248
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017386284291311704,
      "loss": 0.9495,
      "step": 4249
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017385107760797613,
      "loss": 1.0191,
      "step": 4250
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017383931005370253,
      "loss": 1.0401,
      "step": 4251
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017382754025065472,
      "loss": 0.9926,
      "step": 4252
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017381576819919112,
      "loss": 0.9541,
      "step": 4253
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.00017380399389967024,
      "loss": 0.9845,
      "step": 4254
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001737922173524506,
      "loss": 1.0822,
      "step": 4255
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.000173780438557891,
      "loss": 0.9722,
      "step": 4256
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017376865751635002,
      "loss": 0.8709,
      "step": 4257
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017375687422818654,
      "loss": 0.9735,
      "step": 4258
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001737450886937594,
      "loss": 0.8537,
      "step": 4259
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017373330091342747,
      "loss": 1.0449,
      "step": 4260
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017372151088754985,
      "loss": 0.8554,
      "step": 4261
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017370971861648552,
      "loss": 1.0799,
      "step": 4262
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017369792410059365,
      "loss": 0.9422,
      "step": 4263
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017368612734023343,
      "loss": 0.8965,
      "step": 4264
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017367432833576417,
      "loss": 0.9715,
      "step": 4265
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017366252708754515,
      "loss": 0.7877,
      "step": 4266
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001736507235959358,
      "loss": 0.9784,
      "step": 4267
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017363891786129562,
      "loss": 0.88,
      "step": 4268
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017362710988398408,
      "loss": 0.8844,
      "step": 4269
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017361529966436088,
      "loss": 0.9509,
      "step": 4270
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017360348720278564,
      "loss": 0.9907,
      "step": 4271
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017359167249961815,
      "loss": 0.9633,
      "step": 4272
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017357985555521818,
      "loss": 1.0383,
      "step": 4273
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017356803636994566,
      "loss": 0.8815,
      "step": 4274
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001735562149441605,
      "loss": 0.9973,
      "step": 4275
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017354439127822277,
      "loss": 0.9789,
      "step": 4276
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017353256537249253,
      "loss": 0.899,
      "step": 4277
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017352073722732994,
      "loss": 0.8391,
      "step": 4278
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017350890684309522,
      "loss": 1.004,
      "step": 4279
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017349707422014866,
      "loss": 0.9319,
      "step": 4280
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001734852393588507,
      "loss": 1.0247,
      "step": 4281
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017347340225956162,
      "loss": 1.0276,
      "step": 4282
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017346156292264204,
      "loss": 1.0137,
      "step": 4283
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017344972134845249,
      "loss": 0.8879,
      "step": 4284
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001734378775373536,
      "loss": 0.963,
      "step": 4285
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001734260314897061,
      "loss": 0.9248,
      "step": 4286
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017341418320587068,
      "loss": 1.0399,
      "step": 4287
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001734023326862083,
      "loss": 0.9373,
      "step": 4288
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017339047993107976,
      "loss": 0.9394,
      "step": 4289
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017337862494084608,
      "loss": 0.9021,
      "step": 4290
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017336676771586836,
      "loss": 1.004,
      "step": 4291
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017335490825650757,
      "loss": 1.0588,
      "step": 4292
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017334304656312503,
      "loss": 1.0359,
      "step": 4293
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017333118263608191,
      "loss": 0.8176,
      "step": 4294
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001733193164757396,
      "loss": 0.9466,
      "step": 4295
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001733074480824594,
      "loss": 0.8748,
      "step": 4296
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017329557745660273,
      "loss": 0.9445,
      "step": 4297
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017328370459853125,
      "loss": 0.9585,
      "step": 4298
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017327182950860643,
      "loss": 1.0887,
      "step": 4299
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.00017325995218719,
      "loss": 1.0542,
      "step": 4300
    },
    {
      "epoch": 0.95,
      "learning_rate": 0.0001732480726346436,
      "loss": 0.9036,
      "step": 4301
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001732361908513291,
      "loss": 0.9596,
      "step": 4302
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017322430683760836,
      "loss": 0.9294,
      "step": 4303
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017321242059384324,
      "loss": 0.9982,
      "step": 4304
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017320053212039577,
      "loss": 1.0988,
      "step": 4305
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017318864141762803,
      "loss": 0.8878,
      "step": 4306
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017317674848590212,
      "loss": 0.9146,
      "step": 4307
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017316485332558027,
      "loss": 0.9763,
      "step": 4308
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017315295593702473,
      "loss": 1.0391,
      "step": 4309
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017314105632059782,
      "loss": 0.9676,
      "step": 4310
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017312915447666201,
      "loss": 1.0322,
      "step": 4311
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017311725040557966,
      "loss": 1.0025,
      "step": 4312
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017310534410771338,
      "loss": 0.851,
      "step": 4313
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001730934355834258,
      "loss": 0.9338,
      "step": 4314
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017308152483307953,
      "loss": 0.9192,
      "step": 4315
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017306961185703737,
      "loss": 0.9599,
      "step": 4316
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017305769665566204,
      "loss": 1.0615,
      "step": 4317
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017304577922931652,
      "loss": 0.9316,
      "step": 4318
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017303385957836368,
      "loss": 0.9444,
      "step": 4319
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001730219377031666,
      "loss": 0.9692,
      "step": 4320
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001730100136040883,
      "loss": 0.9207,
      "step": 4321
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017299808728149198,
      "loss": 0.9029,
      "step": 4322
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001729861587357408,
      "loss": 0.8376,
      "step": 4323
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017297422796719807,
      "loss": 0.8972,
      "step": 4324
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017296229497622715,
      "loss": 0.8963,
      "step": 4325
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017295035976319146,
      "loss": 1.023,
      "step": 4326
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017293842232845447,
      "loss": 0.85,
      "step": 4327
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017292648267237974,
      "loss": 0.8157,
      "step": 4328
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017291454079533088,
      "loss": 0.922,
      "step": 4329
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001729025966976716,
      "loss": 0.9651,
      "step": 4330
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017289065037976567,
      "loss": 0.9245,
      "step": 4331
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001728787018419769,
      "loss": 0.8441,
      "step": 4332
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017286675108466916,
      "loss": 1.1064,
      "step": 4333
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017285479810820643,
      "loss": 0.9253,
      "step": 4334
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017284284291295277,
      "loss": 1.0011,
      "step": 4335
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017283088549927217,
      "loss": 0.9204,
      "step": 4336
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017281892586752892,
      "loss": 0.8517,
      "step": 4337
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001728069640180872,
      "loss": 1.1415,
      "step": 4338
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017279499995131125,
      "loss": 1.0398,
      "step": 4339
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017278303366756554,
      "loss": 0.9021,
      "step": 4340
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017277106516721443,
      "loss": 0.9603,
      "step": 4341
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001727590944506224,
      "loss": 0.8817,
      "step": 4342
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001727471215181541,
      "loss": 0.9249,
      "step": 4343
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017273514637017415,
      "loss": 0.964,
      "step": 4344
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.0001727231690070472,
      "loss": 1.085,
      "step": 4345
    },
    {
      "epoch": 0.96,
      "learning_rate": 0.00017271118942913805,
      "loss": 0.9522,
      "step": 4346
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001726992076368115,
      "loss": 0.8965,
      "step": 4347
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001726872236304325,
      "loss": 1.0424,
      "step": 4348
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017267523741036603,
      "loss": 0.9661,
      "step": 4349
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017266324897697715,
      "loss": 0.9596,
      "step": 4350
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017265125833063088,
      "loss": 1.0008,
      "step": 4351
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017263926547169244,
      "loss": 0.9859,
      "step": 4352
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001726272704005271,
      "loss": 0.9283,
      "step": 4353
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017261527311750015,
      "loss": 0.948,
      "step": 4354
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001726032736229769,
      "loss": 0.8878,
      "step": 4355
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017259127191732293,
      "loss": 0.9397,
      "step": 4356
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017257926800090368,
      "loss": 0.9754,
      "step": 4357
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001725672618740847,
      "loss": 1.0601,
      "step": 4358
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017255525353723165,
      "loss": 0.9498,
      "step": 4359
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001725432429907103,
      "loss": 0.9096,
      "step": 4360
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017253123023488635,
      "loss": 1.0664,
      "step": 4361
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001725192152701257,
      "loss": 0.8626,
      "step": 4362
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017250719809679428,
      "loss": 1.0464,
      "step": 4363
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.000172495178715258,
      "loss": 0.9824,
      "step": 4364
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017248315712588296,
      "loss": 1.0076,
      "step": 4365
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017247113332903528,
      "loss": 0.8729,
      "step": 4366
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017245910732508114,
      "loss": 0.9232,
      "step": 4367
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001724470791143868,
      "loss": 0.9567,
      "step": 4368
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017243504869731856,
      "loss": 0.9013,
      "step": 4369
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017242301607424282,
      "loss": 0.9739,
      "step": 4370
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.000172410981245526,
      "loss": 0.881,
      "step": 4371
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001723989442115347,
      "loss": 1.0425,
      "step": 4372
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017238690497263542,
      "loss": 0.9235,
      "step": 4373
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017237486352919486,
      "loss": 1.0451,
      "step": 4374
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001723628198815797,
      "loss": 1.0311,
      "step": 4375
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017235077403015677,
      "loss": 1.0846,
      "step": 4376
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017233872597529292,
      "loss": 1.0267,
      "step": 4377
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017232667571735508,
      "loss": 0.8826,
      "step": 4378
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017231462325671023,
      "loss": 0.8976,
      "step": 4379
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017230256859372543,
      "loss": 1.0041,
      "step": 4380
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017229051172876778,
      "loss": 0.9408,
      "step": 4381
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001722784526622045,
      "loss": 0.8834,
      "step": 4382
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017226639139440283,
      "loss": 0.8647,
      "step": 4383
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017225432792573013,
      "loss": 1.1379,
      "step": 4384
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017224226225655376,
      "loss": 0.9385,
      "step": 4385
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001722301943872412,
      "loss": 1.0114,
      "step": 4386
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017221812431815993,
      "loss": 0.9649,
      "step": 4387
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017220605204967764,
      "loss": 0.8651,
      "step": 4388
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.0001721939775821619,
      "loss": 1.1144,
      "step": 4389
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017218190091598045,
      "loss": 1.0143,
      "step": 4390
    },
    {
      "epoch": 0.97,
      "learning_rate": 0.00017216982205150113,
      "loss": 1.0865,
      "step": 4391
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001721577409890917,
      "loss": 0.9609,
      "step": 4392
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017214565772912026,
      "loss": 0.9974,
      "step": 4393
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017213357227195466,
      "loss": 1.1351,
      "step": 4394
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017212148461796302,
      "loss": 1.0509,
      "step": 4395
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017210939476751345,
      "loss": 0.9363,
      "step": 4396
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017209730272097417,
      "loss": 0.912,
      "step": 4397
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017208520847871342,
      "loss": 1.0008,
      "step": 4398
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017207311204109953,
      "loss": 0.8542,
      "step": 4399
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017206101340850092,
      "loss": 0.9343,
      "step": 4400
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017204891258128604,
      "loss": 0.9864,
      "step": 4401
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001720368095598234,
      "loss": 0.8981,
      "step": 4402
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017202470434448164,
      "loss": 0.9239,
      "step": 4403
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017201259693562935,
      "loss": 0.8556,
      "step": 4404
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017200048733363534,
      "loss": 1.1088,
      "step": 4405
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001719883755388684,
      "loss": 1.0062,
      "step": 4406
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017197626155169738,
      "loss": 0.966,
      "step": 4407
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017196414537249115,
      "loss": 0.9446,
      "step": 4408
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017195202700161878,
      "loss": 1.0227,
      "step": 4409
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017193990643944935,
      "loss": 0.8945,
      "step": 4410
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017192778368635192,
      "loss": 1.0442,
      "step": 4411
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017191565874269572,
      "loss": 1.0464,
      "step": 4412
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017190353160885006,
      "loss": 1.0376,
      "step": 4413
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017189140228518422,
      "loss": 0.9919,
      "step": 4414
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017187927077206758,
      "loss": 1.0186,
      "step": 4415
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017186713706986964,
      "loss": 1.0275,
      "step": 4416
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017185500117895995,
      "loss": 0.8955,
      "step": 4417
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001718428630997081,
      "loss": 1.0019,
      "step": 4418
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017183072283248371,
      "loss": 0.9871,
      "step": 4419
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017181858037765654,
      "loss": 0.9003,
      "step": 4420
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001718064357355964,
      "loss": 0.8859,
      "step": 4421
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017179428890667318,
      "loss": 1.111,
      "step": 4422
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017178213989125672,
      "loss": 1.0633,
      "step": 4423
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001717699886897171,
      "loss": 0.9654,
      "step": 4424
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017175783530242432,
      "loss": 0.9807,
      "step": 4425
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017174567972974862,
      "loss": 0.888,
      "step": 4426
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017173352197206006,
      "loss": 0.9875,
      "step": 4427
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.000171721362029729,
      "loss": 0.9514,
      "step": 4428
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017170919990312574,
      "loss": 0.9649,
      "step": 4429
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017169703559262068,
      "loss": 1.0029,
      "step": 4430
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001716848690985843,
      "loss": 0.9459,
      "step": 4431
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001716727004213871,
      "loss": 1.1021,
      "step": 4432
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001716605295613997,
      "loss": 0.8899,
      "step": 4433
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.0001716483565189927,
      "loss": 0.9989,
      "step": 4434
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017163618129453694,
      "loss": 1.0164,
      "step": 4435
    },
    {
      "epoch": 0.98,
      "learning_rate": 0.00017162400388840313,
      "loss": 0.95,
      "step": 4436
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017161182430096216,
      "loss": 0.9139,
      "step": 4437
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017159964253258498,
      "loss": 0.9334,
      "step": 4438
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017158745858364256,
      "loss": 0.9559,
      "step": 4439
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.000171575272454506,
      "loss": 0.9135,
      "step": 4440
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001715630841455463,
      "loss": 0.8595,
      "step": 4441
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017155089365713483,
      "loss": 0.9392,
      "step": 4442
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017153870098964277,
      "loss": 0.8969,
      "step": 4443
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017152650614344142,
      "loss": 1.0602,
      "step": 4444
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017151430911890224,
      "loss": 0.8414,
      "step": 4445
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017150210991639662,
      "loss": 1.0434,
      "step": 4446
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017148990853629612,
      "loss": 0.9968,
      "step": 4447
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017147770497897232,
      "loss": 0.8316,
      "step": 4448
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017146549924479694,
      "loss": 1.0504,
      "step": 4449
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001714532913341416,
      "loss": 0.9093,
      "step": 4450
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001714410812473782,
      "loss": 1.0416,
      "step": 4451
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017142886898487852,
      "loss": 0.7567,
      "step": 4452
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001714166545470145,
      "loss": 1.0492,
      "step": 4453
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017140443793415815,
      "loss": 1.0146,
      "step": 4454
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017139221914668152,
      "loss": 1.0767,
      "step": 4455
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017137999818495674,
      "loss": 0.955,
      "step": 4456
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017136777504935595,
      "loss": 0.9418,
      "step": 4457
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017135554974025146,
      "loss": 0.8553,
      "step": 4458
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001713433222580156,
      "loss": 0.9837,
      "step": 4459
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017133109260302073,
      "loss": 0.8959,
      "step": 4460
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017131886077563927,
      "loss": 0.9901,
      "step": 4461
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001713066267762438,
      "loss": 1.0063,
      "step": 4462
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001712943906052069,
      "loss": 0.8398,
      "step": 4463
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001712821522629012,
      "loss": 0.8137,
      "step": 4464
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017126991174969938,
      "loss": 0.8841,
      "step": 4465
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017125766906597433,
      "loss": 0.9703,
      "step": 4466
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017124542421209882,
      "loss": 0.8974,
      "step": 4467
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017123317718844577,
      "loss": 0.9602,
      "step": 4468
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001712209279953882,
      "loss": 0.9603,
      "step": 4469
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017120867663329912,
      "loss": 1.0492,
      "step": 4470
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017119642310255167,
      "loss": 0.9507,
      "step": 4471
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.000171184167403519,
      "loss": 1.0367,
      "step": 4472
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017117190953657438,
      "loss": 0.9741,
      "step": 4473
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017115964950209115,
      "loss": 1.0576,
      "step": 4474
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017114738730044266,
      "loss": 1.091,
      "step": 4475
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017113512293200235,
      "loss": 0.9718,
      "step": 4476
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017112285639714374,
      "loss": 0.8763,
      "step": 4477
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.0001711105876962404,
      "loss": 0.9206,
      "step": 4478
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.000171098316829666,
      "loss": 1.0776,
      "step": 4479
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017108604379779418,
      "loss": 1.0268,
      "step": 4480
    },
    {
      "epoch": 0.99,
      "learning_rate": 0.00017107376860099878,
      "loss": 1.0332,
      "step": 4481
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017106149123965366,
      "loss": 0.9623,
      "step": 4482
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017104921171413263,
      "loss": 0.8396,
      "step": 4483
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017103693002480975,
      "loss": 0.8593,
      "step": 4484
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017102464617205906,
      "loss": 0.9957,
      "step": 4485
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017101236015625463,
      "loss": 0.918,
      "step": 4486
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.0001710000719777706,
      "loss": 0.9842,
      "step": 4487
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017098778163698124,
      "loss": 0.8827,
      "step": 4488
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.0001709754891342609,
      "loss": 0.9324,
      "step": 4489
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017096319446998387,
      "loss": 0.956,
      "step": 4490
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.0001709508976445246,
      "loss": 0.87,
      "step": 4491
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017093859865825763,
      "loss": 1.0233,
      "step": 4492
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.0001709262975115575,
      "loss": 0.9791,
      "step": 4493
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.0001709139942047988,
      "loss": 0.9873,
      "step": 4494
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017090168873835633,
      "loss": 1.0038,
      "step": 4495
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017088938111260474,
      "loss": 1.0338,
      "step": 4496
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017087707132791894,
      "loss": 0.9596,
      "step": 4497
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017086475938467378,
      "loss": 0.8968,
      "step": 4498
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017085244528324423,
      "loss": 0.8783,
      "step": 4499
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017084012902400533,
      "loss": 1.0171,
      "step": 4500
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017082781060733215,
      "loss": 0.9052,
      "step": 4501
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017081549003359988,
      "loss": 0.9499,
      "step": 4502
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00017080316730318367,
      "loss": 1.0719,
      "step": 4503
    }
  ],
  "logging_steps": 1,
  "max_steps": 18012,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 4,
  "save_steps": 4503,
  "total_flos": 9.38218503385645e+17,
  "train_batch_size": 2,
  "trial_name": null,
  "trial_params": null
}