nclgbd
/

llava-med-v1.5-mistral-7b-pretrain-test

Generated from Trainer

Model card Files Files and versions Community

nclgbd commited on 28 days ago

Commit

9cbae94

•

1 Parent(s): d90f51f

End of training

Files changed (2) hide show

mm_projector.bin +1 -1
trainer_state.json +63 -3

mm_projector.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:317b3e5a7419caa45e6964636452ec7b443f84cd298f001d186c754819f89d2b
 size 83920509

 version https://git-lfs.github.com/spec/v1
+oid sha256:3564ad963e0a52caa824d7ccadfeabf219798c668fb6f7aa45078c1419e6e76e
 size 83920509

trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 6.067930481743114e-05,
   "eval_steps": 500,
-  "global_step": 12,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -79,6 +79,66 @@
       "learning_rate": 9.157348061512727e-05,
       "loss": 2.0462,
       "step": 12
     }
   ],
   "logging_steps": 1.0,
@@ -86,7 +146,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 10,
-  "total_flos": 92114153994240.0,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.00011124539216529043,
   "eval_steps": 500,
+  "global_step": 22,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 9.157348061512727e-05,
       "loss": 2.0462,
       "step": 12
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 8.966766701456177e-05,
+      "loss": 2.7075,
+      "step": 13
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 8.759199037394887e-05,
+      "loss": 1.5202,
+      "step": 14
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 8.535533905932738e-05,
+      "loss": 2.1509,
+      "step": 15
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 8.296729075500344e-05,
+      "loss": 2.4468,
+      "step": 16
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 8.043807145043604e-05,
+      "loss": 2.0541,
+      "step": 17
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 7.777851165098012e-05,
+      "loss": 1.1905,
+      "step": 18
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 7.500000000000001e-05,
+      "loss": 1.8179,
+      "step": 19
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 7.211443451095007e-05,
+      "loss": 2.0296,
+      "step": 20
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 6.91341716182545e-05,
+      "loss": 2.0647,
+      "step": 21
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 6.607197326515808e-05,
+      "loss": 1.3423,
+      "step": 22
     }
   ],
   "logging_steps": 1.0,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 10,
+  "total_flos": 177760243906560.0,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null