End of training

Browse files

Files changed (7) hide show

README.md +18 -15
config.json +1 -1
generation_config.json +1 -1
logs/events.out.tfevents.1712422012.dddb5f68e1c2.2131.0 +3 -0
logs/events.out.tfevents.1712431203.dddb5f68e1c2.2131.1 +3 -0
model.safetensors +1 -1
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -17,12 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.4253
-- Rouge1: 44.2359
-- Rouge2: 30.5507
-- Rougel: 44.2106
-- Rougelsum: 44.1741
-- Gen Len: 6.7217
 ## Model description
@@ -42,27 +42,30 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5
 ### Training results
 | Training Loss | Epoch | Step  | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
-| 1.2431        | 1.0   | 3043  | 1.4989          | 43.2366 | 29.8274 | 43.0806 | 43.0779   | 6.9448  |
-| 1.0853        | 2.0   | 6086  | 1.4253          | 44.2359 | 30.5507 | 44.2106 | 44.1741   | 6.7217  |
-| 1.0113        | 3.0   | 9129  | 1.4410          | 44.6368 | 30.9222 | 44.508  | 44.5001   | 6.9632  |
-| 0.9523        | 4.0   | 12172 | 1.4296          | 43.9811 | 30.0401 | 43.9184 | 43.8937   | 6.6369  |
-| 0.9512        | 5.0   | 15215 | 1.4403          | 44.4396 | 30.8244 | 44.382  | 44.3671   | 6.8264  |
 ### Framework versions
-- Transformers 4.39.1
 - Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.4801
+- Rouge1: 43.5728
+- Rouge2: 29.7242
+- Rougel: 43.4217
+- Rougelsum: 43.5037
+- Gen Len: 6.0567
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 4
+- eval_batch_size: 4
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 8
 ### Training results
 | Training Loss | Epoch | Step  | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
+| 1.1732        | 1.0   | 6086  | 1.4855          | 44.3939 | 30.5367 | 44.3029 | 44.2892   | 6.4530  |
+| 1.0189        | 2.0   | 12172 | 1.4801          | 43.5728 | 29.7242 | 43.4217 | 43.5037   | 6.0567  |
+| 0.9379        | 3.0   | 18258 | 1.5378          | 43.8028 | 30.5358 | 43.6786 | 43.7252   | 6.9653  |
+| 0.8248        | 4.0   | 24344 | 1.5389          | 43.8363 | 29.5076 | 43.6659 | 43.7408   | 6.5986  |
+| 0.832         | 5.0   | 30430 | 1.5519          | 44.9435 | 30.0837 | 44.7905 | 44.8729   | 6.5894  |
+| 0.732         | 6.0   | 36516 | 1.5944          | 42.8507 | 28.9669 | 42.7438 | 42.7529   | 6.4045  |
+| 0.778         | 7.0   | 42602 | 1.5845          | 44.1834 | 29.2917 | 44.0298 | 44.0912   | 6.4285  |
+| 0.702         | 8.0   | 48688 | 1.6057          | 44.2474 | 29.458  | 44.0837 | 44.1208   | 6.6088  |
 ### Framework versions
+- Transformers 4.39.3
 - Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -55,7 +55,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.39.1",
   "use_cache": true,
   "vocab_size": 32128
 }

     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.39.3",
   "use_cache": true,
   "vocab_size": 32128
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.39.1"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.39.3"
 }

logs/events.out.tfevents.1712422012.dddb5f68e1c2.2131.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:edabebe9cc24c1d132f419e53ad3b99f754290fca60a0eaa34c509077752a93e
+size 30922

logs/events.out.tfevents.1712431203.dddb5f68e1c2.2131.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b6c617e9d472c2fefce1b04d19eb2c3ae7f1ce8030512ac7dde264c1a84fcc48
+size 623

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:878bfd280be4f1d2702e2caa25a2c5f15cf6707d12f9dd706ab6ee09e8812831
 size 242041896

 version https://git-lfs.github.com/spec/v1
+oid sha256:2c228c5d31871faec415ac5df4b28b60fc1609c98f867db4d220532cd78e4fe8
 size 242041896

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ccef0fa08400dac97eea3243766b465b08095227932ea8d6547639801ac70799
-size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:a667d60d7f1c5db8437f8e9945bf40431a0d0d378a48c77cd32c3225ed026809
+size 5112