ConvLab
/

t5-small-dst-sgd

Text2Text Generation

dialog state tracking

conversational system

task-oriented dialog

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

zhuqi commited on Nov 25, 2022

Commit

4d11bc6

•

1 Parent(s): 634584b

Update README.md

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -55,18 +55,18 @@ Refer to [ConvLab-3](https://github.com/ConvLab/ConvLab-3) for model description
 The following hyperparameters were used during training:
 - learning_rate: 0.001
-- train_batch_size: 128
 - eval_batch_size: 64
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 256
 - optimizer: Adafactor
 - lr_scheduler_type: linear
 - num_epochs: 10.0
 ### Framework versions
-- Transformers 4.18.0
-- Pytorch 1.10.2+cu102
-- Datasets 1.18.3
-- Tokenizers 0.11.0

 The following hyperparameters were used during training:
 - learning_rate: 0.001
+- train_batch_size: 64
 - eval_batch_size: 64
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 128
 - optimizer: Adafactor
 - lr_scheduler_type: linear
 - num_epochs: 10.0
 ### Framework versions
+- Transformers 4.20.1
+- Pytorch 1.11.0+cu113
+- Datasets 2.3.2
+- Tokenizers 0.12.1