Jaren
/

DialoT5

Jaren commited on Aug 29, 2022

Commit

30caebd

•

1 Parent(s): afa4c05

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 This model is based on Langboat/mengzi-t5-base and pre-trained on 11 Chinese dialogue datasets. It is trained on 8 Tesla A100 for 2 days.
 To load this model:
 import torch
 from transformers import T5Tokenizer
 from transformers import T5ForConditionalGeneration
@@ -17,4 +17,5 @@ old_state_dict = ckpt['state_dict']
 new_state_dict = OrderedDict()
 for k, v in old_state_dict.items() :
     new_state_dict[k.replace('model.', '')] = v
-model.load_state_dict(new_state_dict, strict=False)

 This model is based on Langboat/mengzi-t5-base and pre-trained on 11 Chinese dialogue datasets. It is trained on 8 Tesla A100 for 2 days.
 To load this model:
+```python
 import torch
 from transformers import T5Tokenizer
 from transformers import T5ForConditionalGeneration
 new_state_dict = OrderedDict()
 for k, v in old_state_dict.items() :
     new_state_dict[k.replace('model.', '')] = v
+model.load_state_dict(new_state_dict, strict=False)
+```