Update README.md (#1)

- Update README.md (099acecc9c01b7345a43e4316ff30aa25502b5e7)

Co-authored-by: Miriam Anschütz <[email protected]>

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,3 +1,12 @@
 ```python
 import torch
 from transformers import AutoTokenizer
@@ -30,4 +39,15 @@ for key, value in test_input.items():
 outputs = model.generate(**test_input, num_beams=3, max_length=1024)
 decoder_tokenizer.batch_decode(outputs)
-```

+---
+license: mit
+language:
+- de
+---
+# German text simplification with custom decoder
+This model was initialized from an mBART model and the decoder was replaced by a GPT2 language model pre-trained for German Easy Language. For more details, visit our [Github repository](https://github.com/MiriUll/Language-Models-German-Simplification).
+## Usage
 ```python
 import torch
 from transformers import AutoTokenizer
 outputs = model.generate(**test_input, num_beams=3, max_length=1024)
 decoder_tokenizer.batch_decode(outputs)
+```
+## Citation
+If you use our mode, please cite:
+@misc{anschütz2023language,
+&emsp;        title={Language Models for German Text Simplification: Overcoming Parallel Data Scarcity through Style-specific Pre-training},
+&emsp;       author={Miriam Anschütz and Joshua Oehms and Thomas Wimmer and Bartłomiej Jezierski and Georg Groh},
+&emsp;       year={2023},
+&emsp;       eprint={2305.12908},
+&emsp;       archivePrefix={arXiv},
+&emsp;       primaryClass={cs.CL}
+}