--- language: - es thumbnail: tags: - summarization - mt5 - spanish license: apache-2.0 datasets: - larazonpublico - es metrics: - rouge widget: - text: "La Guardia Civil ha desarticulado un grupo organizado dedicado a copiar en los exámenes teóricos para la obtención del permiso de conducir. Para ello, empleaban receptores y cámaras de alta tecnología y operaban desde la misma sede del Centro de exámenes de la Dirección General de Tráfico (DGT) en Móstoles. Es lo que han llamado la Operación pinga. El grupo desarticulado ofrecía el servicio de transporte y tecnología para copiar y poder aprobar. Por dicho servicio cobraban 1.000 euros. Los investigadores sorprendieron in fraganti a una mujer intentando copiar en el examen. Portaba una chaqueta con dispositivos electrónicos ocultos, concretamente un teléfono móvil al que estaba conectada una cámara que había sido insertada en la parte frontal de la chaqueta para transmitir online el examen y que orientada al ordenador del Centro de Exámenes en el que aparecen las preguntas, permitía visualizar las imágenes en otro ordenador alojado en el interior de un vehículo estacionado en las inmediaciones del centro. En este vehículo, se encontraban el resto del grupo desarticulado con varios ordenadores portátiles y tablets abiertos y conectados a páginas de test de la DGT para consultar las respuestas. Estos, comunicaban con la mujer que estaba en el aula haciendo el examen a través de un diminuto receptor bluetooth que portaba en el interior de su oído. Luis de Lama, portavoz de la Guardia Civil de Tráfico destaca que los ciudadanos, eran de origen chino, y copiaban en el examen utilizando la tecnología facilitada por una organización. Destaca que, además de parte del fraude que supone copiar en un examen muchos de estos ciudadanos desconocían el idioma, no hablan ni entienden el español lo que supone un grave riesgo para la seguridad vial por desconocer las señales y letreros que avisan en carretera de muchas incidencias." --- # mt5-small-spanish-summarization ## Model description This is a mt5-small model finetuned for generating headlines from the body of the news in Spanish. ## Training data The model was trained with 58425 news extracted from the La Razón (31477) and Público (26948) newspapers. These news belong to the following categories: "España", "Cultura", "Economía", "Igualdad" and "Política". ## Training procedure It was trained with Google Colab's GPU Tesla P100-PCIE-16GB for 2 epochs. ### Hyperparameters {evaluation_strategy = "epoch", learning_rate = 2e-4, per_device_train_batch_size = 6, per_device_eval_batch_size = 6, weight_decay = 0.01, save_total_limi t= 3, num_train_epochs = 2, predict_with_generate = True, fp16 = False} ## Eval results | metric | score | | --- | ----- | | rouge1 | 44.03 | | rouge2 | 28.2900 | | rougeL | 40.54 | | rougeLsum | 40.5587 | ### BibTeX entry and citation info ```bibtex @inproceedings{ mt5lrpjosmunpen, year={2020}, author = {José Manuel Muñiz Peña}, } ```