josmunpen's picture
Update README.md
eb06c2e
|
raw
history blame
3.03 kB
metadata
language:
  - es
thumbnail: null
tags:
  - summarization
  - mt5
  - spanish
license: apache-2.0
datasets:
  - larazonpublico
  - es
metrics:
  - rouge
widget:
  - text: >-
      La Guardia Civil ha desarticulado un grupo organizado dedicado a copiar en
      los examenes teoricos para la obtencion del permiso de conducir. Para
      ello, empleaban receptores y camaras de alta tecnologia y operaban desde
      la misma sede del Centro de examenes de la Direccion General de Trafico
      (DGT) en Mostoles. Es lo que han llamado la Operacion pinga. El grupo
      desarticulado ofrecia el servicio de transporte y tecnologia para copiar y
      poder aprobar. Por dicho servicio cobraban 1.000 euros. Los investigadores
      sorprendieron in fraganti a una mujer intentando copiar en el examen.
      Portaba una chaqueta con dispositivos electronicos ocultos, concretamente
      un telefono movil al que estaba conectada una camara que habia sido
      insertada en la parte frontal de la chaqueta para transmitir online el
      examen y que orientada al ordenador del Centro de Examenes en el que
      aparecen las preguntas, permitia visualizar las imagenes en otro ordenador
      alojado en el interior de un vehiculo estacionado en las inmediaciones del
      centro. En este vehiculo, se encontraban el resto del grupo desarticulado
      con varios ordenadores portatiles y tablets abiertos y conectados a
      paginas de test de la DGT para consultar las respuestas. Estos,
      comunicaban con la mujer que estaba en el aula haciendo el examen a traves
      de un diminuto receptor bluetooth que portaba en el interior de su oido. 
      Luis de Lama, portavoz de la Guardia Civil de Trafico destaca que los
      ciudadanos, eran de origen chino, y copiaban en el examen utilizando la
      tecnologia facilitada por una organizacion. Destaca que, ademas de parte
      del fraude que supone copiar en un examen muchos de estos ciudadanos
      desconocian el idioma, no hablan ni entienden el español lo que supone un
      grave riesgo para la seguridad vial por desconocer las señales y letreros
      que avisan en carretera de muchas incidencias. 

mt5-small-spanish-summarization

Model description

This is a mt5-small model finetuned for generating headlines from the body of the news in Spanish.

Training data

The model was trained with 58425 news extracted from the La Razón (31477) and Público (26948) newspapers. These news belong to the following categories: "España", "Cultura", "Economía", "Igualdad" and "Política".

Training procedure

It was trained with Google Colab's GPU Tesla P100-PCIE-16GB for 2 epochs.

Hyperparameters

{evaluation_strategy = "epoch", learning_rate = 2e-4, per_device_train_batch_size = 6, per_device_eval_batch_size = 6, weight_decay = 0.01, save_total_limi t= 3, num_train_epochs = 2, predict_with_generate = True, fp16 = False}

Eval results

metric score
rouge1 44.03
rouge2 28.2900
rougeL 40.54
rougeLsum 40.5587

BibTeX entry and citation info

@inproceedings{ mt5lrpjosmunpen,
  year={2020},
  author = {José Manuel Muñiz Peña},
}