nbroad
/

rob-base-gc1

Question Answering

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Edit model card

rob-base-gc1

This model is a fine-tuned version of roberta-base on the None dataset.

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 0.0001
train_batch_size: 4
eval_batch_size: 4
seed: 42
distributed_type: IPU
gradient_accumulation_steps: 64
total_train_batch_size: 256
total_eval_batch_size: 20
optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
num_epochs: 2.0
training precision: Mixed Precision

Training results

Framework versions

Transformers 4.20.0
Pytorch 1.10.0+cpu
Datasets 2.4.0
Tokenizers 0.12.1

Downloads last month: 15

Inference Examples

Question Answering

This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Datasets used to train nbroad/rob-base-gc1

Evaluation results

Exact Match on adversarial_qa
validation set self-reported

42.900
F1 on adversarial_qa
validation set self-reported

53.895
Exact Match on squad_v2
validation set self-reported

79.538
F1 on squad_v2
validation set self-reported

82.722
Exact Match on quoref
validation set self-reported

78.403
F1 on quoref
validation set self-reported

82.141

View on Papers With Code