sagorbrur commited on
Commit
2af2285
1 Parent(s): 2028435

added model card

Browse files
Files changed (1) hide show
  1. README.md +54 -0
README.md ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: bn
3
+ tags:
4
+ - mbert
5
+ - bengali
6
+ - question-answering
7
+ - bangla
8
+ - qa
9
+ license: MIT
10
+ datasets:
11
+ - tydiqa
12
+
13
+ ---
14
+
15
+ # mBERT Bengali Question Answering
16
+ `mBERT-Bengali-Tydiqa-QA` is a question answering model fine-tuning [bert-base-multilingual-uncased](https://huggingface.co/bert-base-multilingual-uncased) model with [tydiqa](https://github.com/google-research-datasets/tydiqa) Bengali datasets.
17
+
18
+
19
+ ## Usage
20
+
21
+ ```py
22
+ from transformers import AutoModelForQuestionAnswering, AutoTokenizer, pipeline
23
+
24
+ model_name = "sagorsarker/mbert-bengali-tydiqa-qa"
25
+ model = AutoModelForQuestionAnswering.from_pretrained(model_name)
26
+ tokenizer = AutoTokenizer.from_pretrained(model_name)
27
+
28
+ nlp = pipeline('question-answering', model=model_name, tokenizer=model_name)
29
+ qa_input = {
30
+ 'question': 'মাস্টারদা সূর্যকুমার সেনের বাবার নাম কী ছিল ?',
31
+ 'context': 'সূর্য সেন ১৮৯৪ সালের ২২ মার্চ চট্টগ্রামের রাউজান থানার নোয়াপাড়ায় অর্থনৈতিক ভাবে অস্বচ্ছল পরিবারে জন্মগ্রহণ করেন। তাঁর পিতার নাম রাজমনি সেন এবং মাতার নাম শশী বালা সেন। রাজমনি সেনের দুই ছেলে আর চার মেয়ে। সূর্য সেন তাঁদের পরিবারের চতুর্থ সন্তান। দুই ছেলের নাম সূর্য ও কমল। চার মেয়ের নাম বরদাসুন্দরী, সাবিত্রী, ভানুমতী ও প্রমিলা। শৈশবে পিতা মাতাকে হারানো সূর্য সেন কাকা গৌরমনি সেনের কাছে মানুষ হয়েছেন। সূর্য সেন ছেলেবেলা থেকেই খুব মনোযোগী ভাল ছাত্র ছিলেন এবং ধর্মভাবাপন্ন গম্ভীর প্রকৃতির ছিলেন।'
32
+ }
33
+ result = nlp(qa_input)
34
+ print(result)
35
+
36
+ ```
37
+
38
+
39
+ ## Training Details
40
+ - `mBERT-Bengali-Tydiqa-QA` model build using [bert-base-multilingual-uncased](https://huggingface.co/bert-base-multilingual-uncased)
41
+ - `mBERT-Bengali-Tydiqa-QA` model trained with [tydiqa](https://github.com/google-research-datasets/tydiqa) Bengali datasets.
42
+ - Tydiqa Bengali data contains **2390 train** data and **113 validation** data
43
+ - `mBERT-Bengali-Tydiqa-QA` model trained in [kaggle]() GPU
44
+ - `mBERT-Bengali-Tydiqa-QA` model trained total 5 epochs
45
+ - `mBERT-Bengali-Tydiqa-QA` trained using [transformers/example/question-aswering](https://colab.research.google.com/github/huggingface/notebooks/blob/master/examples/question_answering.ipynb) notebook with all default settings except pre-trained model and datasets part
46
+
47
+
48
+ ## Evaluation Results
49
+ Here is the training evaluation part
50
+ ```
51
+ Exact Match: 57.52212389380531
52
+ F1 Score: 68.66183963529096
53
+
54
+ ```