julien-c HF staff commited on
Commit
6dd6d08
1 Parent(s): d29359c

Migrate model card from transformers-repo

Browse files

Read announcement at https://discuss.huggingface.co/t/announcement-all-model-cards-will-be-migrated-to-hf-co-model-repos/2755
Original file history: https://github.com/huggingface/transformers/commits/master/model_cards/hatmimoha/arabic-ner/README.md

Files changed (1) hide show
  1. README.md +114 -0
README.md ADDED
@@ -0,0 +1,114 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: ar
3
+ ---
4
+ # Arabic Named Entity Recognition Model
5
+
6
+ Pretrained BERT-based ([arabic-bert-base](https://huggingface.co/asafaya/bert-base-arabic)) Named Entity Recognition model for Arabic.
7
+
8
+ The pre-trained model can recognize the following entities:
9
+ 1. **PERSON**
10
+
11
+ - و هذا ما نفاه المعاون السياسي للرئيس ***نبيه بري*** ، النائب ***علي حسن خليل***
12
+
13
+ - لكن أوساط ***الحريري*** تعتبر أنه ضحى كثيرا في سبيل البلد
14
+
15
+ - و ستفقد الملكة ***إليزابيث الثانية*** بذلك سيادتها على واحدة من آخر ممالك الكومنولث
16
+
17
+ 2. **ORGANIZATION**
18
+
19
+ - حسب أرقام ***البنك الدولي***
20
+
21
+ - أعلن ***الجيش العراقي***
22
+
23
+ - و نقلت وكالة ***رويترز*** عن ثلاثة دبلوماسيين في ***الاتحاد الأوروبي*** ، أن ***بلجيكا*** و ***إيرلندا*** و ***لوكسمبورغ*** تريد أيضاً مناقشة
24
+
25
+ - ***الحكومة الاتحادية*** و ***حكومة إقليم كردستان***
26
+
27
+ - و هو ما يثير الشكوك حول مشاركة النجم البرتغالي في المباراة المرتقبة أمام ***برشلونة*** الإسباني في
28
+
29
+
30
+ 3. ***LOCATION***
31
+
32
+ - الجديد هو تمكين اللاجئين من “ مغادرة الجزيرة تدريجياً و بهدوء إلى ***أثينا*** ”
33
+
34
+ - ***جزيرة ساكيز*** تبعد 1 كم عن ***إزمير***
35
+
36
+
37
+ 4. **DATE**
38
+
39
+ - ***غدا الجمعة***
40
+
41
+ - ***06 أكتوبر 2020***
42
+
43
+ - ***العام السابق***
44
+
45
+
46
+ 5. **PRODUCT**
47
+
48
+ - عبر حسابه ب ***تطبيق “ إنستغرام ”***
49
+
50
+ - الجيل الثاني من ***نظارة الواقع الافتراضي أوكولوس كويست*** تحت اسم " ***أوكولوس كويست 2*** "
51
+
52
+
53
+ 6. **COMPETITION**
54
+
55
+ - عدم المشاركة في ***بطولة فرنسا المفتوحة للتنس***
56
+
57
+ - في مباراة ***كأس السوبر الأوروبي***
58
+
59
+ 7. **PRIZE**
60
+
61
+ - ***جائزة نوبل ل لآداب***
62
+
63
+ - الذي فاز ب ***جائزة “ إيمي ” لأفضل دور مساند***
64
+
65
+ 8. **EVENT**
66
+
67
+ - تسجّل أغنية جديدة خاصة ب ***العيد الوطني السعودي***
68
+
69
+ - ***مهرجان المرأة يافوية*** في دورته الرابعة
70
+
71
+ 9. **DISEASE**
72
+
73
+ - في مكافحة فيروس ***كورونا*** و عدد من الأمراض
74
+
75
+ - الأزمات المشابهة مثل “ ***انفلونزا الطيور*** ” و ” ***انفلونزا الخنازير***
76
+
77
+ ## Example
78
+
79
+ [Find here a complete example to use this model](https://github.com/hatmimoha/arabic-ner)
80
+
81
+ Here is the map from index to label:
82
+
83
+ ```
84
+ id2label = {
85
+ "0": "B-PERSON",
86
+ "1": "I-PERSON",
87
+ "2": "B-ORGANIZATION",
88
+ "3": "I-ORGANIZATION",
89
+ "4": "B-LOCATION",
90
+ "5": "I-LOCATION",
91
+ "6": "B-DATE",
92
+ "7": "I-DATE"",
93
+ "8": "B-COMPETITION",
94
+ "9": "I-COMPETITION",
95
+ "10": "B-PRIZE",
96
+ "11": "I-PRIZE",
97
+ "12": "O",
98
+ "13": "B-PRODUCT",
99
+ "14": "I-PRODUCT",
100
+ "15": "B-EVENT",
101
+ "16": "I-EVENT",
102
+ "17": "B-DISEASE",
103
+ "18": "I-DISEASE",
104
+ }
105
+
106
+ ```
107
+
108
+ ## Training Corpus
109
+
110
+ The training corpus is made of 378.000 tokens (14.000 sentences) collected from the Web and annotated manually.
111
+
112
+ ## Results
113
+
114
+ The results on a valid corpus made of 30.000 tokens shows an F-measure of ~87%.