NER / vocab /strings.json
vladiokc's picture
Upload 13 files
0d4d77e verified
raw
history blame
18.1 kB
[
"\t",
"\n",
"\r",
" ",
" ",
"\"",
"'",
"''",
"'-(",
"'-)",
"(",
"(((",
"(*>",
"(*_*)",
"(-8",
"(-:",
"(-;",
"(-_-)",
"(-d",
"(._.)",
"(:",
"(;",
"(=",
"(>_<)",
"(^_^)",
"(o:",
"(x:",
"(x_x)",
"(\u00ac_\u00ac)",
"(\u0ca0_\u0ca0)",
"(\u256f\u00b0\u25a1\u00b0\uff09\u256f\ufe35\u253b\u2501\u253b",
")",
")))",
")-:",
")/\u00af",
"):",
"*",
",",
"-",
"-((",
"-))",
"-/",
"-0",
"-3",
"-8",
"-D",
"-O",
"-P",
"-X",
"-_-",
"-__-",
"-d",
"-o",
"-p",
"-up",
"-x",
"-|",
".",
"..",
"...",
"....",
".C.",
"._.",
".a.",
".d.",
".so",
"/",
"/3",
"/d",
"0",
"0.0",
"0.o",
"0_0",
"0_o",
"1",
"3",
"33",
"333",
"8",
"8)",
"8-",
"8-)",
"8-D",
"8-d",
"8D",
"8d",
":",
":'(",
":')",
":'-(",
":'-)",
":(",
":((",
":(((",
":()",
":)",
":))",
":)))",
":*",
":-(",
":-((",
":-(((",
":-)",
":-))",
":-)))",
":-*",
":-/",
":-0",
":-3",
":->",
":-D",
":-O",
":-P",
":-X",
":-]",
":-d",
":-o",
":-p",
":-x",
":-|",
":-}",
":/",
":0",
":1",
":3",
":>",
":D",
":O",
":P",
":X",
":]",
":d",
":o",
":o)",
":p",
":x",
":x)",
":|",
":}",
":\u2019(",
":\u2019)",
":\u2019-(",
":\u2019-)",
";",
";)",
";-)",
";-D",
";-X",
";-d",
";D",
";X",
";_;",
";d",
"<",
"<.<",
"</3",
"</d",
"<3",
"<33",
"<333",
"<d",
"<dd",
"<ddd",
"<space>",
"<xxxx>",
"=",
"=(",
"=)",
"=/",
"=3",
"=D",
"=X",
"=[",
"=]",
"=d",
"=|",
">",
">.<",
">.>",
">:(",
">:o",
">:x",
"><(((*>",
"@",
"@_@",
"A",
"AND",
"Abramo",
"Adone",
"Affonso",
"Agapito",
"Agata",
"Alba",
"Alberico",
"Alberta",
"Alberto",
"Aldo",
"Alexander",
"Alfaro",
"Alfeo",
"Alfonsi",
"Alfonso",
"Alla",
"Allesi",
"Altera",
"Alvise",
"Amando",
"Ambrogino",
"Ambrogio",
"Amore",
"Anacleto",
"Anastasio",
"Andreina",
"Angelico",
"Angelo",
"Angiolo",
"Arcuri",
"Armo",
"Arrigo",
"Arsenio",
"Art",
"Art.",
"Aurelio",
"Avv",
"Avv.",
"Azzurra",
"B",
"Balan",
"Baresi",
"Baroffio",
"Bellini",
"Bellucci",
"Beneventi",
"Bertoldo",
"Bethowen",
"Biagino",
"Bianchi",
"Big",
"Bonfilia",
"Borroni",
"Branson",
"Brichese",
"Bruno",
"Buccio",
"Buffon",
"Buratti",
"C",
"C++",
"C.",
"C.so",
"COMMAND",
"Cafaro",
"Cajetan",
"Calabresi",
"Campagna",
"Candreva",
"Cantu",
"Capone",
"Carlita",
"Carlota",
"Castiglione",
"Cecilio",
"Cedano",
"Celestina",
"Celso",
"Cesar",
"Chiara",
"Chiarina",
"Christian",
"Ciao",
"Ciccone",
"Cidano",
"Cittadino",
"Civ",
"Civ.",
"Clemente",
"Cleto",
"Cocci",
"Cociarelli",
"Cod",
"Cod.",
"Colombina",
"Colombo",
"Consoli",
"Conti",
"Cost",
"Cost.",
"Costantino",
"Crispino",
"Cristiano",
"Cristoforo",
"D",
"D'",
"Damiano",
"Dan",
"Daniele",
"Dario",
"Davide",
"De",
"Demi",
"Desideria",
"Desiderio",
"Detti",
"Di",
"Dino",
"Doe",
"Dona",
"Donatella",
"Donati",
"Donato",
"Donini",
"Dorotea",
"Duca",
"Durante",
"E",
"E'",
"Edmonda",
"Elario",
"Elena",
"Eligio",
"Elma",
"Elmo",
"Emiliano",
"Endrizzi",
"Eneide",
"Enrichetta",
"Ermete",
"Erminio",
"Esparza",
"Ezzelin",
"E\u2019",
"F",
"F.",
"Fabio",
"Fanucci",
"Fausto",
"Felice",
"Fel\u00eccita",
"Ferrari",
"Ferruccio",
"Fiammetta",
"Filberto",
"Filomena",
"Fiorella",
"Fiorentini",
"Fiorentino",
"Fiorenzo",
"Florentina",
"Fontana",
"Fortunata",
"Franca",
"Franco",
"Fulvia",
"Fulvio",
"G",
"Gabriella",
"Gallo",
"Garcia",
"Gelli",
"Gemma",
"Genera",
"General",
"Generale",
"Gennaro",
"Genoveffa",
"Genovese",
"Genovesi",
"Gentilini",
"Gerardo",
"Giacomo",
"Gianni",
"Ginevra",
"Gino",
"Gioconda",
"Giordano",
"Giorgina",
"Giovanna",
"Giovinco",
"Giulia",
"Giustina",
"Giustino",
"Goffredo",
"Golino",
"Great",
"Greco",
"Greece",
"Gregario",
"Gucci",
"H",
"Hailey",
"I",
"IOA",
"Iadanza",
"Ignazio",
"Ilaria",
"Imelda",
"Immacolata",
"In",
"Ingegnere",
"Ingegner\u00e0",
"Insigne",
"Invia",
"J",
"Jacopo",
"Jemma",
"John",
"Jolanda",
"Jr",
"Jr.",
"K",
"K.",
"L",
"L'",
"L'art.",
"Lalia",
"Leonzio",
"Letizia",
"Lettiere",
"Lia",
"Livio",
"Lo",
"Locatello",
"Loggia",
"Lombardi",
"Longo",
"Lorenzo",
"Loreto",
"Lori",
"Lothario",
"Luca",
"Lucchesi",
"Lucciano",
"Ludovica",
"Ludovico",
"Luig",
"Luigina",
"L\u2019",
"L\u2019art.",
"M",
"Madeleine",
"Malvolia",
"Mancini",
"Manlio",
"Manna",
"Marcello",
"Marco",
"Mariella",
"Marietta",
"Marino",
"Marotta",
"Marta",
"Marzio",
"Mazzi",
"Melania",
"Melchiorre",
"Meo",
"Mike",
"Milano",
"Mirella",
"Modesto",
"Mona",
"Moretti",
"Moze",
"N",
"Napolitani",
"Natanaele",
"Necci",
"Neri",
"Nicola",
"Nicol\u00f2",
"Nino",
"Noelia",
"Noemi",
"O",
"O.O",
"O.o",
"O_O",
"O_o",
"Offredi",
"Onio",
"Orabella",
"Orsina",
"Oscuro",
"Ossani",
"Ottaviano",
"Ottavio",
"P",
"Paccioretti",
"Pagnotto",
"Palazzo",
"Palerma",
"Palermo",
"Panicucci",
"Paolina",
"Passero",
"Paul",
"Per",
"Piazza",
"Piccio",
"Piera",
"Piero",
"Pirozzi",
"Pisano",
"Porto",
"Proc",
"Proc.",
"Prospero",
"R",
"ROOT",
"Raniero",
"Report",
"Riccardo",
"Ricci",
"Rinaldo",
"Rivera",
"Romani",
"Romano",
"Romhilda",
"Rosannah",
"Rose",
"Rosiello",
"Rosina",
"Rossi",
"Rua",
"Russo",
"S",
"SON",
"Sabbatini",
"Sal",
"Salve",
"Samuele",
"Santa",
"Scarica",
"Serafina",
"Serafino",
"Sesto",
"Settimio",
"Severiano",
"Shepherd",
"Siciliano",
"Silvana",
"Small",
"Spours",
"St",
"St.",
"Stefania",
"Stephen",
"Strinati",
"T",
"Teodosio",
"Terenzio",
"Terzo",
"The",
"Thornton",
"Tino",
"To",
"Tocci",
"Tonia",
"Toscani",
"Trentini",
"U",
"Udinese",
"Udinesi",
"Umberto",
"Un",
"Underwoodn",
"V",
"V.V",
"V_V",
"Valeriano",
"Van",
"Vanna",
"Vecellio",
"Vecoli",
"Venceslao",
"Venturi",
"Verratti",
"Via",
"Vicenzo",
"Vinicio",
"Violante",
"Violetta",
"Virgilio",
"Vittoria",
"Voleo",
"Volta",
"X'",
"X'xxx.",
"X++",
"X.",
"X.X",
"X.x",
"X.xx",
"XD",
"XDD",
"XX",
"XXX",
"XXXX",
"X_X",
"X_x",
"Xx",
"Xx.",
"Xxx",
"Xxx.",
"Xxxx",
"Xxxx.",
"Xxxxx",
"X\u2019",
"X\u2019xxx.",
"Z",
"Zetticci",
"Zita",
"Zito",
"[",
"[-:",
"[:",
"[=",
"\\",
"\\\")",
"\\n",
"\\t",
"\\x",
"]",
"]=",
"^",
"^_^",
"^__^",
"^___^",
"_*)",
"_-)",
"_.)",
"_<)",
"_^)",
"__-",
"__^",
"_\u00ac)",
"_\u0ca0)",
"a",
"a.",
"a.C.",
"a.c.",
"abramo",
"ace",
"adone",
"adriana",
"affonso",
"ag.",
"agapito",
"agata",
"ail",
"al",
"al.",
"alba",
"albano",
"alberico",
"alberta",
"alberto",
"aldo",
"ale",
"alexander",
"alfaro",
"alfeo",
"alfonsi",
"alfonso",
"all",
"all'",
"all'art.",
"all-path",
"alla",
"allesi",
"all\u2019",
"all\u2019art.",
"altera",
"alvise",
"amando",
"ambrogino",
"ambrogio",
"amigo",
"amo",
"amore",
"ana",
"anacleto",
"anastasio",
"andreina",
"angelico",
"angelo",
"angiolo",
"ani",
"anjelica",
"ano",
"ara",
"arcuri",
"are",
"ari",
"armo",
"aro",
"arrigo",
"arsenio",
"art",
"art.",
"artt",
"artt.",
"ass",
"ata",
"ath",
"ati",
"ato",
"att",
"att.",
"aul",
"aurelio",
"avv",
"avv.",
"azzurra",
"b",
"b.",
"balan",
"baresi",
"baroffio",
"bella",
"bellini",
"bellucci",
"beneventi",
"bertoldo",
"bethowen",
"biagino",
"biagio",
"bianchi",
"big",
"bio",
"bonfilia",
"borroni",
"bot",
"branson",
"brichese",
"bruno",
"buccio",
"buffon",
"buongiorno",
"buratti",
"by",
"by-pass",
"c",
"c++",
"c.",
"c.d",
"c.d.",
"c.so",
"c/c",
"cIOA",
"cafaro",
"cajetan",
"calabresi",
"campagna",
"candreva",
"cantu",
"capone",
"carlita",
"carlota",
"caro",
"castiglione",
"cc.",
"cci",
"ce>",
"cecilio",
"cedano",
"celestina",
"celso",
"centro",
"centro-sinistra",
"cesar",
"check",
"check-up",
"chi",
"chiara",
"chiarina",
"christian",
"cia",
"ciao",
"ciccone",
"cidano",
"cio",
"cioa",
"cittadino",
"civ",
"civ.",
"clemente",
"cleto",
"cm",
"cm.",
"cocci",
"cociarelli",
"cod",
"cod.",
"col",
"col.",
"colombina",
"colombo",
"command",
"consoli",
"conti",
"cost",
"cost.",
"costantino",
"crispino",
"cristiano",
"cristoforo",
"crocetta",
"d",
"d'",
"d)",
"d-",
"d-)",
"d-X",
"d.",
"d.C.",
"d.c.",
"d.d",
"d.x",
"dX",
"d_d",
"d_x",
"dall'",
"dall'art.",
"dall\u2019",
"dall\u2019art.",
"damiano",
"dan",
"daniele",
"dario",
"davide",
"dd",
"ddd",
"de",
"de\"",
"del",
"dell'",
"dell'art.",
"dell\u2019",
"dell\u2019art.",
"demi",
"der",
"desideria",
"desiderio",
"detti",
"di",
"dino",
"dio",
"distr",
"distr.",
"doe",
"dona",
"donata",
"donatella",
"donati",
"donato",
"donini",
"dorotea",
"duca",
"dude",
"durante",
"e",
"e'",
"e-mail",
"e.",
"e/o",
"eat",
"ecc",
"ecc.",
"ece",
"eck",
"eco",
"edi",
"edmonda",
"edo",
"eek",
"el.",
"elario",
"ele",
"elena",
"elia",
"eligio",
"elma",
"elmo",
"elo",
"elpidio",
"email",
"emaill",
"emi",
"emiliano",
"ena",
"end",
"endrizzi",
"eneide",
"enrichetta",
"era",
"erd",
"ere",
"eri",
"ermete",
"erminio",
"ero",
"er\u00e0",
"ese",
"esi",
"esparza",
"esposito",
"est",
"etc",
"etc.",
"ete",
"eto",
"ett",
"eva",
"ezzelin",
"e\u2019",
"f",
"f.",
"fabio",
"fabrizio",
"fanucci",
"fausto",
"favore",
"fazio",
"felice",
"fel\u00eccita",
"feo",
"ferrari",
"ferruccio",
"ffa",
"fiammetta",
"filberto",
"filomena",
"fio",
"fiorella",
"fiorentini",
"fiorentino",
"fiorenza",
"fiorenzo",
"florentina",
"folliero",
"fon",
"fontana",
"fortunata",
"franca",
"franco",
"fulvia",
"fulvio",
"g",
"g.",
"gabriella",
"gallo",
"garcia",
"gelli",
"gemma",
"genera",
"general",
"generale",
"generare",
"gennaro",
"genoveffa",
"genovese",
"genovesi",
"gentilini",
"gerardo",
"gia",
"giacomo",
"gianni",
"ginevra",
"gino",
"gio",
"gioconda",
"giordano",
"giorgina",
"giovanna",
"giovinco",
"girolamo",
"giulia",
"giustina",
"giustino",
"gna",
"gne",
"goffredo",
"golino",
"great",
"greco",
"greece",
"gregario",
"gucci",
"h",
"h.",
"hailey",
"hen",
"i",
"i.",
"iadanza",
"ian",
"iao",
"ica",
"ice",
"ico",
"ide",
"ignazio",
"igo",
"ike",
"il",
"ilaria",
"ill",
"imelda",
"immacolata",
"in",
"ina",
"ine",
"ingegnere",
"ingegner\u00e0",
"ini",
"innocenzo",
"ino",
"insigne",
"invia",
"ioa",
"ise",
"it",
"ita",
"ito",
"iv.",
"j",
"j.",
"jacopo",
"jemma",
"jilani",
"john",
"jolanda",
"jr",
"jr.",
"k",
"k.",
"l",
"l'",
"l'art.",
"l.",
"lalia",
"lan",
"lao",
"lauro",
"lba",
"lda",
"ldo",
"leo",
"leonzio",
"letizia",
"lettiere",
"ley",
"lia",
"lin",
"lio",
"livio",
"ll'",
"lla",
"lli",
"llo",
"ll\u2019",
"lma",
"lmo",
"lo",
"locatello",
"loggia",
"lombardi",
"longo",
"lorenzo",
"loreto",
"lori",
"lothario",
"lso",
"lta",
"luca",
"lucchesi",
"lucciano",
"ludovica",
"ludovico",
"luig",
"luigina",
"lve",
"l\u2019",
"l\u2019art.",
"m",
"m.",
"madeleine",
"mail",
"malvolia",
"mancini",
"manlio",
"manna",
"marcello",
"marco",
"mariella",
"marietta",
"marino",
"marotta",
"marta",
"marzio",
"mazzi",
"mbo",
"melania",
"melchiorre",
"meo",
"mike",
"milano",
"mio",
"mirella",
"mma",
"modesto",
"mona",
"moretti",
"moze",
"n",
"n.",
"n.c",
"nah",
"napolitani",
"natanaele",
"nca",
"nco",
"nda",
"ndo",
"necci",
"nell'",
"nell'art.",
"nell\u2019",
"nell\u2019art.",
"neri",
"ngo",
"nia",
"nicola",
"nicol\u00f2",
"nicomedo",
"nino",
"nio",
"nna",
"nni",
"noelia",
"noemi",
"nord",
"nord-est",
"nsi",
"nso",
"nta",
"nte",
"nti",
"nto",
"ntu",
"nza",
"nzo",
"n\u00b0",
"o",
"o.",
"o.0",
"o.O",
"o.o",
"o_0",
"o_O",
"o_o",
"oc.",
"od.",
"odn",
"of.",
"offredi",
"ohn",
"ol.",
"ola",
"oli",
"olo",
"ol\u00f2",
"omo",
"ona",
"one",
"oni",
"onio",
"opo",
"orabella",
"ord",
"ore",
"ori",
"oro",
"orsina",
"ort",
"oscuro",
"ose",
"ossani",
"ost",
"ota",
"ottaviano",
"ottavio",
"oze",
"p",
"p.",
"p.a",
"paccioretti",
"pag",
"pag.",
"pagnotto",
"palazzo",
"palerma",
"palermo",
"panicucci",
"paolina",
"pass",
"passero",
"path",
"paul",
"per",
"person",
"persona",
"piazza",
"piccio",
"piera",
"piero",
"pietronella",
"pino",
"pinto",
"pirozzi",
"pisano",
"po",
"po'",
"port",
"porte",
"porto",
"po\u2019",
"proc",
"proc.",
"prof",
"prof.",
"prospero",
"q",
"q.",
"r",
"r.",
"r.l",
"ral",
"raniero",
"rco",
"rdi",
"rdo",
"report",
"ria",
"riccardo",
"ricci",
"rinaldo",
"rio",
"riporto",
"rivera",
"rma",
"rmo",
"rno",
"robot",
"roc",
"rof",
"romani",
"romano",
"romhilda",
"rosannah",
"rose",
"rosiello",
"rosina",
"rossi",
"rra",
"rre",
"rt.",
"rta",
"rte",
"rto",
"rtt",
"rua",
"russo",
"rza",
"rzo",
"s",
"s.",
"s.n.c",
"s.p.a",
"s.p.a.",
"s.r.l",
"sabbatini",
"sal",
"salve",
"samuele",
"santa",
"sar",
"scarica",
"scaricare",
"serafina",
"serafino",
"sesto",
"sett",
"sett.",
"sett..",
"settimio",
"severiano",
"shepherd",
"siciliano",
"silvana",
"sinistra",
"sio",
"small",
"son",
"space",
"spours",
"ss",
"ss.",
"ssi",
"sso",
"st",
"st.",
"stefania",
"stephen",
"sto",
"str",
"strinati",
"t",
"t.",
"t..",
"tan",
"tc.",
"tea",
"tel",
"tel.",
"teodosio",
"terenzio",
"terzo",
"the",
"thornton",
"tino",
"to",
"tocci",
"ton",
"tonia",
"toscani",
"tr.",
"tra",
"trentini",
"tro",
"tt.",
"tta",
"tti",
"tto",
"u",
"u.",
"uca",
"ude",
"udinese",
"udinesi",
"uig",
"umberto",
"un",
"una",
"underwoodn",
"uno",
"up",
"uri",
"uro",
"urs",
"utente",
"v",
"v.",
"v.v",
"v_v",
"valeriano",
"van",
"vanna",
"vecellio",
"vecoli",
"venceslao",
"venturi",
"verratti",
"via",
"vicenzo",
"vinicio",
"vio",
"violante",
"violetta",
"virgilio",
"vittoria",
"voleo",
"volta",
"vra",
"vv.",
"w",
"w.",
"week",
"week-end",
"wen",
"x",
"x'",
"x'xxx.",
"x-xxxx",
"x.",
"x.X",
"x.X.",
"x.d",
"x.x",
"x.x.",
"x.x.x",
"x.x.x.",
"x/x",
"xD",
"xDD",
"xX",
"xXX",
"xXXX",
"x_X",
"x_d",
"x_x",
"xd",
"xdd",
"xx",
"xx\"",
"xx'",
"xx-xxxx",
"xx.",
"xxx",
"xxx'",
"xxx'xxx.",
"xxx-xxxx",
"xxx.",
"xxxx",
"xxxx'",
"xxxx'xxx.",
"xxxx-xx",
"xxxx-xxx",
"xxxx-xxxx",
"xxxx.",
"xxxx..",
"xxxx\u2019",
"xxxx\u2019xxx.",
"xxx\u2019",
"xxx\u2019xxx.",
"xx\u2019",
"x\u00b0",
"x\u2019",
"x\u2019xxx.",
"x\ufe35x",
"y",
"y.",
"z",
"z.",
"zetticci",
"zia",
"zio",
"zita",
"zito",
"zza",
"zzi",
"zzo",
"|",
"}",
"\u00a0",
"\u00ac",
"\u00ac_\u00ac",
"\u00af",
"\u00af\\(x)/\u00af",
"\u00af\\(\u30c4)/\u00af",
"\u00b0",
"\u00b0C.",
"\u00b0F.",
"\u00b0K.",
"\u00b0X.",
"\u00b0c.",
"\u00b0f.",
"\u00b0k.",
"\u00b0x.",
"\u00e4",
"\u00e4.",
"\u00f6",
"\u00f6.",
"\u00fc",
"\u00fc.",
"\u0ca0",
"\u0ca0_\u0ca0",
"\u0ca0\ufe35\u0ca0",
"\u2014",
"\u2019",
"\u2019-(",
"\u2019-)",
"\u2019\u2019",
"\u2501",
"\u253b",
"\u253b\u2501\u253b",
"\u256f",
"\u25a1",
"\ufe35",
"\uff09"
]