usp-trg / tokenizer.json
michelleyunun's picture
Upload tokenizer
28bf6c0
{
"version": "1.0",
"truncation": null,
"padding": null,
"added_tokens": [
{
"id": 0,
"content": "<start>",
"single_word": false,
"lstrip": false,
"rstrip": false,
"normalized": false,
"special": true
},
{
"id": 1,
"content": "<end>",
"single_word": false,
"lstrip": false,
"rstrip": false,
"normalized": false,
"special": true
},
{
"id": 2,
"content": "<pad>",
"single_word": false,
"lstrip": false,
"rstrip": false,
"normalized": false,
"special": true
}
],
"normalizer": null,
"pre_tokenizer": {
"type": "ByteLevel",
"add_prefix_space": false,
"trim_offsets": true,
"use_regex": true
},
"post_processor": {
"type": "ByteLevel",
"add_prefix_space": true,
"trim_offsets": false,
"use_regex": true
},
"decoder": {
"type": "ByteLevel",
"add_prefix_space": true,
"trim_offsets": true,
"use_regex": true
},
"model": {
"type": "BPE",
"dropout": null,
"unk_token": null,
"continuing_subword_prefix": null,
"end_of_word_suffix": null,
"fuse_unk": false,
"byte_fallback": false,
"vocab": {
"<start>": 0,
"<end>": 1,
"<pad>": 2,
"!": 3,
"(": 4,
")": 5,
"-": 6,
".": 7,
"/": 8,
"1": 9,
"2": 10,
"3": 11,
"<": 12,
">": 13,
"?": 14,
"@": 15,
"A": 16,
"B": 17,
"C": 18,
"D": 19,
"E": 20,
"F": 21,
"G": 22,
"H": 23,
"I": 24,
"J": 25,
"L": 26,
"M": 27,
"N": 28,
"O": 29,
"P": 30,
"Q": 31,
"R": 32,
"S": 33,
"T": 34,
"U": 35,
"V": 36,
"X": 37,
"Y": 38,
"a": 39,
"b": 40,
"c": 41,
"d": 42,
"e": 43,
"f": 44,
"g": 45,
"h": 46,
"i": 47,
"j": 48,
"k": 49,
"l": 50,
"m": 51,
"n": 52,
"o": 53,
"p": 54,
"q": 55,
"r": 56,
"s": 57,
"t": 58,
"u": 59,
"v": 60,
"w": 61,
"x": 62,
"y": 63,
"z": 64,
"¡": 65,
"©": 66,
"±": 67,
"³": 68,
"º": 69,
"¼": 70,
"Â": 71,
"Ã": 72,
"Ġ": 73,
"Ń": 74,
"ar": 75,
"en": 76,
"st": 77,
"star": 78,
"end": 79,
"Ġ<": 80,
"start": 81,
"ĠP": 82,
"ĠE": 83,
"er": 84,
"AR": 85,
"ART": 86,
"ĠI": 87,
"RE": 88,
"ĠD": 89,
"ĠIN": 90,
"ĠC": 91,
"ĠCO": 92,
"ĠINC": 93,
"ĠPART": 94,
"??": 95,
"ĠCOM": 96,
"EM": 97,
"ir": 98,
"ĠDEM": 99,
"no": 100,
"SRE": 101,
"SREL": 102,
"Ġp": 103,
"Ġc": 104,
"REP": 105,
"ĠPREP": 106,
"ĠPL": 107,
"Ġa": 108,
"ll": 109,
"ue": 110,
"or": 111,
"de": 112,
"NF": 113,
"ac": 114,
"ENF": 115,
"re": 116,
"EG": 117,
"NEG": 118,
"ĠDI": 119,
"???": 120,
"do": 121,
"Ġm": 122,
"ent": 123,
"ĠNEG": 124,
"Ġu": 125,
"om": 126,
"acer": 127,
"an": 128,
"SC": 129,
"que": 130,
"os": 131,
"ĠART": 132,
"hacer": 133,
"es": 134,
"ĠDIM": 135,
"al": 136,
"on": 137,
"Ġuno": 138,
"Ġ???": 139,
"ĠCON": 140,
"Ġs": 141,
"Ġt": 142,
"Ġy": 143,
"ĠCONJ": 144,
"lla": 145,
"XS": 146,
"ĠA": 147,
"tr": 148,
"Ġno": 149,
"dec": 150,
"ĠEXS": 151,
"decir": 152,
"ab": 153,
"Ġd": 154,
"ñ": 155,
"á": 156,
"Ġb": 157,
"ella": 158,
"dar": 159,
"é": 160,
"PL": 161,
"Ġque": 162,
"pa": 163,
"DI": 164,
"Ġper": 165,
"ic": 166,
"am": 167,
"gar": 168,
"él": 169,
"ÃŃ": 170,
"Ġl": 171,
"Ġél": 172,
"gu": 173,
"ora": 174,
"Ġcom": 175,
"bre": 176,
"Ġh": 177,
"Ġv": 178,
"so": 179,
"rar": 180,
"PART": 181,
"jo": 182,
"DIR": 183,
"ces": 184,
"as": 185,
"tros": 186,
"ĠINT": 187,
"sotros": 188,
"Ġent": 189,
"Ġyo": 190,
"Ġcu": 191,
"hora": 192,
"odo": 193,
"Ġya": 194,
"Ġahora": 195,
"ci": 196,
"ĠSREL": 197,
"ra": 198,
"enir": 199,
"Ġn": 200,
"co": 201,
"ente": 202,
"Ġenton": 203,
"Ġentonces": 204,
"Ġnosotros": 205,
"AS": 206,
"Ġmu": 207,
"AP": 208,
"-???": 209,
"in": 210,
"ro": 211,
"ad": 212,
"jer": 213,
"tar": 214,
"em": 215,
"qu": 216,
"ed": 217,
"PAS": 218,
"com": 219,
"ver": 220,
"Ġdo": 221,
"te": 222,
"venir": 223,
"ĠAF": 224,
"lle": 225,
"Ġmujer": 226,
"Ġpero": 227,
"ĠDIR": 228,
"eno": 229,
"TS": 230,
"ol": 231,
"ti": 232,
"Ġbu": 233,
"ĠITS": 234,
"ay": 235,
"Ġpo": 236,
"ño": 237,
"Ġir": 238,
"Ġe": 239,
"Ġde": 240,
"ice": 241,
"Ġan": 242,
"llegar": 243,
"Ġcomo": 244,
"ÃŃa": 245,
"aba": 246,
"ta": 247,
"Ġbueno": 248,
"Ġg": 249,
"Ġall": 250,
"bir": 251,
"Ġpor": 252,
"Ġsi": 253,
"Ġcuan": 254,
"ombre": 255,
"Ġf": 256,
"reci": 257,
"to": 258,
"Ġun": 259,
"Ġhombre": 260,
"im": 261,
"Ġpue": 262,
"po": 263,
"ter": 264,
"ran": 265,
"se": 266,
"recibir": 267,
"Ġdice": 268,
"le": 269,
"Ġpues": 270,
"ero": 271,
"Ġcuando": 272,
"Ġse": 273,
"io": 274,
"ier": 275,
"la": 276,
"ch": 277,
"ba": 278,
"Ġtodo": 279,
"der": 280,
"ĠallÃŃ": 281,
"aya": 282,
"Ġdecir": 283,
"ĠAFI": 284,
"ado": 285,
"ó": 286,
"ej": 287,
"comer": 288,
"amente": 289,
"pá": 290,
"car": 291,
"rande": 292,
"ez": 293,
"alir": 294,
"AB": 295,
"SAB": 296,
"Ġbaya": 297,
"Ġlo": 298,
"tigu": 299,
"ú": 300,
"ĠdÃŃa": 301,
"tiguamente": 302,
"Ġo": 303,
"abajo": 304,
"Ġantiguamente": 305,
"eter": 306,
"uer": 307,
"ust": 308,
"usted": 309,
"Ġes": 310,
"Ġni": 311,
"ma": 312,
"lo": 313,
"entrar": 314,
"quedar": 315,
"MO": 316,
"MOV": 317,
"Ġtú": 318,
"Ġniño": 319,
"ás": 320,
"ona": 321,
"meter": 322,
"asa": 323,
"go": 324,
"Ġen": 325,
"Ġgrande": 326,
"sona": 327,
"sp": 328,
"salir": 329,
"Ġpersona": 330,
"jar": 331,
"ijo": 332,
"dre": 333,
"sar": 334,
"padre": 335,
"Ġmodo": 336,
"emb": 337,
"AM": 338,
"TAM": 339,
"cer": 340,
"ón": 341,
"lor": 342,
"PP": 343,
"ĠTAM": 344,
"Ġmás": 345,
"yo": 346,
"mi": 347,
"papá": 348,
"ios": 349,
"Ġpobre": 350,
"con": 351,
"ugar": 352,
"Ġdolor": 353,
"Ġporque": 354,
"qui": 355,
"id": 356,
"Ġtr": 357,
"DEM": 358,
"antar": 359,
"quer": 360,
"ĠAFE": 361,
"bi": 362,
"ia": 363,
"querer": 364,
"ada": 365,
"aca": 366,
"Ġcos": 367,
"ña": 368,
"Ġsol": 369,
"man": 370,
"ñor": 371,
"GT": 372,
"un": 373,
"Ġhacer": 374,
"Ġdesp": 375,
"Ġcompadre": 376,
"cono": 377,
"SV": 378,
"amá": 379,
"Ġcosas": 380,
"is": 381,
"ento": 382,
"gua": 383,
"Ġdos": 384,
"Ġr": 385,
"Ġaqui": 386,
"Ġnada": 387,
"Ġpoco": 388,
"Ġal": 389,
"bajar": 390,
"era": 391,
"Ġeso": 392,
"Ġloque": 393,
"DIM": 394,
"Ġsolo": 395,
"embrar": 396,
"pe": 397,
"mbre": 398,
"IN": 399,
"bol": 400,
"ico": 401,
"ejor": 402,
"vantar": 403,
"ĠDios": 404,
"Ġpa": 405,
"Ġco": 406,
"Ġmejor": 407,
"tic": 408,
"Ġi": 409,
"ár": 410,
"empo": 411,
"anto": 412,
"árbol": 413,
"trar": 414,
"poder": 415,
"Ġtrabajo": 416,
"imal": 417,
"Ġseñor": 418,
"llo": 419,
"Ġvaca": 420,
"Ġcab": 421,
"Ġmon": 422,
"cimi": 423,
"Ġpi": 424,
"Ġcasa": 425,
"TR": 426,
"Ġest": 427,
"Ġpal": 428,
"Ġárbol": 429,
"Ġti": 430,
"scar": 431,
"llos": 432,
"ellas": 433,
"Ġellos": 434,
"ca": 435,
"cimiento": 436,
"Ġsanto": 437,
"mo": 438,
"contrar": 439,
"tilla": 440,
"irar": 441,
"Ġlugar": 442,
"Ġtiempo": 443,
"mamá": 444,
"encontrar": 445,
"Ġanimal": 446,
"ITR": 447,
"edra": 448,
"bu": 449,
"trabajo": 450,
"latic": 451,
"ĠENF": 452,
"án": 453,
"Ġvenir": 454,
"eza": 455,
"cu": 456,
"levantar": 457,
"ambi": 458,
"res": 459,
"abue": 460,
"cor": 461,
"MP": 462,
"Ġpiedra": 463,
"tor": 464,
"nombre": 465,
"sembrar": 466,
"acio": 467,
"manera": 468,
"laticar": 469,
"aber": 470,
"conocimiento": 471,
"esp": 472,
"Ġj": 473,
"ĠCOND": 474,
"eces": 475,
"hijo": 476,
"idad": 477,
"aci": 478,
"var": 479,
"abra": 480,
"Ġdon": 481,
"il": 482,
"pi": 483,
"rep": 484,
"Ġtres": 485,
"aballo": 486,
"ĠPR": 487,
"lar": 488,
"cho": 489,
"platicar": 490,
"ĠAGT": 491,
"ino": 492,
"garrar": 493,
"Ġagua": 494,
"repente": 495,
"Ġcon": 496,
"Ġrico": 497,
"dÃŃa": 498,
"ĠIMP": 499,
"zo": 500,
"inar": 501,
"-???-": 502,
"tra": 503,
"Ġmonta": 504,
"buscar": 505,
"orir": 506,
"uev": 507,
"ñar": 508,
"les": 509,
"inero": 510,
"Ġcabal": 511,
"espos": 512,
"Ġmontaña": 513,
"ist": 514,
"enta": 515,
"rer": 516,
"Ġcaballo": 517,
"Ġpr": 518,
"dice": 519,
"gles": 520,
"adre": 521,
"glesia": 522,
"Ġtier": 523,
"prar": 524,
"par": 525,
"ĠPRG": 526,
"uerte": 527,
"Ġallá": 528,
"ja": 529,
"Ġdespacio": 530,
"INC": 531,
"bo": 532,
"iv": 533,
"Ġtierra": 534,
"Ġdón": 535,
"tortilla": 536,
"Ġdónde": 537,
"Ġperder": 538,
"Ġdonde": 539,
"Ġch": 540,
"alma": 541,
"Ġel": 542,
"Ġle": 543,
"Ġver": 544,
"modo": 545,
"cre": 546,
"casa": 547,
"Ġfr": 548,
"Ġfin": 549,
"acar": 550,
"ablar": 551,
"ropa": 552,
"che": 553,
"Ġpalabra": 554,
"vez": 555,
"Ġpe": 556,
"imero": 557,
"char": 558,
"fer": 559,
"Ġpu": 560,
"Ġfinado": 561,
"ara": 562,
"Ġcer": 563,
"pasar": 564,
"per": 565,
"est": 566,
"morir": 567,
"minar": 568,
"Ġprimero": 569,
"Ġma": 570,
"Ġaño": 571,
"agarrar": 572,
"si": 573,
"Ġre": 574,
"¡": 575,
"sacar": 576,
"Ġva": 577,
"nosotros": 578,
"Ġmal": 579,
"Ġba": 580,
"esposa": 581,
"Ġnoche": 582,
"Ġiglesia": 583,
"ué": 584,
"Ġdespué": 585,
"ecesidad": 586,
"Ġdespués": 587,
"Ġcier": 588,
"Ġmucho": 589,
"Ġlej": 590,
"Ġlejos": 591,
"Ġrecibir": 592,
"Ġcuán": 593,
"Ġcuándo": 594,
"AGT": 595,
"LAS": 596,
"ce": 597,
"una": 598,
"gual": 599,
"hay": 600,
"Ġhora": 601,
"Ġpapá": 602,
"za": 603,
"Ġca": 604,
"mar": 605,
"señar": 606,
"traer": 607,
"ga": 608,
"Ġmis": 609,
"ita": 610,
"mano": 611,
"ĠCLAS": 612,
"zar": 613,
"Ġcar": 614,
"lan": 615,
"ana": 616,
"Ġcierto": 617,
"Ġdar": 618,
"echar": 619,
"gente": 620,
"quier": 621,
"Ġcam": 622,
"ru": 623,
"enseñar": 624,
"Ġcomer": 625,
"ejo": 626,
"rir": 627,
"Ġ¡": 628,
"terminar": 629,
"Ġcerro": 630,
"Ġnecesidad": 631,
"uera": 632,
"Ġpadre": 633,
"abuelo": 634,
"Ġigual": 635,
"hablar": 636,
"Ġdi": 637,
"PREP": 638,
"ensar": 639,
"da": 640,
"ien": 641,
"Ġll": 642,
"ija": 643,
"comprar": 644,
"estar": 645,
"Ġpuro": 646,
"pañ": 647,
"én": 648,
"emp": 649,
"Ġfuerte": 650,
"Ġsegu": 651,
"Ġesta": 652,
"bra": 653,
"sent": 654,
"Ġtambi": 655,
"INS": 656,
"tirar": 657,
"ierba": 658,
"ambiar": 659,
"bien": 660,
"ación": 661,
"Ġcuev": 662,
"llevar": 663,
"Ġcueva": 664,
"edio": 665,
"ena": 666,
"ños": 667,
"nos": 668,
"Ġmil": 669,
"mu": 670,
"Ġcuanto": 671,
"gunos": 672,
"Ġalgunos": 673,
"pañero": 674,
"tes": 675,
"ĠS": 676,
"Ġtambién": 677,
"ĠM": 678,
"ble": 679,
"blo": 680,
"Ġmilpa": 681,
"Ġropa": 682,
"abuela": 683,
"Ġcor": 684,
"ivo": 685,
"Ġaños": 686,
"Ġcost": 687,
"Ġgal": 688,
"crecer": 689,
"uel": 690,
"ijol": 691,
"cam": 692,
"Ġsaber": 693,
"ongo": 694,
"Ġhongo": 695,
"it": 696,
"Ġdinero": 697,
"Ġla": 698,
"Ġven": 699,
"idar": 700,
"compadre": 701,
"óma": 702,
"ómago": 703,
"iar": 704,
"embra": 705,
"sa": 706,
"Ġdios": 707,
"Ġsalir": 708,
"ible": 709,
"eso": 710,
"conocer": 711,
"ri": 712,
"entro": 713,
"br": 714,
"Ġad": 715,
"orar": 716,
"año": 717,
"Ġcorrer": 718,
"enzar": 719,
"ender": 720,
"Ġder": 721,
"Ġcule": 722,
"Ġculebra": 723,
"Ġar": 724,
"EXS": 725,
"av": 726,
"Ġqu": 727,
"asar": 728,
"Ġmalo": 729,
"mon": 730,
"of": 731,
"ile": 732,
"Ġllegar": 733,
"Ġentrar": 734,
"Ġjugar": 735,
"orm": 736,
"je": 737,
"Ġay": 738,
"sentir": 739,
"fr": 740,
"dinero": 741,
"icio": 742,
"Ġfrijol": 743,
"pue": 744,
"Ġpos": 745,
"Ġquedar": 746,
"guantar": 747,
"Ġfav": 748,
"Ġfavor": 749,
"Ġvivo": 750,
"Ġalgo": 751,
"acias": 752,
"Ġpuer": 753,
"Ġdaño": 754,
"cocer": 755,
"Ġseñorita": 756,
"isteza": 757,
"cab": 758,
"tal": 759,
"Ġpalo": 760,
"Ġmisa": 761,
"ni": 762,
"Ġpuerta": 763,
"di": 764,
"Ġtal": 765,
"Ġnuera": 766,
"ina": 767,
"Ġsiembra": 768,
"ĠSan": 769,
"ace": 770,
"entar": 771,
"tro": 772,
"ici": 773,
"cabeza": 774,
"reg": 775,
"oso": 776,
"Ġcamino": 777,
"Ġderrepente": 778,
"Ġpara": 779,
"Ġmamá": 780,
"Ġcompañero": 781,
"Ġcostal": 782,
"cambiar": 783,
"her": 784,
"Ġbien": 785,
"inco": 786,
"el": 787,
"Ġgalán": 788,
"ura": 789,
"segu": 790,
"acate": 791,
"Ġpapa": 792,
"cal": 793,
"dea": 794,
"Ġlim": 795,
"cio": 796,
"estómago": 797,
"nar": 798,
"ON": 799,
"Ġhierba": 800,
"uv": 801,
"ven": 802,
"Ġpro": 803,
"ueg": 804,
"Ġsacate": 805,
"Ġpoder": 806,
"mujer": 807,
"Ġadentro": 808,
"Ġposible": 809,
"itación": 810,
"ndo": 811,
"Ġmedio": 812,
"pr": 813,
"señor": 814,
"carga": 815,
"yote": 816,
"Ġasi": 817,
"alar": 818,
"uerza": 819,
"ida": 820,
"Ġlad": 821,
"brero": 822,
"GN": 823,
"ĠGN": 824,
"ĠGNT": 825,
"pal": 826,
"saber": 827,
"Ġsembrar": 828,
"Ġhechar": 829,
"aguantar": 830,
"ñora": 831,
"Ġseñora": 832,
"Ġgu": 833,
"Ġmijo": 834,
"hija": 835,
"ubir": 836,
"incar": 837,
"Ġladino": 838,
"abrir": 839,
"Ġbuscar": 840,
"eja": 841,
"contar": 842,
"cordar": 843,
"oficio": 844,
"ormir": 845,
"Ġcan": 846,
"ante": 847,
"Ġseis": 848,
"lavar": 849,
"Ġvenado": 850,
"bar": 851,
"alquier": 852,
"Ġcualquier": 853,
"smo": 854,
"ve": 855,
"ombrero": 856,
"mismo": 857,
"ig": 858,
"Ġgr": 859,
"Ġcinco": 860,
"sta": 861,
"uego": 862,
"Ġdifer": 863,
"Ġlluv": 864,
"Ġlluvia": 865,
"AF": 866,
"eto": 867,
"sem": 868,
"Ġtor": 869,
"Ġbar": 870,
"Ġcoyote": 871,
"pita": 872,
"Ġleña": 873,
"cado": 874,
"lpa": 875,
"Ġantes": 876,
"imba": 877,
"stru": 878,
"Ġsa": 879,
"Ġtra": 880,
"poco": 881,
"Ġenfr": 882,
"Ġenfrente": 883,
"joven": 884,
"Ġolla": 885,
"las": 886,
"Ġotros": 887,
"illa": 888,
"tate": 889,
"Ġju": 890,
"pueblo": 891,
"hechar": 892,
"sombrero": 893,
"enar": 894,
"anar": 895,
"Ġenfer": 896,
"Ġbo": 897,
"Ġlos": 898,
"Ġcuenta": 899,
"cara": 900,
"Ġjoven": 901,
"ire": 902,
"ayu": 903,
"sear": 904,
"ear": 905,
"hu": 906,
"uela": 907,
"Ġmar": 908,
"correr": 909,
"Ġbaile": 910,
"Ġlimitación": 911,
"Ġdiferente": 912,
"AU": 913,
"CAU": 914,
"dormir": 915,
"nacer": 916,
"tam": 917,
"queño": 918,
"ÃŃr": 919,
"comenzar": 920,
"sea": 921,
"pensar": 922,
"recordar": 923,
"amon": 924,
"Ġcomprar": 925,
"Ġman": 926,
"Ġmes": 927,
"entos": 928,
"oma": 929,
"lanco": 930,
"usar": 931,
"mana": 932,
"hermana": 933,
"Ġaun": 934,
"oler": 935,
"Ġseguro": 936,
"Ġaunque": 937,
"ton": 938,
"ñana": 939,
"Ġlom": 940,
"Ġmañana": 941,
"Ġmano": 942,
"lanici": 943,
"uegro": 944,
"tz": 945,
"Ġmismo": 946,
"tzal": 947,
"Ġzo": 948,
"Ġsara": 949,
"guate": 950,
"pepita": 951,
"perder": 952,
"Ġsaraguate": 953,
"venta": 954,
"Ġqui": 955,
"Ġmi": 956,
"Ġmeter": 957,
"Ġdu": 958,
"Ġve": 959,
"untar": 960,
"ismo": 961,
"Ġpensar": 962,
"Ġapar": 963,
"Ġhaber": 964,
"Ġtodos": 965,
"atro": 966,
"oÃŃr": 967,
"Ġap": 968,
"ueño": 969,
"Ġestar": 970,
"Ġlevantar": 971,
"Ġverde": 972,
"Ġcarn": 973,
"Ġrande": 974,
"Ġaire": 975,
"resar": 976,
"Ġcuatro": 977,
"bajo": 978,
"Ġmonte": 979,
"uelta": 980,
"veja": 981,
"Ġblanco": 982,
"Ġvi": 983,
"Ġquin": 984,
"grar": 985,
"subir": 986,
"des": 987,
"Ġbr": 988,
"Ġquetzal": 989,
"Ġale": 990,
"Ġher": 991,
"regresar": 992,
"mentos": 993,
"Ġtan": 994,
"ÃŃo": 995,
"instru": 996,
"Ġfuego": 997,
"cutar": 998,
"Ġdiez": 999,
"seguir": 1000,
"Ġsapo": 1001,
"instrumentos": 1002,
"can": 1003,
"gado": 1004,
"ojo": 1005,
"Ġab": 1006,
"Ġagarrar": 1007,
"Ġcuar": 1008,
"oria": 1009,
"dela": 1010,
"alta": 1011,
"ascal": 1012,
"emascal": 1013,
"Ġtortilla": 1014,
"Ġlomismo": 1015,
"ED": 1016,
"MED": 1017,
"vir": 1018,
"ste": 1019,
"Ġsu": 1020,
"edad": 1021,
"Ġbajar": 1022,
"Ġgracias": 1023,
"fes": 1024,
"desp": 1025,
"Ġsem": 1026,
"cortar": 1027,
"Ġprofes": 1028,
"palabra": 1029,
"Ġprofesor": 1030,
"reta": 1031,
"Ġ???-???": 1032,
"solo": 1033,
"bolla": 1034,
"ĠPP": 1035,
"istoria": 1036,
"ayudar": 1037,
"--": 1038,
"agua": 1039,
"xtam": 1040,
"pagar": 1041,
"Ġpueblo": 1042,
"uerzo": 1043,
"Ġcabeza": 1044,
"Ġviejo": 1045,
"mirar": 1046,
"sal": 1047,
"sid": 1048,
"ĠIsid": 1049,
"Ġcal": 1050,
"lote": 1051,
"ĠIsidro": 1052,
"iento": 1053,
"Ġmo": 1054,
"oni": 1055,
"tristeza": 1056,
"speto": 1057,
"ioma": 1058,
"ser": 1059,
"tas": 1060,
"Ġra": 1061,
"Ġasta": 1062,
"ach": 1063,
"donar": 1064,
"Ġhistoria": 1065,
"asura": 1066,
"idioma": 1067,
"cuidar": 1068,
"preci": 1069,
"Ġunos": 1070,
"Ġsentar": 1071,
"abajar": 1072,
"ranco": 1073,
"Ġpequeño": 1074,
"monio": 1075,
"AFE": 1076,
"xtamal": 1077,
"precio": 1078,
"jalar": 1079,
"Ġplanici": 1080,
"Ġ???-": 1081,
"mandar": 1082,
"creer": 1083,
"Ġreg": 1084,
"fuerza": 1085,
"medad": 1086,
"ped": 1087,
"ral": 1088,
"Ġpar": 1089,
"llorar": 1090,
"Ġzope": 1091,
"brar": 1092,
"bio": 1093,
"cuela": 1094,
"juntar": 1095,
"suerte": 1096,
"veces": 1097,
"desear": 1098,
"Ġsuegro": 1099,
"gun": 1100,
"Ġvuelta": 1101,
"Ġdoce": 1102,
"iviar": 1103
},
"merges": [
"a r",
"e n",
"s t",
"st ar",
"en d",
"Ġ <",
"star t",
"Ġ P",
"Ġ E",
"e r",
"A R",
"AR T",
"Ġ I",
"R E",
"Ġ D",
"ĠI N",
"Ġ C",
"ĠC O",
"ĠIN C",
"ĠP ART",
"? ?",
"ĠCO M",
"E M",
"i r",
"ĠD EM",
"n o",
"S RE",
"SRE L",
"Ġ p",
"Ġ c",
"RE P",
"ĠP REP",
"ĠP L",
"Ġ a",
"l l",
"u e",
"o r",
"d e",
"N F",
"a c",
"E NF",
"r e",
"E G",
"N EG",
"ĠD I",
"?? ?",
"d o",
"Ġ m",
"en t",
"Ġ NEG",
"Ġ u",
"o m",
"ac er",
"a n",
"S C",
"q ue",
"o s",
"Ġ ART",
"h acer",
"e s",
"ĠDI M",
"a l",
"o n",
"Ġu no",
"Ġ ???",
"ĠCO N",
"Ġ s",
"Ġ t",
"Ġ y",
"ĠCON J",
"ll a",
"X S",
"Ġ A",
"t r",
"Ġ no",
"de c",
"ĠE XS",
"dec ir",
"a b",
"Ġ d",
"Ã ±",
"Ã ¡",
"Ġ b",
"e lla",
"d ar",
"Ã ©",
"P L",
"Ġ que",
"p a",
"D I",
"Ġp er",
"i c",
"a m",
"g ar",
"é l",
"Ã Ń",
"Ġ l",
"Ġ él",
"g u",
"or a",
"Ġc om",
"b re",
"Ġ h",
"Ġ v",
"s o",
"r ar",
"P ART",
"j o",
"DI R",
"c es",
"a s",
"tr os",
"ĠIN T",
"so tros",
"Ġ ent",
"Ġy o",
"Ġc u",
"h ora",
"o do",
"Ġy a",
"Ġa hora",
"c i",
"Ġ SREL",
"r a",
"en ir",
"Ġ n",
"c o",
"ent e",
"Ġent on",
"Ġenton ces",
"Ġno sotros",
"A S",
"Ġm u",
"A P",
"- ???",
"i n",
"r o",
"a d",
"j er",
"t ar",
"e m",
"q u",
"e d",
"P AS",
"c om",
"v er",
"Ġ do",
"t e",
"v enir",
"ĠA F",
"ll e",
"Ġmu jer",
"Ġper o",
"ĠDI R",
"en o",
"T S",
"o l",
"t i",
"Ġb u",
"ĠI TS",
"a y",
"Ġp o",
"ñ o",
"Ġ ir",
"Ġ e",
"Ġ de",
"ic e",
"Ġa n",
"lle gar",
"Ġcom o",
"ÃŃ a",
"ab a",
"t a",
"Ġbu eno",
"Ġ g",
"Ġa ll",
"b ir",
"Ġp or",
"Ġs i",
"Ġcu an",
"om bre",
"Ġ f",
"re ci",
"t o",
"Ġu n",
"Ġh ombre",
"i m",
"Ġp ue",
"p o",
"t er",
"r an",
"s e",
"reci bir",
"Ġd ice",
"l e",
"Ġpue s",
"er o",
"Ġcuan do",
"Ġs e",
"i o",
"i er",
"l a",
"c h",
"b a",
"Ġt odo",
"d er",
"Ġall ÃŃ",
"ay a",
"Ġ decir",
"ĠAF I",
"a do",
"Ã ³",
"e j",
"com er",
"am ente",
"p á",
"c ar",
"ran de",
"e z",
"al ir",
"A B",
"S AB",
"Ġb aya",
"Ġl o",
"ti gu",
"Ã º",
"Ġd ÃŃa",
"tigu amente",
"Ġ o",
"aba jo",
"Ġan tiguamente",
"e ter",
"u er",
"u st",
"ust ed",
"Ġ es",
"Ġn i",
"m a",
"l o",
"ent rar",
"que dar",
"M O",
"MO V",
"Ġt ú",
"Ġni ño",
"á s",
"on a",
"m eter",
"as a",
"g o",
"Ġ en",
"Ġg rande",
"s ona",
"s p",
"s alir",
"Ġper sona",
"j ar",
"i jo",
"d re",
"s ar",
"pa dre",
"Ġm odo",
"em b",
"A M",
"T AM",
"c er",
"ó n",
"l or",
"P P",
"Ġ TAM",
"Ġm ás",
"y o",
"m i",
"pa pá",
"i os",
"Ġpo bre",
"c on",
"u gar",
"Ġdo lor",
"Ġpor que",
"qu i",
"i d",
"Ġt r",
"D EM",
"an tar",
"qu er",
"ĠAF E",
"b i",
"i a",
"quer er",
"ad a",
"ac a",
"Ġc os",
"ñ a",
"Ġs ol",
"m an",
"ñ or",
"G T",
"u n",
"Ġ hacer",
"Ġde sp",
"Ġcom padre",
"co no",
"S V",
"am á",
"Ġcos as",
"i s",
"ent o",
"gu a",
"Ġdo s",
"Ġ r",
"Ġa qui",
"Ġn ada",
"Ġpo co",
"Ġa l",
"ba jar",
"er a",
"Ġes o",
"Ġlo que",
"DI M",
"Ġsol o",
"emb rar",
"p e",
"m bre",
"I N",
"b ol",
"ic o",
"ej or",
"v antar",
"ĠD ios",
"Ġp a",
"Ġc o",
"Ġm ejor",
"t ic",
"Ġ i",
"á r",
"em po",
"an to",
"ár bol",
"tr ar",
"po der",
"Ġtr abajo",
"im al",
"Ġse ñor",
"ll o",
"Ġv aca",
"Ġc ab",
"Ġm on",
"ci mi",
"Ġp i",
"Ġc asa",
"T R",
"Ġe st",
"Ġp al",
"Ġ árbol",
"Ġt i",
"s car",
"ll os",
"ella s",
"Ġe llos",
"c a",
"cimi ento",
"Ġs anto",
"m o",
"con trar",
"ti lla",
"ir ar",
"Ġl ugar",
"Ġti empo",
"m amá",
"en contrar",
"Ġan imal",
"I TR",
"ed ra",
"b u",
"tr abajo",
"la tic",
"ĠE NF",
"á n",
"Ġv enir",
"ez a",
"c u",
"le vantar",
"am bi",
"re s",
"ab ue",
"c or",
"M P",
"Ġpi edra",
"t or",
"no mbre",
"s embrar",
"ac io",
"man era",
"latic ar",
"ab er",
"cono cimiento",
"es p",
"Ġ j",
"ĠCON D",
"e ces",
"h ijo",
"id ad",
"ac i",
"v ar",
"ab ra",
"Ġdo n",
"i l",
"p i",
"re p",
"Ġt res",
"aba llo",
"ĠP R",
"l ar",
"ch o",
"p laticar",
"ĠA GT",
"i no",
"gar rar",
"Ġa gua",
"rep ente",
"Ġc on",
"Ġr ico",
"d ÃŃa",
"ĠI MP",
"z o",
"in ar",
"-??? -",
"tr a",
"Ġmon ta",
"bu scar",
"or ir",
"ue v",
"ñ ar",
"l es",
"in ero",
"Ġcab al",
"esp os",
"Ġmonta ña",
"i st",
"ent a",
"r er",
"Ġc aballo",
"Ġp r",
"d ice",
"g les",
"ad re",
"gles ia",
"Ġt ier",
"p rar",
"p ar",
"ĠPR G",
"uer te",
"Ġall á",
"j a",
"Ġdesp acio",
"IN C",
"b o",
"i v",
"Ġtier ra",
"Ġd ón",
"tor tilla",
"Ġdón de",
"Ġper der",
"Ġdon de",
"Ġc h",
"al ma",
"Ġe l",
"Ġl e",
"Ġv er",
"m odo",
"c re",
"c asa",
"Ġf r",
"Ġf in",
"ac ar",
"ab lar",
"ro pa",
"ch e",
"Ġpal abra",
"v ez",
"Ġp e",
"im ero",
"ch ar",
"f er",
"Ġp u",
"Ġfin ado",
"ar a",
"Ġc er",
"pa sar",
"p er",
"e st",
"m orir",
"m inar",
"Ġpr imero",
"Ġm a",
"Ġa ño",
"a garrar",
"s i",
"Ġ re",
"Â ¡",
"s acar",
"Ġv a",
"no sotros",
"Ġm al",
"Ġb a",
"espos a",
"Ġno che",
"Ġi glesia",
"u é",
"Ġdesp ué",
"eces idad",
"Ġdespué s",
"Ġc ier",
"Ġmu cho",
"Ġl ej",
"Ġlej os",
"Ġ recibir",
"Ġcu án",
"Ġcuán do",
"A GT",
"L AS",
"c e",
"un a",
"gu al",
"h ay",
"Ġh ora",
"Ġpa pá",
"z a",
"Ġc a",
"m ar",
"se ñar",
"tra er",
"g a",
"Ġm is",
"i ta",
"ma no",
"ĠC LAS",
"z ar",
"Ġc ar",
"l an",
"an a",
"Ġcier to",
"Ġd ar",
"e char",
"g ente",
"qu ier",
"Ġc am",
"r u",
"en señar",
"Ġcom er",
"e jo",
"r ir",
"Ġ ¡",
"ter minar",
"Ġcer ro",
"Ġn ecesidad",
"uer a",
"Ġp adre",
"abue lo",
"Ġi gual",
"h ablar",
"Ġd i",
"P REP",
"en sar",
"d a",
"i en",
"Ġ ll",
"i ja",
"com prar",
"e star",
"Ġpu ro",
"pa ñ",
"é n",
"em p",
"Ġf uerte",
"Ġse gu",
"Ġest a",
"b ra",
"s ent",
"Ġt ambi",
"IN S",
"t irar",
"ier ba",
"ambi ar",
"bi en",
"aci ón",
"Ġc uev",
"lle var",
"Ġcuev a",
"ed io",
"en a",
"ñ os",
"no s",
"Ġm il",
"m u",
"Ġcuan to",
"gu nos",
"Ġal gunos",
"pañ ero",
"t es",
"Ġ S",
"Ġtambi én",
"Ġ M",
"b le",
"b lo",
"Ġmil pa",
"Ġ ropa",
"abue la",
"Ġc or",
"iv o",
"Ġa ños",
"Ġco st",
"Ġg al",
"cre cer",
"ue l",
"ijo l",
"c am",
"Ġs aber",
"on go",
"Ġh ongo",
"i t",
"Ġd inero",
"Ġl a",
"Ġv en",
"i dar",
"com padre",
"ó ma",
"óma go",
"i ar",
"emb ra",
"s a",
"Ġd ios",
"Ġs alir",
"i ble",
"es o",
"cono cer",
"r i",
"ent ro",
"b r",
"Ġa d",
"or ar",
"a ño",
"Ġcor rer",
"en zar",
"end er",
"Ġd er",
"Ġcu le",
"Ġcule bra",
"Ġ ar",
"E XS",
"a v",
"Ġ qu",
"as ar",
"Ġmal o",
"m on",
"o f",
"i le",
"Ġ llegar",
"Ġent rar",
"Ġj ugar",
"or m",
"j e",
"Ġa y",
"sent ir",
"f r",
"d inero",
"ic io",
"Ġfr ijol",
"p ue",
"Ġp os",
"Ġque dar",
"gu antar",
"Ġf av",
"Ġfav or",
"Ġv ivo",
"Ġal go",
"aci as",
"Ġp uer",
"Ġd año",
"co cer",
"Ġseñor ita",
"ist eza",
"c ab",
"t al",
"Ġpal o",
"Ġmis a",
"n i",
"Ġpuer ta",
"d i",
"Ġt al",
"Ġn uera",
"in a",
"Ġsi embra",
"ĠS an",
"ac e",
"ent ar",
"tr o",
"ic i",
"cab eza",
"re g",
"os o",
"Ġcam ino",
"Ġder repente",
"Ġp ara",
"Ġm amá",
"Ġcom pañero",
"Ġcost al",
"c ambiar",
"h er",
"Ġb ien",
"in co",
"e l",
"Ġgal án",
"u ra",
"se gu",
"aca te",
"Ġpa pa",
"c al",
"de a",
"Ġl im",
"ci o",
"est ómago",
"n ar",
"O N",
"Ġh ierba",
"u v",
"v en",
"Ġp ro",
"ue g",
"Ġs acate",
"Ġpo der",
"mu jer",
"Ġad entro",
"Ġpos ible",
"it ación",
"n do",
"Ġm edio",
"p r",
"se ñor",
"car ga",
"yo te",
"Ġa si",
"al ar",
"uer za",
"id a",
"Ġl ad",
"br ero",
"G N",
"Ġ GN",
"ĠGN T",
"p al",
"s aber",
"Ġs embrar",
"Ġh echar",
"a guantar",
"ñ ora",
"Ġse ñora",
"Ġ gu",
"Ġm ijo",
"h ija",
"u bir",
"in car",
"Ġlad ino",
"ab rir",
"Ġbu scar",
"ej a",
"con tar",
"cor dar",
"of icio",
"orm ir",
"Ġc an",
"an te",
"Ġse is",
"la var",
"Ġven ado",
"b ar",
"al quier",
"Ġcu alquier",
"s mo",
"v e",
"om brero",
"mi smo",
"i g",
"Ġg r",
"Ġc inco",
"st a",
"ue go",
"Ġdi fer",
"Ġll uv",
"Ġlluv ia",
"A F",
"e to",
"s em",
"Ġt or",
"Ġb ar",
"Ġco yote",
"pi ta",
"Ġle ña",
"c ado",
"l pa",
"Ġan tes",
"im ba",
"st ru",
"Ġs a",
"Ġt ra",
"po co",
"Ġen fr",
"Ġenfr ente",
"jo ven",
"Ġo lla",
"l as",
"Ġo tros",
"i lla",
"ta te",
"Ġj u",
"pue blo",
"h echar",
"s ombrero",
"en ar",
"an ar",
"Ġen fer",
"Ġb o",
"Ġl os",
"Ġcu enta",
"car a",
"Ġ joven",
"ir e",
"ay u",
"se ar",
"e ar",
"h u",
"ue la",
"Ġm ar",
"cor rer",
"Ġba ile",
"Ġlim itación",
"Ġdifer ente",
"A U",
"C AU",
"d ormir",
"n acer",
"t am",
"que ño",
"ÃŃ r",
"com enzar",
"se a",
"p ensar",
"re cordar",
"am on",
"Ġcom prar",
"Ġm an",
"Ġm es",
"ent os",
"om a",
"lan co",
"u sar",
"man a",
"her mana",
"Ġa un",
"ol er",
"Ġsegu ro",
"Ġaun que",
"t on",
"ñ ana",
"Ġl om",
"Ġma ñana",
"Ġma no",
"lan ici",
"ueg ro",
"t z",
"Ġmis mo",
"tz al",
"Ġ zo",
"Ġs ara",
"gua te",
"pe pita",
"per der",
"Ġsara guate",
"v enta",
"Ġ qui",
"Ġm i",
"Ġm eter",
"Ġd u",
"Ġv e",
"un tar",
"is mo",
"Ġp ensar",
"Ġa par",
"Ġh aber",
"Ġtodo s",
"a tro",
"o ÃŃr",
"Ġa p",
"ue ño",
"Ġe star",
"Ġle vantar",
"Ġver de",
"Ġcar n",
"Ġ rande",
"Ġa ire",
"re sar",
"Ġcu atro",
"ba jo",
"Ġmon te",
"uel ta",
"v eja",
"Ġb lanco",
"Ġv i",
"Ġqu in",
"g rar",
"s ubir",
"de s",
"Ġb r",
"Ġque tzal",
"Ġa le",
"Ġh er",
"reg resar",
"m entos",
"Ġt an",
"ÃŃ o",
"in stru",
"Ġf uego",
"cu tar",
"Ġdi ez",
"segu ir",
"Ġsa po",
"instru mentos",
"c an",
"g ado",
"o jo",
"Ġa b",
"Ġa garrar",
"Ġcu ar",
"or ia",
"de la",
"al ta",
"as cal",
"em ascal",
"Ġtor tilla",
"Ġlom ismo",
"E D",
"M ED",
"v ir",
"st e",
"Ġs u",
"ed ad",
"Ġba jar",
"Ġgr acias",
"f es",
"de sp",
"Ġs em",
"cor tar",
"Ġpro fes",
"pal abra",
"Ġprofes or",
"re ta",
"Ġ??? -???",
"so lo",
"bo lla",
"ĠP P",
"ist oria",
"ayu dar",
"- -",
"a gua",
"x tam",
"pa gar",
"Ġpue blo",
"uer zo",
"Ġcab eza",
"Ġvi ejo",
"m irar",
"s al",
"s id",
"ĠI sid",
"Ġc al",
"lo te",
"ĠIsid ro",
"i ento",
"Ġm o",
"on i",
"tr isteza",
"sp eto",
"i oma",
"s er",
"t as",
"Ġ ra",
"Ġa sta",
"ac h",
"do nar",
"Ġh istoria",
"as ura",
"id ioma",
"cu idar",
"p reci",
"Ġuno s",
"Ġs entar",
"aba jar",
"ran co",
"Ġpe queño",
"mon io",
"AF E",
"xtam al",
"preci o",
"j alar",
"Ġp lanici",
"Ġ??? -",
"man dar",
"cre er",
"Ġre g",
"f uerza",
"m edad",
"p ed",
"r al",
"Ġp ar",
"ll orar",
"Ġzo pe",
"b rar",
"b io",
"c uela",
"j untar",
"s uerte",
"v eces",
"de sear",
"Ġs uegro",
"gu n",
"Ġv uelta",
"Ġdo ce",
"iv iar"
]
}
}