为什么这个模型的vacub.json文件里没有中文?疑惑
#1
by
GordonTaoHuang
- opened
为什么这个模型的vacub.json文件里没有中文?疑惑
GPT模型用的BPE编码
gpt是byte level的bpe,词表里虽然没有中文的,但是经过encode后再经过decode,还是可以恢复中文的,这就是b-bpe的神奇之处~~~~
Zimix
changed discussion status to
closed