wenge-research
/

yayi-7b

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

wenge-research commited on Jun 6, 2023

Commit

ae584ce

•

1 Parent(s): 940e2d8

Update README.md

Files changed (1) hide show

README.md +7 -5

README.md CHANGED Viewed

@@ -19,6 +19,7 @@ tags:
 ```python
 from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig
 yayi_7b_path = "wenge-research/yayi-7b"
 tokenizer = AutoTokenizer.from_pretrained(yayi_7b_path)
@@ -26,7 +27,7 @@ model = AutoModelForCausalLM.from_pretrained(yayi_7b_path, device_map="auto", to
 prompt = "你好"
 formatted_prompt = f"<|System|>:\nA chat between a human and an AI assistant named YaYi.\nYaYi is a helpful and harmless language model developed by Beijing Wenge Technology Co.,Ltd.\n\n<|Human|>:\n{prompt}\n\n<|YaYi|>:"
-inputs = tokenizer.encode(prompt, return_tensors="pt").to(model.device)
 generation_config = GenerationConfig(
     do_sample=True,
@@ -36,12 +37,14 @@ generation_config = GenerationConfig(
     no_repeat_ngram_size=0
 )
 response = model.generate(**inputs, generation_config=generation_config)
-print(tokenizer.decode(outputs[0]))
 ```
 注意，模型训练时添加了 special token `<|End|>` 作为结束符，上述代码在生成式若不能自动停止，可定义 `KeywordsStoppingCriteria` 类，并将其对象传参至 `model.generate()` 函数。
 ```python
 class KeywordsStoppingCriteria(StoppingCriteria):
     def __init__(self, keywords_ids:list):
         self.keywords = keywords_ids
@@ -54,11 +57,10 @@ class KeywordsStoppingCriteria(StoppingCriteria):
 ```python
 stop_criteria = KeywordsStoppingCriteria([tokenizer.encode(w)[0] for w in ["<|End|>"]])
-...
-response = model.generate(**inputs, generation_config=generation_config, stop_criteria=stop_criteria)
 ```
 ## 相关协议
 ### 局限性

 ```python
 from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig
+import torch
 yayi_7b_path = "wenge-research/yayi-7b"
 tokenizer = AutoTokenizer.from_pretrained(yayi_7b_path)
 prompt = "你好"
 formatted_prompt = f"<|System|>:\nA chat between a human and an AI assistant named YaYi.\nYaYi is a helpful and harmless language model developed by Beijing Wenge Technology Co.,Ltd.\n\n<|Human|>:\n{prompt}\n\n<|YaYi|>:"
+inputs = tokenizer(formatted_prompt, return_tensors="pt").to(model.device)
 generation_config = GenerationConfig(
     do_sample=True,
     no_repeat_ngram_size=0
 )
 response = model.generate(**inputs, generation_config=generation_config)
+print(tokenizer.decode(response[0]))
 ```
 注意，模型训练时添加了 special token `<|End|>` 作为结束符，上述代码在生成式若不能自动停止，可定义 `KeywordsStoppingCriteria` 类，并将其对象传参至 `model.generate()` 函数。
 ```python
+from transformers import StoppingCriteria, StoppingCriteriaList
 class KeywordsStoppingCriteria(StoppingCriteria):
     def __init__(self, keywords_ids:list):
         self.keywords = keywords_ids
 ```python
 stop_criteria = KeywordsStoppingCriteria([tokenizer.encode(w)[0] for w in ["<|End|>"]])
+response = model.generate(**inputs, generation_config=generation_config, stopping_criteria=StoppingCriteriaList([stop_criteria]))
+print(tokenizer.decode(response[0]))
 ```
 ## 相关协议
 ### 局限性