LeroyDyer
/

Mixtral_Base

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LeroyDyer commited on Mar 15

Commit

05b0321

•

1 Parent(s): de42a88

Update README.md

Files changed (1) hide show

README.md +25 -0

README.md CHANGED Viewed

@@ -46,4 +46,29 @@ models:
 merge_method: linear
 dtype: float16
 ```

 merge_method: linear
 dtype: float16
+```
+```Python
+!pip install -qU transformers
+import transformers
+import torch
+from transformers import AutoTokenizer, MixtralForCausalLM
+device = "cuda" # the device to load the model onto
+model = "{{ username }}/{{ model_name }}"
+imodel = MixtralForCausalLM.from_pretrained(model)
+tokenizer = AutoTokenizer.from_pretrained(model)
+inputs = tokenizer(prompt, return_tensors="pt")
+# Generate
+generate_ids = imodel.generate(inputs.input_ids, max_length=30)
+tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
 ```