apepkuss79
commited on
Commit
•
aa11231
1
Parent(s):
6abddf4
Update README.md
Browse files
README.md
CHANGED
@@ -58,7 +58,7 @@ tags:
|
|
58 |
wasmedge --dir .:. --nn-preload default:GGML:AUTO:Phi-3-mini-4k-instruct-Q5_K_M.gguf \
|
59 |
llama-api-server.wasm \
|
60 |
--prompt-template phi-3-chat \
|
61 |
-
--ctx-size
|
62 |
--model-name phi-3-mini
|
63 |
```
|
64 |
|
@@ -68,7 +68,7 @@ tags:
|
|
68 |
wasmedge --dir .:. --nn-preload default:GGML:AUTO:Phi-3-mini-4k-instruct-Q5_K_M.gguf \
|
69 |
llama-chat.wasm \
|
70 |
--prompt-template phi-3-chat \
|
71 |
-
--ctx-size
|
72 |
```
|
73 |
|
74 |
## Quantized GGUF Models
|
|
|
58 |
wasmedge --dir .:. --nn-preload default:GGML:AUTO:Phi-3-mini-4k-instruct-Q5_K_M.gguf \
|
59 |
llama-api-server.wasm \
|
60 |
--prompt-template phi-3-chat \
|
61 |
+
--ctx-size 4000 \
|
62 |
--model-name phi-3-mini
|
63 |
```
|
64 |
|
|
|
68 |
wasmedge --dir .:. --nn-preload default:GGML:AUTO:Phi-3-mini-4k-instruct-Q5_K_M.gguf \
|
69 |
llama-chat.wasm \
|
70 |
--prompt-template phi-3-chat \
|
71 |
+
--ctx-size 4000 \
|
72 |
```
|
73 |
|
74 |
## Quantized GGUF Models
|