EricB
/

Llama-3.2-3B-Instruct-UQFF

Model card Files Files and versions Community

EricB HF staff commited on 22 days ago

Commit

833b2e9

•

1 Parent(s): cc06d4d

Create README.md

Files changed (1) hide show

README.md +30 -0

README.md ADDED Viewed

	@@ -0,0 +1,30 @@

+---
+tags:
+  - uqff
+  - mistral.rs
+base_model: meta-llama/Llama-3.2-3B-Instruct
+base_model_relation: quantized
+---
+<!-- Autogenerated from user input. -->
+# `meta-llama/Llama-3.2-3B-Instruct`, UQFF quantization
+Run with [mistral.rs](https://github.com/EricLBuehler/mistral.rs). Documentation: [UQFF docs](https://github.com/EricLBuehler/mistral.rs/blob/master/docs/UQFF.md).
+1) **Flexible** 🌀: Multiple quantization formats in *one* file format with *one* framework to run them all.
+2) **Reliable** 🔒: Compatibility ensured with *embedded* and *checked* semantic versioning information from day 1.
+3) **Easy** 🤗: Download UQFF models *easily* and *quickly* from Hugging Face, or use a local file.
+3) **Customizable** 🛠️: Make and publish your own UQFF files in minutes.
+## Files
+|Quantization type(s)|Example|
+|--|--|
+|FP8|`./mistralrs-server -i plain -m EricB/Llama-3.2-3B-Instruct-UQFF --from-uqff llama3.2-3b-instruct-f8e4m3.uqff`|
+|HQQ4|`./mistralrs-server -i plain -m EricB/Llama-3.2-3B-Instruct-UQFF --from-uqff llama3.2-3b-instruct-hqq4.uqff`|
+|HQQ8|`./mistralrs-server -i plain -m EricB/Llama-3.2-3B-Instruct-UQFF --from-uqff llama3.2-3b-instruct-hqq8.uqff`|
+|Q3K|`./mistralrs-server -i plain -m EricB/Llama-3.2-3B-Instruct-UQFF --from-uqff llama3.2-3b-instruct-q3k.uqff`|
+|Q4K|`./mistralrs-server -i plain -m EricB/Llama-3.2-3B-Instruct-UQFF --from-uqff llama3.2-3b-instruct-q4k.uqff`|
+|Q5K|`./mistralrs-server -i plain -m EricB/Llama-3.2-3B-Instruct-UQFF --from-uqff llama3.2-3b-instruct-q5k.uqff`|
+|Q8_0|`./mistralrs-server -i plain -m EricB/Llama-3.2-3B-Instruct-UQFF --from-uqff llama3.2-3b-instruct-q8_0.uqff`|