neuralmagic
/

Meta-Llama-3-70B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3-70B-Instruct-quantized.w8a8

Commit History

Updated compression_config to quantization_config

e52ae34
verified

mgoin commited on 28 days ago

Update README.md

9547f54
verified

alexmarques commited on Jul 18

Update README.md

7081ae4
verified

alexmarques commited on Jul 18

Create README.md

f978f64
verified

alexmarques commited on Jul 18

Upload folder using huggingface_hub

c85d356
verified

alexmarques commited on Jul 14

initial commit

3633bf7
verified

alexmarques commited on Jul 14