neuralmagic
/

Meta-Llama-3.1-8B-quantized.w8a8

Text Generation

8-bit precision

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-8B-quantized.w8a8

Commit History

Update README.md

f2a9838
verified

alexmarques commited on Aug 21

Update README.md

043563b
verified

alexmarques commited on Aug 21

Update README.md

82e54a3
verified

alexmarques commited on Aug 21

Update README.md

be254c0
verified

alexmarques commited on Aug 13

Create README.md

1eed01c
verified

alexmarques commited on Jul 31

Upload folder using huggingface_hub

faa056e
verified

alexmarques commited on Jul 31

initial commit

8604987
verified

alexmarques commited on Jul 31