neuralmagic
/

Qwen2-72B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Qwen2-72B-Instruct-quantized.w8a8

Commit History

Updated compression_config to quantization_config

058453c
verified

mgoin commited on 28 days ago

Update README.md

82d7ef8
verified

alexmarques commited on Jul 18

Create README.md

41bb75f
verified

alexmarques commited on Jul 18

Upload folder using huggingface_hub

171139d
verified

alexmarques commited on Jul 15

initial commit

ae83852
verified

alexmarques commited on Jul 15