Edit Models filters

Inference status

Misc

8-bit precision

Misc with no match

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

4

Full-text search

Active filters: llmcompressor

neuralmagic/Llama-3.2-1B-Instruct-quantized.w8a8

Text Generation • Updated 30 days ago • 2.03k • 3

neuralmagic/Llama-3.2-3B-Instruct-FP8

Text Generation • Updated 30 days ago • 10.7k • 2

neuralmagic/Llama-3.2-3B-Instruct-quantized.w8a8

Text Generation • Updated 30 days ago • 1.75k • 1

neuralmagic/Llama-3.2-1B-Instruct-FP8

Text Generation • Updated 30 days ago • 259k • 1