nm-testing
/

tinyllama-one-shot-w4a16-channel-packed

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

tinyllama-one-shot-w4a16-channel-packed

2 contributors

History: 6 commits

mgoin's picture

Added quant_method to quantization_config

d3402c2 verified 28 days ago