neuralmagic
/

starcoder2-15b-quantized.w8a16

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

starcoder2-15b-quantized.w8a16

File size: 174 Bytes

7ad49b1

quant_stage:
  quant_modifiers:
    GPTQModifier:
      sequential_update: false
      dampening_frac: 0.01
      ignore: [lm_head]
      scheme: W8A16
      targets: Linear