nm-testing
/

Meta-Llama-3-8B-Instruct-fp8-compressed

File size: 124 Bytes

735c7ea

quant_stage:
  quant_modifiers:
    QuantizationModifier:
      ignore: [lm_head]
      targets: [Linear]
      scheme: FP8