THUDM
/

chatglm-6b

@@ -1417,7 +1417,7 @@ class ChatGLMForConditionalGeneration(ChatGLMPreTrainedModel):
                 break
             yield input_ids
-    def quantize(self, bits: int, empty_init=False, **kwargs):
         if bits == 0:
             return
@@ -1431,5 +1431,5 @@ class ChatGLMForConditionalGeneration(ChatGLMPreTrainedModel):
         self.config.quantization_bit = bits
-        self.transformer = quantize(self.transformer, bits, empty_init=empty_init, **kwargs)
         return self

                 break
             yield input_ids
+    def quantize(self, bits: int, empty_init=False, **kwargs):  # 量化
         if bits == 0:
             return
         self.config.quantization_bit = bits
+        self.transformer = quantize(self.transformer, bits, empty_init=empty_init, **kwargs)
         return self