THUDM
/

chatglm2-6b

Inference Endpoints

Model card Files Files and versions Community

Sengxian commited on Jun 25, 2023

Commit

ad75f89

•

1 Parent(s): c3b3141

Update config

Files changed (2) hide show

config.json +0 -2
configuration_chatglm.py +0 -3

config.json CHANGED Viewed

@@ -19,7 +19,6 @@
   "fp32_residual_connection": false,
   "hidden_dropout": 0.0,
   "hidden_size": 4096,
-  "interleaved_qkv": false,
   "kv_channels": 128,
   "layernorm_epsilon": 1e-05,
   "multi_query_attention": true,
@@ -30,7 +29,6 @@
   "padded_vocab_size": 65024,
   "post_layer_norm": true,
   "rmsnorm": true,
-  "rotary_percent": 0.5,
   "seq_length": 32768,
   "use_cache": true,
   "torch_dtype": "float16",

   "fp32_residual_connection": false,
   "hidden_dropout": 0.0,
   "hidden_size": 4096,
   "kv_channels": 128,
   "layernorm_epsilon": 1e-05,
   "multi_query_attention": true,
   "padded_vocab_size": 65024,
   "post_layer_norm": true,
   "rmsnorm": true,
   "seq_length": 32768,
   "use_cache": true,
   "torch_dtype": "float16",

configuration_chatglm.py CHANGED Viewed

@@ -21,7 +21,6 @@ class ChatGLMConfig(PretrainedConfig):
         add_qkv_bias=False,
         interleaved_qkv=False,
         bias_dropout_fusion=True,
-        rotary_percent=1.0,
         multi_query_attention=False,
         multi_query_group_num=1,
         apply_query_key_layer_scaling=True,
@@ -45,9 +44,7 @@ class ChatGLMConfig(PretrainedConfig):
         self.post_layer_norm = post_layer_norm
         self.add_bias_linear = add_bias_linear
         self.add_qkv_bias = add_qkv_bias
-        self.interleaved_qkv = interleaved_qkv
         self.bias_dropout_fusion = bias_dropout_fusion
-        self.rotary_percent = rotary_percent
         self.multi_query_attention = multi_query_attention
         self.multi_query_group_num = multi_query_group_num
         self.apply_query_key_layer_scaling = apply_query_key_layer_scaling

         add_qkv_bias=False,
         interleaved_qkv=False,
         bias_dropout_fusion=True,
         multi_query_attention=False,
         multi_query_group_num=1,
         apply_query_key_layer_scaling=True,
         self.post_layer_norm = post_layer_norm
         self.add_bias_linear = add_bias_linear
         self.add_qkv_bias = add_qkv_bias
         self.bias_dropout_fusion = bias_dropout_fusion
         self.multi_query_attention = multi_query_attention
         self.multi_query_group_num = multi_query_group_num
         self.apply_query_key_layer_scaling = apply_query_key_layer_scaling