TheBloke
/

Spicyboros-c34b-2.2-GPTQ

Text Generation

Not-For-All-Audiences

text-generation-inference

4-bit precision

Model card Files Files and versions Community

TheBloke commited on Sep 14, 2023

Commit

43543bb

•

1 Parent(s): 911c970

GPTQ model commit

Files changed (1) hide show

config.json +2 -2

config.json CHANGED Viewed

@@ -9,11 +9,12 @@
     "hidden_size": 8192,
     "initializer_range": 0.02,
     "intermediate_size": 22016,
-    "max_position_embeddings": 16384,
     "model_type": "llama",
     "num_attention_heads": 64,
     "num_hidden_layers": 48,
     "num_key_value_heads": 8,
     "rms_norm_eps": 1e-05,
     "rope_scaling": null,
     "rope_theta": 1000000,
@@ -22,7 +23,6 @@
     "transformers_version": "4.33.1",
     "use_cache": true,
     "vocab_size": 32000,
-    "pretraining_tp": 1,
     "pad_token_id": 0,
     "quantization_config": {
         "bits": 4,

     "hidden_size": 8192,
     "initializer_range": 0.02,
     "intermediate_size": 22016,
+    "max_position_embeddings": 4096,
     "model_type": "llama",
     "num_attention_heads": 64,
     "num_hidden_layers": 48,
     "num_key_value_heads": 8,
+    "pretraining_tp": 1,
     "rms_norm_eps": 1e-05,
     "rope_scaling": null,
     "rope_theta": 1000000,
     "transformers_version": "4.33.1",
     "use_cache": true,
     "vocab_size": 32000,
     "pad_token_id": 0,
     "quantization_config": {
         "bits": 4,