jan-hq
/

trinity-v1

@@ -30,22 +30,31 @@ The yaml config file for this model is here:
 slices:
   - sources:
       - model: viethq188/LeoScorpius-7B-Chat-DPO
-        layer_range: [0, 32]
       - model: GreenNode/GreenNodeLM-7B-v1olet
         layer_range: [0, 32]
 merge_method: slerp
 base_model: GreenNode/GreenNodeLM-7B-v1olet
 parameters:
   t:
     - filter: self_attn
-      value: [0, 0.5, 0.3, 0.7, 1]
     - filter: mlp
-      value: [1, 0.5, 0.7, 0.3, 0]
-    - value: 0.5
 dtype: bfloat16
 ```
 # Prompt template
 - **ChatML**
@@ -93,7 +102,8 @@ Detailed results can be found here.
 | GSM8K (5-shot)        | ?        |
 # Acknowlegement
-- [mergekit](https://github.com/cg123/mergekit)
 - [DARE](https://github.com/yule-BUAA/MergeLM/blob/main/README.md)
 -
  [SLERP](https://github.com/Digitous/LLM-SLERP-Merge)

 slices:
   - sources:
       - model: viethq188/LeoScorpius-7B-Chat-DPO
+        layer_range: [0, 32]
       - model: GreenNode/GreenNodeLM-7B-v1olet
         layer_range: [0, 32]
 merge_method: slerp
 base_model: GreenNode/GreenNodeLM-7B-v1olet
 parameters:
   t:
+    - filter: lm_head
+      value: [0.55]
+    - filter: embed_tokens
+      value: [0.7]
     - filter: self_attn
+      value: [0.65, 0.35]
     - filter: mlp
+      value:  [0.35, 0.65]
+    - filter: layernorm
+      value: [0.4, 0.6]
+    - filter: modelnorm
+      value: [0.6]
+    - value: 0.5 # fallback for rest of tensors
 dtype: bfloat16
 ```
+Thank you [Undi95](https://huggingface.co/Undi95) for the secret sauce and (Charles Goddard)[https://huggingface.co/chargoddard] for mergekit.
 # Prompt template
 - **ChatML**
 | GSM8K (5-shot)        | ?        |
 # Acknowlegement
+- [mergekit](https://github.com/cg123/mergekit
+)
 - [DARE](https://github.com/yule-BUAA/MergeLM/blob/main/README.md)
 -
  [SLERP](https://github.com/Digitous/LLM-SLERP-Merge)