kromeurus
/

L3.1-Siithamo-v0.4-8B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

kromeurus commited on Aug 20

Commit

ce9cc0f

•

1 Parent(s): 325e6e0

Update README.md

Files changed (1) hide show

README.md +83 -4

README.md CHANGED Viewed

@@ -3,11 +3,11 @@ base_model:
 - ArliAI/ArliAI-Llama-3-8B-Formax-v1.0
 - gradientai/Llama-3-8B-Instruct-Gradient-1048k
 - ArliAI/Llama-3.1-8B-ArliAI-Formax-v1.0
-- Sao10K/L3-8B-Niitama-v1
 - Sao10K/L3-8B-Stheno-v3.3-32K
 - tohur/natsumura-storytelling-rp-1.0-llama-3.1-8b
 - Sao10K/L3-8B-Tamamo-v1
-- vicgalle/Roleplay-Hermes-3-Llama-3.1-8B
 library_name: transformers
 tags:
 - mergekit
@@ -39,6 +39,85 @@ Smooth Sampl: 0.18
 ### Merge Theory
-This sucked
-### Config

 - ArliAI/ArliAI-Llama-3-8B-Formax-v1.0
 - gradientai/Llama-3-8B-Instruct-Gradient-1048k
 - ArliAI/Llama-3.1-8B-ArliAI-Formax-v1.0
+- Sao10K/L3.1-8B-Niitama-v1.1
 - Sao10K/L3-8B-Stheno-v3.3-32K
 - tohur/natsumura-storytelling-rp-1.0-llama-3.1-8b
 - Sao10K/L3-8B-Tamamo-v1
+- Edgerunners/Lyraea-large-llama-3.1
 library_name: transformers
 tags:
 - mergekit
 ### Merge Theory
+This sucked. Repalce RP Hermes back with Edgerunners Lyraea and swapped Niitama with L3.1 Niitama.
+### Config
+```yaml
+slices:
+- sources:
+  - layer_range: [0, 16]
+    model: ArliAI/ArliAI-Llama-3-8B-Formax-v1.0
+- sources:
+  - layer_range: [16, 32]
+    model: gradientai/Llama-3-8B-Instruct-Gradient-1048k
+parameters:
+  int8_mask: true
+merge_method: passthrough
+dtype: float32
+out_dtype: bfloat16
+name: formax.ext
+---
+models:
+  - model: formax.ext
+    parameters:
+      weight: 1.1
+base_model: ArliAI/Llama-3.1-8B-ArliAI-Formax-v1.0
+parameters:
+  normalize: false
+  int8_mask: true
+merge_method: dare_linear
+dtype: float32
+out_dtype: bfloat16
+tokenizer_source: base
+name: formaxext.3.1
+---
+models:
+  - model: Sao10K/L3-8B-Niitama-v1
+    parameters:
+      weight: 0.5
+  - model: Sao10K/L3-8B-Stheno-v3.3-32K
+    parameters:
+      weight: 0.6
+base_model: tohur/natsumura-storytelling-rp-1.0-llama-3.1-8b
+parameters:
+  normalize: false
+  int8_mask: true
+merge_method: dare_linear
+dtype: float32
+out_dtype: bfloat16
+tokenizer_source: base
+name: siith.3.1
+---
+models:
+    - model: siith.3.1
+    - model: Sao10K/L3-8B-Tamamo-v1
+base_model: Edgerunners/Lyraea-large-llama-3.1
+parameters:
+  normalize: false
+  int8_mask: true
+merge_method: model_stock
+dtype: float32
+out_dtype: bfloat16
+name: siithamol3.1
+---
+models:
+  - model: siithamol3.1
+    parameters:
+      weight: [0.5, 0,8, 0.8, 0.9, 1]
+      density: 0.9
+      gamma: 0.01
+  - model: formaxext.3.1
+    parameters:
+      weight: [0.5, 0.2, 0.2, 0.1, 0]
+      density: 0.9
+      gamma: 0.01
+base_model: siithamol3.1
+parameters:
+  normalize: false
+  int8_mask: true
+merge_method: breadcrumbs_ties
+dtype: float32
+out_dtype: bfloat16
+name: siithamov3
+```