Aoyinke
/

qwen2-merged

Text Generation

Mixture of Experts

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen2-merged / mergekit_moe_config.yml

Aoyinke's picture

Upload folder using huggingface_hub

bb4b4e1 verified 5 months ago

history blame contribute delete

303 Bytes


	base_model: Qwen/Qwen2-7B
	gate_mode: random
	architecture: qwen
	dtype: bfloat16
	experts:
	- source_model: Qwen/Qwen2-7B
	positive_prompts: []

	- source_model: Qwen/Qwen2-7B
	positive_prompts: []

	shared_experts:
	- source_model: Qwen/Qwen2-7B
	positive_prompts: []
	residual_scale: 0.1