Edit model card

language: en

rawpowertools/MH_2500T_L_Qwen2_500M_gguf Model Data

Base_Model: unsloth/Qwen2-0.5B

Training_Data: mh_2500_train

Eval_Input: mh_small_test

Merged_Model: rawpowertools/MH_2500T_L_Qwen2_500M

Epochs: 5

Rank: 32

Alpha: 32

LR: 0.0005

LR_Scheduler: linear

GGUF

Model size

494M params

Architecture

qwen2

4-bit

8-bit

16-bit

Inference API

Unable to determine this model's library. Check the docs .