nejumi
/

c4ai-command-r-08-2024-GPTQ-Int8-calib-ja-1k

8-bit precision

Model card Files Files and versions Community

Edit model card

YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

c4ai-command-r-08-2024 GPTQ量子化モデル

モデル概要

モデル名: nejumi/c4ai-command-r-08-2024-GPTQ-Int8-calib-ja-1k および nejumi/c4ai-command-r-08-2024-GPTQ-Int4-calib-ja-1k
ベースモデル: CohereForAI/c4ai-command-r-08-2024
モデルサイズ: 32,296,476,672 パラメータ
カテゴリ: 30B≤

量子化の詳細

Calibration データ: nejumi/wikipedia-ja-20230720-4k の先頭1024行
量子化パラメータ:
- group_size: 128
- perc_damp: 0.0
- desc_act: True
- use_exllama: False
- model_seqlen: 2048

性能評価（総合）

Nejumi LLMリーダーボード3による評価結果

指標	Int8	Int4	ベースモデル
汎用的言語性能(GLP)平均	0.6020	0.6072	0.6125
アラインメント(ALT)平均	0.6924	0.6893	0.6943
総合平均	0.6472	0.6482	0.6534

青: Original 緑: GPTQ 4bit 赤: GPTQ 8bit

詳細評価（詳細）

汎用的言語性能(GLP)

サブカテゴリ	Int8	Int4	ベースモデル
表現	0.8517	0.8450	0.8450
翻訳	0.8450	0.8440	0.8465
情報検索	0.8070	0.8062	0.8179
推論	0.4500	0.4800	0.4850
数学的推論	0.3900	0.4017	0.4033
抽出	0.2501	0.2560	0.2671
知識・質問応答	0.6416	0.6431	0.6549
英語	0.6842	0.6807	0.6877
意味解析	0.6420	0.6540	0.6430
構文解析	0.4585	0.4613	0.4744

アラインメント(ALT)

サブカテゴリ	Int8	Int4	ベースモデル
制御性	0.8530	0.8503	0.8539
倫理・道徳	0.8900	0.9200	0.8800
毒性	0.6454	0.6481	0.6588
バイアス	0.7700	0.7700	0.7600
堅牢性	0.4566	0.4283	0.4736
真実性	0.5395	0.5189	0.5395

ベンチマークごとのスコア

ベンチマーク	Int8	Int4	ベースモデル
JASTER (0-shot)	0.5314	0.5217	0.5367
JASTER (2-shot)	0.6126	0.6269	0.6224
MT-Bench	6.6625	6.6750	6.7813
LCTG	0.7720	0.7640	0.7720

注意事項

この量子化モデルは、オリジナルのCohereForAI/c4ai-command-r-08-2024モデルをGPTQ手法を用いて圧縮したものです。
Int8とInt4の2つのバリエーションがあり、それぞれ異なる精度と効率のトレードオフを提供します。
性能指標は、オリジナルモデルと比較してわずかな違いがありますが、多くの指標で大きな性能低下を伴わない結果を示しています。
量子化プロセスには、日本語Wikipediaデータの一部が使用されており、日本語タスクに最適化されている可能性があります。

使用上の注意

このモデルは2048トークンのコンテキスト長で訓練されていると想定されます。より長いコンテキストでの使用は、性能に影響を与える可能性があります。
量子化により、モデルのサイズが大幅に削減されていますが、一部のタスクでわずかな精度の低下が見られる場合があります。
Int8版とInt4版で異なる特性を持つ可能性があるため、用途に応じて適切なバージョンを選択してください。
特定のタスク（例：堅牢性）では、量子化モデルがベースモデルと比較して若干の性能低下を示していますので、これらのタスクに重点を置く場合は注意が必要です。

ライセンス

このモデルは、ベースモデルのライセンスを継承しています。詳細については、原モデルのライセンスを参照してください。

Downloads last month: 4

Safetensors

Model size

12B params

Tensor type

I32

·

BF16

·

Inference API

Unable to determine this model's library. Check the docs .