HachiML/japanese-stablelm-alpha-7b-instruct-ja-qlora-8ep-v6

JGLUE Score

I evaluated this model using the following JGLUE tasks. Here are the scores:

Task	stablelm-base-alpha-7b	qlora-ja-2ep(*)	This Model(8ep)	stablelm-instruct-alpha-7b
JCOMMONSENSEQA(acc)	33.42	79.17	73.36	82.22
JNLI(acc)	43.34	47.82	39.44	52.05
MARC_JA(acc)	96.73	88.14	80.38	82.88
JSQUAD(exact_match)	70.62	29.85	19.33	63.26
Average	61.03	61.25	53.13	70.10

Note: Use v0.3 prompt template
The JGLUE scores were measured using the following script: Stability-AI/lm-evaluation-harness
The JGLUE scores of Model "stablelm-base-alpha-7b" and "stablelm-instruct-alpha-7b" were referenced from Github above.
(*) HachiML/japanese-stablelm-alpha-7b-instruct-ja-qlora-2ep-v2

Response example

以下は、ある作業を記述した指示です。依頼を適切に完了させる回答を書きなさい。
### Instruction:
発明家はどっち？エジソンとアインシュタイン
### Response:

電球の発明で知られるトーマス・エジソンと、アインシュタイン。<|endoftext|>

以下は、タスクを説明する命令と、さらなるコンテキストを提供する入力の組み合わせです。要求を適切に満たすような応答を書きなさい。
### Instruction: アリスは通常どのように学校に通っていますか？
### Input: アリスは毎日学校に自転車で通っています。しかし、今日は雨が降っているので、バスで学校にいくことにしました。
### Response:

アリスは毎日学校へ自転車で通っています。しかし、今日はあいにくの雨。彼女は仕方なくバスで学校へ行くことにした。<|endoftext|>

以下は、タスクを説明する命令と、さらなるコンテキストを提供する入力の組み合わせです。要求を適切に満たすような応答を書きなさい。
### Instruction: 太郎は何をする予定ですか？
### Input: 太郎は今日、友人の二郎と映画を見にいく予定です。彼らは午後3時に映画館で待ち合わせをしています。
### Response:

太郎は今日、友人の二郎と映画を見にいく予定です。彼らは午後3 時に映画館で待ち合わせをしています。<|endoftext|>

以下は、タスクを説明する命令と、さらなるコンテキストを提供する入力の組み合わせです。要求を適切に満たすような応答を書きなさい。
### Instruction: ロボットが人間の労働を置き換えるとどんな問題が生じる可能性があるか？
### Input: ロボットが人間の労働を置き換えることで、人々はより多くの時間を創造的な活動や趣味に費やすことができます。しかし、これは新たな社会的、経済的問題を引き起こす可能性もあります。
### Response:

新たな社会的・経済的問題
労働者が仕事を失う可能性がある
技術の進歩に伴う仕事の変化
熟練した職人の不足による雇用の減少
新たな市場機会
コスト削減のための自動化
ロボットが人間の仕事を完全に置き換えるには10 年かかると言われていますが、このスピードアップが続けば、もっと早くなる可能性があります。<|endoftext|>

Training procedure

The following bitsandbytes quantization config was used during training:

load_in_8bit: False
load_in_4bit: True
llm_int8_threshold: 6.0
llm_int8_skip_modules: None
llm_int8_enable_fp32_cpu_offload: False
llm_int8_has_fp16_weight: False
bnb_4bit_quant_type: nf4
bnb_4bit_use_double_quant: False
bnb_4bit_compute_dtype: float16

Framework versions

PEFT 0.4.0

HachiML
/

japanese-stablelm-alpha-7b-instruct-ja-qlora-8ep-v6

JGLUE Score

Response example

Training procedure

Framework versions

Dataset used to train HachiML/japanese-stablelm-alpha-7b-instruct-ja-qlora-8ep-v6