royallab
/

LimaRP-ShareGPT-13b-qloras

PEFT

Not-For-All-Audiences

Model card Files Files and versions Community

kingbri commited on Sep 11, 2023

Commit

b32633c

•

1 Parent(s): c2f1218

Add prompt-a onechar

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

prompt-a/onechar/README.md +21 -0
prompt-a/onechar/adapter_config.json +26 -0
prompt-a/onechar/adapter_model.bin +3 -0
prompt-a/onechar/added_tokens.json +3 -0
prompt-a/onechar/checkpoint-100/README.md +21 -0
prompt-a/onechar/checkpoint-100/adapter_config.json +26 -0
prompt-a/onechar/checkpoint-100/adapter_model.bin +3 -0
prompt-a/onechar/checkpoint-100/adapter_model/README.md +21 -0
prompt-a/onechar/checkpoint-100/adapter_model/adapter_config.json +26 -0
prompt-a/onechar/checkpoint-100/adapter_model/adapter_model.bin +3 -0
prompt-a/onechar/checkpoint-100/optimizer.pt +3 -0
prompt-a/onechar/checkpoint-100/rng_state_0.pth +3 -0
prompt-a/onechar/checkpoint-100/rng_state_1.pth +3 -0
prompt-a/onechar/checkpoint-100/rng_state_2.pth +3 -0
prompt-a/onechar/checkpoint-100/rng_state_3.pth +3 -0
prompt-a/onechar/checkpoint-100/rng_state_4.pth +3 -0
prompt-a/onechar/checkpoint-100/rng_state_5.pth +3 -0
prompt-a/onechar/checkpoint-100/rng_state_6.pth +3 -0
prompt-a/onechar/checkpoint-100/rng_state_7.pth +3 -0
prompt-a/onechar/checkpoint-100/scheduler.pt +3 -0
prompt-a/onechar/checkpoint-100/trainer_state.json +659 -0
prompt-a/onechar/checkpoint-100/training_args.bin +3 -0
prompt-a/onechar/checkpoint-150/README.md +21 -0
prompt-a/onechar/checkpoint-150/adapter_config.json +26 -0
prompt-a/onechar/checkpoint-150/adapter_model.bin +3 -0
prompt-a/onechar/checkpoint-150/adapter_model/README.md +21 -0
prompt-a/onechar/checkpoint-150/adapter_model/adapter_config.json +26 -0
prompt-a/onechar/checkpoint-150/adapter_model/adapter_model.bin +3 -0
prompt-a/onechar/checkpoint-150/optimizer.pt +3 -0
prompt-a/onechar/checkpoint-150/rng_state_0.pth +3 -0
prompt-a/onechar/checkpoint-150/rng_state_1.pth +3 -0
prompt-a/onechar/checkpoint-150/rng_state_2.pth +3 -0
prompt-a/onechar/checkpoint-150/rng_state_3.pth +3 -0
prompt-a/onechar/checkpoint-150/rng_state_4.pth +3 -0
prompt-a/onechar/checkpoint-150/rng_state_5.pth +3 -0
prompt-a/onechar/checkpoint-150/rng_state_6.pth +3 -0
prompt-a/onechar/checkpoint-150/rng_state_7.pth +3 -0
prompt-a/onechar/checkpoint-150/scheduler.pt +3 -0
prompt-a/onechar/checkpoint-150/trainer_state.json +975 -0
prompt-a/onechar/checkpoint-150/training_args.bin +3 -0
prompt-a/onechar/checkpoint-200/README.md +21 -0
prompt-a/onechar/checkpoint-200/adapter_config.json +26 -0
prompt-a/onechar/checkpoint-200/adapter_model.bin +3 -0
prompt-a/onechar/checkpoint-200/adapter_model/README.md +21 -0
prompt-a/onechar/checkpoint-200/adapter_model/adapter_config.json +26 -0
prompt-a/onechar/checkpoint-200/adapter_model/adapter_model.bin +3 -0
prompt-a/onechar/checkpoint-200/optimizer.pt +3 -0
prompt-a/onechar/checkpoint-200/rng_state_0.pth +3 -0
prompt-a/onechar/checkpoint-200/rng_state_1.pth +3 -0
prompt-a/onechar/checkpoint-200/rng_state_2.pth +3 -0

prompt-a/onechar/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

prompt-a/onechar/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Llama-2-13b-hf",
+  "bias": "none",
+  "fan_in_fan_out": null,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.01,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "q_proj",
+    "k_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

prompt-a/onechar/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f5ec19329cacf861536c142e358f467bfaf4ef5352429c4826c33d208347a3d
+size 125374989

prompt-a/onechar/added_tokens.json ADDED Viewed

	@@ -0,0 +1,3 @@

+{
+  "[PAD]": 32000
+}

prompt-a/onechar/checkpoint-100/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

prompt-a/onechar/checkpoint-100/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Llama-2-13b-hf",
+  "bias": "none",
+  "fan_in_fan_out": null,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.01,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "q_proj",
+    "k_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

prompt-a/onechar/checkpoint-100/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ff610c0b53c8af0e9c984b4ed0725380085f987aa69e16c979a257578cfabcb
+size 125374989

prompt-a/onechar/checkpoint-100/adapter_model/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

prompt-a/onechar/checkpoint-100/adapter_model/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Llama-2-13b-hf",
+  "bias": "none",
+  "fan_in_fan_out": null,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.01,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "q_proj",
+    "k_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

prompt-a/onechar/checkpoint-100/adapter_model/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ff610c0b53c8af0e9c984b4ed0725380085f987aa69e16c979a257578cfabcb
+size 125374989

prompt-a/onechar/checkpoint-100/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f7f1f403d38dc995a8098ed409cbd760e111bd882f7a68df45055032258b88b6
+size 250681597

prompt-a/onechar/checkpoint-100/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4102fd8971c12e358d8aa24117ab73918cc1aaac07c4678184c87371a7cce1c6
+size 21687

prompt-a/onechar/checkpoint-100/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a35f8c8b1beb2b76ef2ca1aa345895c6db951b1551c9042228eb0ea741ce12c
+size 21687

prompt-a/onechar/checkpoint-100/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa20b68c489c5a2cd2428b1f3e5072cdf8f2417980be271f9db72c4049028bb3
+size 21687

prompt-a/onechar/checkpoint-100/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a828f6b225941a386fb560abfcd7d4dee497153fe1cf40b8a87e5174aa75bed3
+size 21687

prompt-a/onechar/checkpoint-100/rng_state_4.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1af5550599dc6617b8105e29364818d1dbea0b5d63b4e86bd3c1697f930ae248
+size 21687

prompt-a/onechar/checkpoint-100/rng_state_5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b13498715ccaef6df8b69c2dab24d427d1152ac7f5c20f3a7aa0579d6df2f93
+size 21687

prompt-a/onechar/checkpoint-100/rng_state_6.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0a13f52d9df555a3b9fac609325509aebf8adff3267140830db81111f0c8f4a
+size 21687

prompt-a/onechar/checkpoint-100/rng_state_7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f7afe0df70969c4c1a997671975d84b8bdde138351b49fb8396fec85cf845301
+size 21687

prompt-a/onechar/checkpoint-100/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:781197e4490645acd969affd7bc482901bb63fc73f416de5de064f3460ca305a
+size 627

prompt-a/onechar/checkpoint-100/trainer_state.json ADDED Viewed

	@@ -0,0 +1,659 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.9523809523809523,
+  "eval_steps": 20,
+  "global_step": 100,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 6.5e-06,
+      "loss": 2.1535,
+      "step": 1
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 1.3e-05,
+      "loss": 2.1328,
+      "step": 2
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 1.9499999999999996e-05,
+      "loss": 2.0918,
+      "step": 3
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 2.6e-05,
+      "loss": 2.1194,
+      "step": 4
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 3.25e-05,
+      "loss": 2.2342,
+      "step": 5
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 3.899999999999999e-05,
+      "loss": 2.1168,
+      "step": 6
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.5499999999999995e-05,
+      "loss": 2.1761,
+      "step": 7
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 5.2e-05,
+      "loss": 2.0764,
+      "step": 8
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 5.85e-05,
+      "loss": 2.1711,
+      "step": 9
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 6.5e-05,
+      "loss": 2.0885,
+      "step": 10
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 6.499599055565396e-05,
+      "loss": 2.0196,
+      "step": 11
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 6.498396321188627e-05,
+      "loss": 2.1799,
+      "step": 12
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 6.496392093626402e-05,
+      "loss": 2.1322,
+      "step": 13
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 6.493586867391882e-05,
+      "loss": 2.1486,
+      "step": 14
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 6.489981334632665e-05,
+      "loss": 2.1351,
+      "step": 15
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 6.48557638496001e-05,
+      "loss": 2.1366,
+      "step": 16
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 6.480373105229334e-05,
+      "loss": 2.0727,
+      "step": 17
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 6.474372779272053e-05,
+      "loss": 2.1123,
+      "step": 18
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 6.467576887578811e-05,
+      "loss": 2.0652,
+      "step": 19
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 6.459987106934198e-05,
+      "loss": 2.0008,
+      "step": 20
+    },
+    {
+      "epoch": 0.19,
+      "eval_loss": 2.0444116592407227,
+      "eval_runtime": 2.798,
+      "eval_samples_per_second": 3.574,
+      "eval_steps_per_second": 0.715,
+      "step": 20
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 6.451605310003014e-05,
+      "loss": 2.0769,
+      "step": 21
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 6.442433564868238e-05,
+      "loss": 1.9949,
+      "step": 22
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 6.432474134520738e-05,
+      "loss": 2.1341,
+      "step": 23
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 6.421729476300929e-05,
+      "loss": 2.1433,
+      "step": 24
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 6.410202241292448e-05,
+      "loss": 2.0168,
+      "step": 25
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 6.39789527366805e-05,
+      "loss": 2.0403,
+      "step": 26
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 6.384811609987843e-05,
+      "loss": 2.1983,
+      "step": 27
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 6.370954478450064e-05,
+      "loss": 2.0625,
+      "step": 28
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 6.356327298094572e-05,
+      "loss": 2.204,
+      "step": 29
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 6.340933677959248e-05,
+      "loss": 2.118,
+      "step": 30
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 6.324777416189522e-05,
+      "loss": 2.0997,
+      "step": 31
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 6.307862499101232e-05,
+      "loss": 2.1154,
+      "step": 32
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 6.290193100197069e-05,
+      "loss": 2.0845,
+      "step": 33
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 6.271773579136816e-05,
+      "loss": 2.0052,
+      "step": 34
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 6.252608480661681e-05,
+      "loss": 1.956,
+      "step": 35
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 6.232702533472938e-05,
+      "loss": 2.0958,
+      "step": 36
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.212060649065197e-05,
+      "loss": 2.0634,
+      "step": 37
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.190687920514563e-05,
+      "loss": 2.0033,
+      "step": 38
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 6.168589621222e-05,
+      "loss": 2.1426,
+      "step": 39
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 6.145771203612195e-05,
+      "loss": 1.9823,
+      "step": 40
+    },
+    {
+      "epoch": 0.38,
+      "eval_loss": 2.0226035118103027,
+      "eval_runtime": 2.8049,
+      "eval_samples_per_second": 3.565,
+      "eval_steps_per_second": 0.713,
+      "step": 40
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 6.122238297788254e-05,
+      "loss": 2.2016,
+      "step": 41
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 6.097996710142556e-05,
+      "loss": 2.1008,
+      "step": 42
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 6.0730524219241214e-05,
+      "loss": 2.0821,
+      "step": 43
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 6.047411587762816e-05,
+      "loss": 2.092,
+      "step": 44
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 6.0210805341507994e-05,
+      "loss": 1.9617,
+      "step": 45
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 5.994065757881549e-05,
+      "loss": 1.9358,
+      "step": 46
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 5.966373924446878e-05,
+      "loss": 2.0573,
+      "step": 47
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 5.938011866392325e-05,
+      "loss": 2.0731,
+      "step": 48
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 5.9089865816313253e-05,
+      "loss": 2.2842,
+      "step": 49
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 5.8793052317185785e-05,
+      "loss": 2.2145,
+      "step": 50
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 5.848975140083044e-05,
+      "loss": 1.9923,
+      "step": 51
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.818003790220993e-05,
+      "loss": 2.1065,
+      "step": 52
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.786398823849571e-05,
+      "loss": 2.0009,
+      "step": 53
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.754168039021315e-05,
+      "loss": 1.9785,
+      "step": 54
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.7213193882001006e-05,
+      "loss": 1.9504,
+      "step": 55
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 5.687860976298993e-05,
+      "loss": 2.1977,
+      "step": 56
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 5.6538010586804816e-05,
+      "loss": 2.0423,
+      "step": 57
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 5.619148039119587e-05,
+      "loss": 2.0536,
+      "step": 58
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 5.5839104677303635e-05,
+      "loss": 2.0286,
+      "step": 59
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 5.548097038856279e-05,
+      "loss": 2.1143,
+      "step": 60
+    },
+    {
+      "epoch": 0.57,
+      "eval_loss": 2.0128190517425537,
+      "eval_runtime": 2.8105,
+      "eval_samples_per_second": 3.558,
+      "eval_steps_per_second": 0.712,
+      "step": 60
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 5.511716588925021e-05,
+      "loss": 2.1397,
+      "step": 61
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 5.474778094268238e-05,
+      "loss": 2.0601,
+      "step": 62
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 5.437290668906763e-05,
+      "loss": 2.1707,
+      "step": 63
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 5.399263562301868e-05,
+      "loss": 2.0649,
+      "step": 64
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 5.360706157073096e-05,
+      "loss": 2.0314,
+      "step": 65
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 5.321627966683241e-05,
+      "loss": 2.1277,
+      "step": 66
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 5.2820386330910424e-05,
+      "loss": 2.0534,
+      "step": 67
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 5.2419479243721734e-05,
+      "loss": 1.9976,
+      "step": 68
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 5.2013657323091226e-05,
+      "loss": 2.0262,
+      "step": 69
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 5.160302069950537e-05,
+      "loss": 2.0093,
+      "step": 70
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 5.118767069140655e-05,
+      "loss": 2.1088,
+      "step": 71
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 5.076770978019424e-05,
+      "loss": 1.9841,
+      "step": 72
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 5.034324158493928e-05,
+      "loss": 2.0081,
+      "step": 73
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 4.991437083681739e-05,
+      "loss": 2.0179,
+      "step": 74
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 4.948120335326833e-05,
+      "loss": 2.1304,
+      "step": 75
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 4.904384601188706e-05,
+      "loss": 1.9213,
+      "step": 76
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 4.860240672405324e-05,
+      "loss": 2.2153,
+      "step": 77
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 4.815699440830574e-05,
+      "loss": 1.9365,
+      "step": 78
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 4.770771896346863e-05,
+      "loss": 2.021,
+      "step": 79
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.725469124153526e-05,
+      "loss": 2.0327,
+      "step": 80
+    },
+    {
+      "epoch": 0.76,
+      "eval_loss": 2.0059409141540527,
+      "eval_runtime": 2.8077,
+      "eval_samples_per_second": 3.562,
+      "eval_steps_per_second": 0.712,
+      "step": 80
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 4.679802302031724e-05,
+      "loss": 2.1576,
+      "step": 81
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 4.6337826975864856e-05,
+      "loss": 1.9468,
+      "step": 82
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 4.587421665466603e-05,
+      "loss": 2.0795,
+      "step": 83
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 4.540730644563036e-05,
+      "loss": 2.0566,
+      "step": 84
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 4.4937211551865415e-05,
+      "loss": 2.0819,
+      "step": 85
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 4.4464047962252035e-05,
+      "loss": 2.0542,
+      "step": 86
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 4.398793242282586e-05,
+      "loss": 2.0006,
+      "step": 87
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 4.350898240797197e-05,
+      "loss": 1.9953,
+      "step": 88
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 4.3027316091439854e-05,
+      "loss": 2.067,
+      "step": 89
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 4.254305231718579e-05,
+      "loss": 1.9909,
+      "step": 90
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 4.205631057004987e-05,
+      "loss": 1.9436,
+      "step": 91
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 4.156721094627495e-05,
+      "loss": 2.0643,
+      "step": 92
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 4.107587412387462e-05,
+      "loss": 2.1244,
+      "step": 93
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 4.058242133285779e-05,
+      "loss": 1.9795,
+      "step": 94
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 4.008697432531693e-05,
+      "loss": 2.1568,
+      "step": 95
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 3.9589655345387633e-05,
+      "loss": 1.9829,
+      "step": 96
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 3.909058709908665e-05,
+      "loss": 2.031,
+      "step": 97
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 3.858989272403605e-05,
+      "loss": 2.2042,
+      "step": 98
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 3.8087695759080804e-05,
+      "loss": 1.9775,
+      "step": 99
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.75841201138075e-05,
+      "loss": 2.0274,
+      "step": 100
+    },
+    {
+      "epoch": 0.95,
+      "eval_loss": 2.0003483295440674,
+      "eval_runtime": 2.8075,
+      "eval_samples_per_second": 3.562,
+      "eval_steps_per_second": 0.712,
+      "step": 100
+    }
+  ],
+  "logging_steps": 1,
+  "max_steps": 210,
+  "num_train_epochs": 2,
+  "save_steps": 50,
+  "total_flos": 8.146151922047386e+16,
+  "trial_name": null,
+  "trial_params": null
+}

prompt-a/onechar/checkpoint-100/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8ff85b6b2e99bcdbf030f4c883beac4553b8cad32f31f2d286263119b723c469
+size 4411

prompt-a/onechar/checkpoint-150/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

prompt-a/onechar/checkpoint-150/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Llama-2-13b-hf",
+  "bias": "none",
+  "fan_in_fan_out": null,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.01,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "q_proj",
+    "k_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

prompt-a/onechar/checkpoint-150/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:16b699052f2d128f83c6010ef6f104f26dcbf6cb4325eedcc9a7b58bc08c5c9f
+size 125374989

prompt-a/onechar/checkpoint-150/adapter_model/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

prompt-a/onechar/checkpoint-150/adapter_model/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Llama-2-13b-hf",
+  "bias": "none",
+  "fan_in_fan_out": null,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.01,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "q_proj",
+    "k_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

prompt-a/onechar/checkpoint-150/adapter_model/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:16b699052f2d128f83c6010ef6f104f26dcbf6cb4325eedcc9a7b58bc08c5c9f
+size 125374989

prompt-a/onechar/checkpoint-150/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6697d2772f8bdabc0de5308ce64fed55e96f213ec392cc350ff9e35b3419011a
+size 250681597

prompt-a/onechar/checkpoint-150/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:39b0267998bb7a1cfb283b31e1dd7afbe75c84407c53c4f1c298028d9daacc6e
+size 21687

prompt-a/onechar/checkpoint-150/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:50e5dc96be0a674ddf476b916d068682bfc8d9f342c0213d1ba280d171cbc1d0
+size 21687

prompt-a/onechar/checkpoint-150/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f1ec8428ac308b6c6ffb63f0d2137a6c43b3b0f57031e333c2cde00dfbfedff
+size 21687

prompt-a/onechar/checkpoint-150/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:832989103ea74caa2d18f41014c7ec87b33f665d85bbfabeac5e440a24a4e438
+size 21687

prompt-a/onechar/checkpoint-150/rng_state_4.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c7c038cf0ec9ace1d9317b463a053999ebbd8efbc6568a0c63333109129be6de
+size 21687

prompt-a/onechar/checkpoint-150/rng_state_5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ea0b0a35fbb56436b89de780a77c2850d7ceb494df91befbfc0be4b4388f8c31
+size 21687

prompt-a/onechar/checkpoint-150/rng_state_6.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24a1fd82be4a9e4def96881742849b0f5444737a5c55f1de3d18ff9b31a835e5
+size 21687

prompt-a/onechar/checkpoint-150/rng_state_7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b924ccabce3c839d1b33edc854332d317e917f50d4f5defffe6a8f741a9641b0
+size 21687

prompt-a/onechar/checkpoint-150/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9abe1c80a7b715c51418717c88a5924cc27c160619ed0f1dec7010dc1687509
+size 627

prompt-a/onechar/checkpoint-150/trainer_state.json ADDED Viewed

	@@ -0,0 +1,975 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.4285714285714286,
+  "eval_steps": 20,
+  "global_step": 150,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 6.5e-06,
+      "loss": 2.1535,
+      "step": 1
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 1.3e-05,
+      "loss": 2.1328,
+      "step": 2
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 1.9499999999999996e-05,
+      "loss": 2.0918,
+      "step": 3
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 2.6e-05,
+      "loss": 2.1194,
+      "step": 4
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 3.25e-05,
+      "loss": 2.2342,
+      "step": 5
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 3.899999999999999e-05,
+      "loss": 2.1168,
+      "step": 6
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.5499999999999995e-05,
+      "loss": 2.1761,
+      "step": 7
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 5.2e-05,
+      "loss": 2.0764,
+      "step": 8
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 5.85e-05,
+      "loss": 2.1711,
+      "step": 9
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 6.5e-05,
+      "loss": 2.0885,
+      "step": 10
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 6.499599055565396e-05,
+      "loss": 2.0196,
+      "step": 11
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 6.498396321188627e-05,
+      "loss": 2.1799,
+      "step": 12
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 6.496392093626402e-05,
+      "loss": 2.1322,
+      "step": 13
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 6.493586867391882e-05,
+      "loss": 2.1486,
+      "step": 14
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 6.489981334632665e-05,
+      "loss": 2.1351,
+      "step": 15
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 6.48557638496001e-05,
+      "loss": 2.1366,
+      "step": 16
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 6.480373105229334e-05,
+      "loss": 2.0727,
+      "step": 17
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 6.474372779272053e-05,
+      "loss": 2.1123,
+      "step": 18
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 6.467576887578811e-05,
+      "loss": 2.0652,
+      "step": 19
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 6.459987106934198e-05,
+      "loss": 2.0008,
+      "step": 20
+    },
+    {
+      "epoch": 0.19,
+      "eval_loss": 2.0444116592407227,
+      "eval_runtime": 2.798,
+      "eval_samples_per_second": 3.574,
+      "eval_steps_per_second": 0.715,
+      "step": 20
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 6.451605310003014e-05,
+      "loss": 2.0769,
+      "step": 21
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 6.442433564868238e-05,
+      "loss": 1.9949,
+      "step": 22
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 6.432474134520738e-05,
+      "loss": 2.1341,
+      "step": 23
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 6.421729476300929e-05,
+      "loss": 2.1433,
+      "step": 24
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 6.410202241292448e-05,
+      "loss": 2.0168,
+      "step": 25
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 6.39789527366805e-05,
+      "loss": 2.0403,
+      "step": 26
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 6.384811609987843e-05,
+      "loss": 2.1983,
+      "step": 27
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 6.370954478450064e-05,
+      "loss": 2.0625,
+      "step": 28
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 6.356327298094572e-05,
+      "loss": 2.204,
+      "step": 29
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 6.340933677959248e-05,
+      "loss": 2.118,
+      "step": 30
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 6.324777416189522e-05,
+      "loss": 2.0997,
+      "step": 31
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 6.307862499101232e-05,
+      "loss": 2.1154,
+      "step": 32
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 6.290193100197069e-05,
+      "loss": 2.0845,
+      "step": 33
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 6.271773579136816e-05,
+      "loss": 2.0052,
+      "step": 34
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 6.252608480661681e-05,
+      "loss": 1.956,
+      "step": 35
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 6.232702533472938e-05,
+      "loss": 2.0958,
+      "step": 36
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.212060649065197e-05,
+      "loss": 2.0634,
+      "step": 37
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.190687920514563e-05,
+      "loss": 2.0033,
+      "step": 38
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 6.168589621222e-05,
+      "loss": 2.1426,
+      "step": 39
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 6.145771203612195e-05,
+      "loss": 1.9823,
+      "step": 40
+    },
+    {
+      "epoch": 0.38,
+      "eval_loss": 2.0226035118103027,
+      "eval_runtime": 2.8049,
+      "eval_samples_per_second": 3.565,
+      "eval_steps_per_second": 0.713,
+      "step": 40
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 6.122238297788254e-05,
+      "loss": 2.2016,
+      "step": 41
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 6.097996710142556e-05,
+      "loss": 2.1008,
+      "step": 42
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 6.0730524219241214e-05,
+      "loss": 2.0821,
+      "step": 43
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 6.047411587762816e-05,
+      "loss": 2.092,
+      "step": 44
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 6.0210805341507994e-05,
+      "loss": 1.9617,
+      "step": 45
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 5.994065757881549e-05,
+      "loss": 1.9358,
+      "step": 46
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 5.966373924446878e-05,
+      "loss": 2.0573,
+      "step": 47
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 5.938011866392325e-05,
+      "loss": 2.0731,
+      "step": 48
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 5.9089865816313253e-05,
+      "loss": 2.2842,
+      "step": 49
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 5.8793052317185785e-05,
+      "loss": 2.2145,
+      "step": 50
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 5.848975140083044e-05,
+      "loss": 1.9923,
+      "step": 51
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.818003790220993e-05,
+      "loss": 2.1065,
+      "step": 52
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.786398823849571e-05,
+      "loss": 2.0009,
+      "step": 53
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 5.754168039021315e-05,
+      "loss": 1.9785,
+      "step": 54
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 5.7213193882001006e-05,
+      "loss": 1.9504,
+      "step": 55
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 5.687860976298993e-05,
+      "loss": 2.1977,
+      "step": 56
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 5.6538010586804816e-05,
+      "loss": 2.0423,
+      "step": 57
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 5.619148039119587e-05,
+      "loss": 2.0536,
+      "step": 58
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 5.5839104677303635e-05,
+      "loss": 2.0286,
+      "step": 59
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 5.548097038856279e-05,
+      "loss": 2.1143,
+      "step": 60
+    },
+    {
+      "epoch": 0.57,
+      "eval_loss": 2.0128190517425537,
+      "eval_runtime": 2.8105,
+      "eval_samples_per_second": 3.558,
+      "eval_steps_per_second": 0.712,
+      "step": 60
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 5.511716588925021e-05,
+      "loss": 2.1397,
+      "step": 61
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 5.474778094268238e-05,
+      "loss": 2.0601,
+      "step": 62
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 5.437290668906763e-05,
+      "loss": 2.1707,
+      "step": 63
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 5.399263562301868e-05,
+      "loss": 2.0649,
+      "step": 64
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 5.360706157073096e-05,
+      "loss": 2.0314,
+      "step": 65
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 5.321627966683241e-05,
+      "loss": 2.1277,
+      "step": 66
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 5.2820386330910424e-05,
+      "loss": 2.0534,
+      "step": 67
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 5.2419479243721734e-05,
+      "loss": 1.9976,
+      "step": 68
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 5.2013657323091226e-05,
+      "loss": 2.0262,
+      "step": 69
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 5.160302069950537e-05,
+      "loss": 2.0093,
+      "step": 70
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 5.118767069140655e-05,
+      "loss": 2.1088,
+      "step": 71
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 5.076770978019424e-05,
+      "loss": 1.9841,
+      "step": 72
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 5.034324158493928e-05,
+      "loss": 2.0081,
+      "step": 73
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 4.991437083681739e-05,
+      "loss": 2.0179,
+      "step": 74
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 4.948120335326833e-05,
+      "loss": 2.1304,
+      "step": 75
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 4.904384601188706e-05,
+      "loss": 1.9213,
+      "step": 76
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 4.860240672405324e-05,
+      "loss": 2.2153,
+      "step": 77
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 4.815699440830574e-05,
+      "loss": 1.9365,
+      "step": 78
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 4.770771896346863e-05,
+      "loss": 2.021,
+      "step": 79
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.725469124153526e-05,
+      "loss": 2.0327,
+      "step": 80
+    },
+    {
+      "epoch": 0.76,
+      "eval_loss": 2.0059409141540527,
+      "eval_runtime": 2.8077,
+      "eval_samples_per_second": 3.562,
+      "eval_steps_per_second": 0.712,
+      "step": 80
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 4.679802302031724e-05,
+      "loss": 2.1576,
+      "step": 81
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 4.6337826975864856e-05,
+      "loss": 1.9468,
+      "step": 82
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 4.587421665466603e-05,
+      "loss": 2.0795,
+      "step": 83
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 4.540730644563036e-05,
+      "loss": 2.0566,
+      "step": 84
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 4.4937211551865415e-05,
+      "loss": 2.0819,
+      "step": 85
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 4.4464047962252035e-05,
+      "loss": 2.0542,
+      "step": 86
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 4.398793242282586e-05,
+      "loss": 2.0006,
+      "step": 87
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 4.350898240797197e-05,
+      "loss": 1.9953,
+      "step": 88
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 4.3027316091439854e-05,
+      "loss": 2.067,
+      "step": 89
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 4.254305231718579e-05,
+      "loss": 1.9909,
+      "step": 90
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 4.205631057004987e-05,
+      "loss": 1.9436,
+      "step": 91
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 4.156721094627495e-05,
+      "loss": 2.0643,
+      "step": 92
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 4.107587412387462e-05,
+      "loss": 2.1244,
+      "step": 93
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 4.058242133285779e-05,
+      "loss": 1.9795,
+      "step": 94
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 4.008697432531693e-05,
+      "loss": 2.1568,
+      "step": 95
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 3.9589655345387633e-05,
+      "loss": 1.9829,
+      "step": 96
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 3.909058709908665e-05,
+      "loss": 2.031,
+      "step": 97
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 3.858989272403605e-05,
+      "loss": 2.2042,
+      "step": 98
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 3.8087695759080804e-05,
+      "loss": 1.9775,
+      "step": 99
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.75841201138075e-05,
+      "loss": 2.0274,
+      "step": 100
+    },
+    {
+      "epoch": 0.95,
+      "eval_loss": 2.0003483295440674,
+      "eval_runtime": 2.8075,
+      "eval_samples_per_second": 3.562,
+      "eval_steps_per_second": 0.712,
+      "step": 100
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 3.707929003797143e-05,
+      "loss": 2.0745,
+      "step": 101
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 3.6573330090839886e-05,
+      "loss": 1.9933,
+      "step": 102
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 3.6066365110458966e-05,
+      "loss": 2.127,
+      "step": 103
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 3.555852018285172e-05,
+      "loss": 2.0499,
+      "step": 104
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 3.504992061115496e-05,
+      "loss": 1.9391,
+      "step": 105
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 3.4540691884702686e-05,
+      "loss": 2.0216,
+      "step": 106
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 3.4030959648063384e-05,
+      "loss": 2.0055,
+      "step": 107
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 3.3520849670039165e-05,
+      "loss": 2.0721,
+      "step": 108
+    },
+    {
+      "epoch": 1.04,
+      "learning_rate": 3.301048781263417e-05,
+      "loss": 2.0274,
+      "step": 109
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.25e-05,
+      "loss": 1.9373,
+      "step": 110
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 3.198951218736583e-05,
+      "loss": 1.9034,
+      "step": 111
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 3.147915032996083e-05,
+      "loss": 1.8759,
+      "step": 112
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 3.096904035193661e-05,
+      "loss": 2.0572,
+      "step": 113
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 3.0459308115297312e-05,
+      "loss": 2.0072,
+      "step": 114
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 2.9950079388845042e-05,
+      "loss": 1.9129,
+      "step": 115
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 2.944147981714828e-05,
+      "loss": 2.0966,
+      "step": 116
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 2.8933634889541028e-05,
+      "loss": 2.0903,
+      "step": 117
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 2.8426669909160105e-05,
+      "loss": 2.0917,
+      "step": 118
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 2.7920709962028562e-05,
+      "loss": 2.089,
+      "step": 119
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 2.741587988619249e-05,
+      "loss": 1.9964,
+      "step": 120
+    },
+    {
+      "epoch": 1.14,
+      "eval_loss": 1.9988892078399658,
+      "eval_runtime": 2.8188,
+      "eval_samples_per_second": 3.548,
+      "eval_steps_per_second": 0.71,
+      "step": 120
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 2.6912304240919183e-05,
+      "loss": 1.9754,
+      "step": 121
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 2.641010727596394e-05,
+      "loss": 2.1508,
+      "step": 122
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 2.5909412900913353e-05,
+      "loss": 2.0331,
+      "step": 123
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 2.5410344654612374e-05,
+      "loss": 1.9607,
+      "step": 124
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 2.4913025674683083e-05,
+      "loss": 2.0356,
+      "step": 125
+    },
+    {
+      "epoch": 1.2,
+      "learning_rate": 2.4417578667142222e-05,
+      "loss": 2.0417,
+      "step": 126
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 2.3924125876125387e-05,
+      "loss": 1.9246,
+      "step": 127
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 2.343278905372505e-05,
+      "loss": 2.0911,
+      "step": 128
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 2.2943689429950124e-05,
+      "loss": 1.9324,
+      "step": 129
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 2.2456947682814208e-05,
+      "loss": 1.9987,
+      "step": 130
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 2.1972683908560147e-05,
+      "loss": 2.0121,
+      "step": 131
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 2.149101759202803e-05,
+      "loss": 2.0002,
+      "step": 132
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 2.1012067577174147e-05,
+      "loss": 2.0464,
+      "step": 133
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 2.0535952037747966e-05,
+      "loss": 2.1422,
+      "step": 134
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 2.0062788448134583e-05,
+      "loss": 1.9796,
+      "step": 135
+    },
+    {
+      "epoch": 1.3,
+      "learning_rate": 1.959269355436963e-05,
+      "loss": 1.9683,
+      "step": 136
+    },
+    {
+      "epoch": 1.3,
+      "learning_rate": 1.9125783345333963e-05,
+      "loss": 2.1488,
+      "step": 137
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 1.866217302413514e-05,
+      "loss": 1.9852,
+      "step": 138
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 1.8201976979682756e-05,
+      "loss": 2.0087,
+      "step": 139
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 1.774530875846473e-05,
+      "loss": 1.9724,
+      "step": 140
+    },
+    {
+      "epoch": 1.33,
+      "eval_loss": 1.9960596561431885,
+      "eval_runtime": 2.8086,
+      "eval_samples_per_second": 3.56,
+      "eval_steps_per_second": 0.712,
+      "step": 140
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 1.7292281036531367e-05,
+      "loss": 2.0022,
+      "step": 141
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 1.6843005591694247e-05,
+      "loss": 2.0827,
+      "step": 142
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 1.639759327594675e-05,
+      "loss": 2.0052,
+      "step": 143
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 1.595615398811293e-05,
+      "loss": 1.9938,
+      "step": 144
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 1.551879664673166e-05,
+      "loss": 1.996,
+      "step": 145
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 1.5085629163182601e-05,
+      "loss": 2.0065,
+      "step": 146
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 1.4656758415060712e-05,
+      "loss": 2.0048,
+      "step": 147
+    },
+    {
+      "epoch": 1.41,
+      "learning_rate": 1.4232290219805762e-05,
+      "loss": 1.8846,
+      "step": 148
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 1.3812329308593457e-05,
+      "loss": 1.9582,
+      "step": 149
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 1.3396979300494626e-05,
+      "loss": 2.0509,
+      "step": 150
+    }
+  ],
+  "logging_steps": 1,
+  "max_steps": 210,
+  "num_train_epochs": 2,
+  "save_steps": 50,
+  "total_flos": 1.2206169951043584e+17,
+  "trial_name": null,
+  "trial_params": null
+}

prompt-a/onechar/checkpoint-150/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8ff85b6b2e99bcdbf030f4c883beac4553b8cad32f31f2d286263119b723c469
+size 4411

prompt-a/onechar/checkpoint-200/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

prompt-a/onechar/checkpoint-200/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Llama-2-13b-hf",
+  "bias": "none",
+  "fan_in_fan_out": null,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.01,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "q_proj",
+    "k_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

prompt-a/onechar/checkpoint-200/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0aeeda740ab6bb8ee51e6b7ecd7a2848397fd35d1b4db657df6d8fa4dac2f048
+size 125374989

prompt-a/onechar/checkpoint-200/adapter_model/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

prompt-a/onechar/checkpoint-200/adapter_model/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Llama-2-13b-hf",
+  "bias": "none",
+  "fan_in_fan_out": null,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.01,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "q_proj",
+    "k_proj",
+    "down_proj",
+    "up_proj",
+    "gate_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

prompt-a/onechar/checkpoint-200/adapter_model/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0aeeda740ab6bb8ee51e6b7ecd7a2848397fd35d1b4db657df6d8fa4dac2f048
+size 125374989

prompt-a/onechar/checkpoint-200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:696142d361db2f7734fc31c617f47091a5690b7733ed8c4a21b5b59a2ee213a8
+size 250681597

prompt-a/onechar/checkpoint-200/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02519202233b2f973159654f70ae8d8d74816c44a0c980e2ec2bc67267e89056
+size 21687

prompt-a/onechar/checkpoint-200/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7022483dc2b7110805d232d89f98606595b39d55b0309c029f39838461bfa05
+size 21687

prompt-a/onechar/checkpoint-200/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fbee7570d88f852abb0c601b61e086fab06332833e7e65aa5e6cac17720c5a40
+size 21687