File size: 21,146 Bytes
e723d02 b53f94e e723d02 81f01e3 f141ac1 81f01e3 3f8cdf3 81f01e3 e723d02 b53f94e |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 |
---
base_model: MLP-KTLim/llama-3-Korean-Bllossom-8B
language:
- en
license: apache-2.0
tags:
- text-generation-inference
- transformers
- unsloth
- llama
- trl
library_name: peft
---
<img src="https://huggingface.co/iknow-lab/ko-genstruct-v0.1/resolve/main/image.webp" />
# 0725-ko-genstruct-v0.2-writing
Ko-genstructλ μ£Όμ΄μ§ λ¬Έμλ‘λΆν° Instruction Tuning λ°μ΄ν°λ₯Ό μμ±ν΄λ΄λ λͺ¨λΈμ
λλ€.
| λͺ¨λΈ | μ ν |
|-----|-----|
| [iknow-lab/0725-ko-genstruct-v0.2-simple-qa](https://huggingface.co/iknow-lab/0725-ko-genstruct-v0.2-simple-qa) | λ¨μν μ§λ¬Έκ³Ό λ΅λ³ μμ± |
| [iknow-lab/0725-ko-genstruct-v0.2-writing](https://huggingface.co/iknow-lab/0725-ko-genstruct-v0.2-writing) | κΈμ°κΈ° μ§μλ¬Έκ³Ό λ΅λ³ μμ± |
| [iknow-lab/0725-ko-genstruct-v0.2-creative-writing](https://huggingface.co/iknow-lab/0725-ko-genstruct-v0.2-creative-writing) | μ°½μμ μΈ κΈμ°κΈ° μ§μλ¬Έκ³Ό λ΅λ³ μμ± |
μ΄ λͺ¨λΈμ [Ada-instruct](https://arxiv.org/abs/2310.04484)μ [Genstruct](https://huggingface.co/NousResearch/Genstruct-7B)λ‘λΆν° μκ°μ λ°μμ΅λλ€.
λ€μκ³Ό κ°μ μ©λλ‘ νμ©ν μ μμ΅λλ€.
- κ²μ λͺ¨λΈμ νμ΅νκΈ° μν΄ μ£Όμ΄μ§ ν
μ€νΈλ‘λΆν° μ§λ¬Έμ μμ±νκΈ°
- 보μ ν λ°μ΄ν°λ₯Ό μ΄μ©νμ¬ Instruction Tuning νμ΅ λ°μ΄ν°λ₯Ό μμ±
# μ¬μ©λ°©λ²
## μμ± μμ
```python
import transformers
transformers.logging.set_verbosity_error()
import transformers
import peft
model_id = "MLP-KTLim/llama-3-Korean-Bllossom-8B"
peft_model_id = "iknow-lab/0725-ko-genstruct-v0.2-writing"
tokenizer = transformers.AutoTokenizer.from_pretrained(model_id)
model = transformers.AutoModelForCausalLM.from_pretrained(model_id, device_map="cuda:0", torch_dtype="auto").eval()
model.load_adapter(peft_model_id)
text = """
μ 1μ₯ μ΄μΉ
μ 1μ‘°(λͺ©μ ) μ΄ νμΉμ μμ£Όλνκ΅(μ΄νβλ³Έ λνκ΅βλΌ νλ€)μ μ΄λ
μ μ€μ νκ³ μ΄λ₯Ό λ¬μ±νλλ° νμν μ¬νμ κ·μ ν¨μ λͺ©μ μΌλ‘ νλ€.
μ 2μ‘°(λνμ΄λ
) λ³Έ λνκ΅λ λνλ―Όκ΅ κ΅μ‘μ κ·Όλ³Έμ΄λ
μ μ
κ°νμ¬ μΈκ°μ‘΄μ€, μ€μ¬κ΅¬μ, μΈκ³μΌκ°μ μ μ μΌλ‘ κ΅κ° λ° μΈλ₯μ¬νμ λ°μ μ κΈ°μ¬ν μ μλ μ λ₯ν μΈμ¬λ₯Ό μμ±νκ³ νμ μ μ¬μ€ν μ΄λ‘ κ³Ό κ·Έ κ΄λ²νκ³ μ μΉν μμ©λ°©λ²μ μ°κ΅¬νλ©° κ΅μ‘γμ°κ΅¬μ λ₯λ ₯κ³Ό μμ€μ νμ©νμ¬ μ¬νμ μ§μ λ΄μ¬νλ κ²μ λͺ©νλ‘ νλ€.
μ 3μ‘°(μ μ) β βνμ¬κ³Όμ βμ΄λΌ ν¨μ νμ¬νμλ₯Ό μμ¬νκΈ° μν κ³Όμ μ λ§νλ€.
β‘βμμ¬κ³Όμ βμ΄λΌ ν¨μ μμ¬νμλ₯Ό,βλ°μ¬κ³Όμ βμ΄λΌ ν¨μ λ°μ¬νμλ₯Ό,βμγλ°μ¬ν΅ν©κ³Όμ βμ΄λΌ ν¨μ νμ¬μκ² λ°μ¬νμλ₯Ό κ°κ° μμ¬νκΈ° μν κ³Όμ μ λ§νλ€.
β’βλνμκ³Όμ βμ΄λΌ ν¨μ λ³Έ λνκ΅ μΌλ°λνμ, μ λ¬Έλνμ λ° νΉμλνμμ μ€μΉλ μμ¬κ³Όμ , λ°μ¬κ³Όμ λ° μγλ°μ¬ν΅ν©κ³Όμ λͺ¨λλ₯Ό λ§νλ€.
β£βνκ³Όκ°νλκ³Όμ βμ΄λΌ ν¨μ λνμκ³Όμ μμ 2κ° μ΄μμ νκ³Όκ° κ³΅λμΌλ‘ μ€μΉγμ΄μνλ κ³Όμ μ λ§νλ€. (κ°μ 2013.7.5)
β€βνμ°μ°νλκ³Όμ βμ΄λΌ ν¨μ λνμκ³Όμ μμ μ°κ΅¬κΈ°κ΄ λλ μ°μ
체μμ κ³μ½μ μνμ¬ μ€μΉγμ΄μνλ νγμ°γμ°, νγμ° λλ νγμ° νλκ³Όμ μ λ§νλ€.
β₯βνγμμ¬μ°κ³κ³Όμ βμ΄λΌ ν¨μ λ³Έ λνκ΅ νμ¬κ³Όμ κ³Ό μΌλ°λνμ μμ¬κ³Όμ μ μ°κ³νλ κ³Όμ μ λ§νλ€. (μ μ€ 2008.5.21)
β¦βνΉμνλΆβλΌ ν¨μ λνμ μμλμ΄ μμ§ μμ λ
립νλΆλ₯Ό λ§νλ€. (κ°μ 2008.5.21) (κ°μ 2010.7.21)
β§ βμ λ¬Έκ³Όμ βμ΄λΌ ν¨μ νμ¬κ³Όμ μμ λμΈ κ΅μ‘μΈμ¦μ λ°κΈ° μνμ¬ μ΄μνλ κ΅μ‘κ³Όμ μ λ§νλ€. (μ μ€ 2011.8.11)
μ 2μ₯ μ‘°μ§
μ 4μ‘°(기ꡬ) λ³Έ λνκ΅μ μ΄μ₯, κ΅λ¬΄λΆμ΄μ₯, μ무λΆμ΄μ₯, μ°νλΆμ΄μ₯, λν, μΌλ°λνμ, μ λ¬Έλνμ, νΉμλνμ, νΉμνλΆ, λνκ΅λ³ΈλΆ, λΆμκΈ°κ΄, μ°κ΅¬κΈ°κ΄, μ§μκΈ°κ΄, μμ£Όλνκ΅μ°ννλ ₯λ¨, μλ£μ, μ΄μ₯μ§μ기ꡬ, λΆμ΄μ₯μ§μ기ꡬ λ° νΉλ³κΈ°κ΅¬λ₯Ό λλ©°, μΈλΆμ¬νμ λ³ν1κ³Ό κ°λ€. (κ°μ 2007.3.26) (κ°μ 2007.7.25) (κ°μ 2007.9.9) (κ°μ 2008.2.22) (κ°μ 2008.12.16) (κ°μ 2009.2.20) (κ°μ 2009.4.2) (κ°μ 2009.4.29) (κ°μ 2009.7.27) (κ°μ 2009.10.18) (κ°μ 2009.12.7) (κ°μ 2010.2.26) (κ°μ 2010.7.21) (κ°μ 2011.1.11) (κ°μ 2011.8.11) (κ°μ 2011.12.23) (κ°μ 2012.5.10) (κ°μ 2012.7.17) (κ°μ 2012.11.19) (κ°μ 2013.1.25) (κ°μ 2013.5.1) (κ°μ 2013.7.30) (κ°μ 2013.12.31) (κ°μ 2014.5.30) (κ°μ 2014.6.30) (κ°μ 2015.2.10) (κ°μ 2015.05.18) (κ°μ 2015.08.13.) (κ°μ 2015.10.16) (κ°μ 2016.1.8) (κ°μ 2016.2.3) (κ°μ 2016.3.24) (κ°μ 2016.5.9) (κ°μ 2016.8.23) (κ°μ 2016.12.29) (κ°μ 2017.2.13) (κ°μ 2017.4.19) (κ°μ 2017.7.14) (κ°μ 2018.1.31) (κ°μ 2018.5.11) (κ°μ 2018.8.12) (κ°μ 2019.01.15) (κ°μ 2019.10.2) (κ°μ 2020. . )
μ 5μ‘°(μ΄μ₯) μ΄μ₯μ κ΅λ¬΄λ₯Ό ν΅ν νκ³ λ³Έ λνκ΅λ₯Ό λννλ€.
μ 6μ‘°(λΆμ΄μ₯) β κ΅λ¬΄λΆμ΄μ₯μ μ무(ι«ε)μ μ°ννλ ₯ μ΄μΈμ κ΅λ¬΄(ζ ‘ε)μ κ΄νμ¬, μ무λΆμ΄μ₯μ μ무(ι«ε)μ κ΄νμ¬ μ°νλΆμ΄μ₯μ μ°ννλ ₯μ κ΄νμ¬ μ΄μ₯μ 보μ’νλ©°, κ° λΆμ΄μ₯μ μ΄μ₯μ΄ κ΅¬μ²΄μ μΌλ‘ μμν μ
무λ₯Ό κ΄μ₯νλ€. (κ°μ 2009.4.2) (κ°μ 2015.10.16)
β‘ μ΄μ₯μ΄ κΆμλκ±°λ κ·Έ μ§λ¬΄λ₯Ό μνν μ μλ μ¬μ μ΄ μλ κ²½μ°μλ μ΄μ¬μ₯μ΄ μ§λͺ
νλ λΆμ΄μ₯μ΄ μ΄μ₯μ μ§λ¬΄λ₯Ό λννλ€. (κ°μ 2009.4.2)
μ 7μ‘°(λνκ΅λ³ΈλΆ) β λνκ΅λ³ΈλΆμ κ΅λ¬΄μ², μ°κ΅¬μ 보μ², νμμ², μ΄λ¬΄μ², κΈ°νμ², μ
νμ², κ΅μ νλ ₯μ²λ₯Ό λλ€. (κ°μ 2015.10.16) (κ°μ 2017.4.19)
β‘ κ° μ²μ μ
무μ κ΄νμ¬λγμμ£Όλνκ΅ μ§μ κ·μ γμΌλ‘ μ νλ€.
μ 7μ‘°μ2(νμνμ΅μ€μ¬λνμΆμ§λ³ΈλΆ) β γμμ£Όλνκ΅ μ§μ κ·μ γμ 5μ‘° μ 10νμ μκ±° νΉλ³κΈ°κ΅¬λ‘ νμνμ΅μ€μ¬λνμΆμ§λ³ΈλΆλ₯Ό λλ€. (μ μ€ 2009.7.27) (κ°μ 2017.7.14)
β‘ νμνμ΅μ€μ¬λνμΆμ§λ³ΈλΆλ νμκ΅μ‘κ³Ό κ΄λ ¨ν μ λ°μ
무λ₯Ό κ΄ν νλ€. (μ μ€ 2009.7.27)
β’ νμνμ΅μ€μ¬λνμΆμ§λ³ΈλΆ μ΄μμ λν΄μλ μ΄μ₯μ΄ λ°λ‘ μ νλ€. (μ μ€ 2009.7.27)
μ 7μ‘°μ3(κΈ°κ΄μλͺ
μ€λ¦¬μμν) β γμμ£Όλνκ΅ μ§μ κ·μ γμ 5μ‘° μ 10νμ μκ±° νΉλ³κΈ°κ΅¬λ‘ κΈ°κ΄μλͺ
μ€λ¦¬μμνλ₯Ό λλ€. (μ μ€ 2013.7.30) (κ°μ 2017.7.14)
β‘ κΈ°κ΄μλͺ
μ€λ¦¬μμνλ μΈκ°λμμ°κ΅¬ λ° μΈμ²΄μ λλ¬Όμ°κ΅¬μ μ€λ¦¬μ μμ μ μ¬μνκ³ κ°λ
νλ μ
무λ₯Ό κ΄ν νλ€. (μ μ€ 2013.7.30)
β’ κΈ°κ΄μλͺ
μ€λ¦¬μμν μ΄μμ λν΄μλ μ΄μ₯μ΄ λ°λ‘ μ νλ€. (μ μ€ 2013.7.30)"""
PROMPT_QA = """μ£Όμ΄μ§ ν
μ€νΈ 컨ν
μΈ λ₯Ό μ°Έκ³ νμ¬ κ³ λμ΄λ κΈμ°κΈ° μ§μλ¬Έκ³Ό μ λ¬Έκ° μμ€μ λ΅λ³μ λ§λμΈμ, λλ΅μ μλ ννλ‘ μμ±νμΈμ
**λ΅λ³ νμ**
[[Q]] μ§μλ¬Έ
[[A]] λ΅λ³
---
{text}"""
def generate_question(text):
prompt = PROMPT_QA.format(text=text)
prompt = [{"content": prompt, "role": "user"}]
inputs = tokenizer.apply_chat_template(prompt, return_tensors="pt", add_generation_prompt=True, tokenize=False)
inputs = inputs.strip()
inputs = tokenizer.encode(inputs, add_special_tokens=False, return_tensors="pt").to(model.device)
outputs = model.generate(input_ids=inputs, max_new_tokens=256, do_sample=True, early_stopping=True, eos_token_id=128009, temperature=1.0)
question = tokenizer.decode(outputs[0, inputs.shape[1]:], skip_special_tokens=True)
return question
for _ in range(5):
question = generate_question(text)
print(question)
```
## μμ± κ²°κ³Ό
```
[[Q]] νκ΅μ λν κ΅μ‘ μμ€ν
μ΄ λ€μν νμκ³Όμ κ³Ό κΈ°κ΄μ ν¬ν¨νλ λ°©μμΌλ‘ ꡬμ±λμ΄ μμ΅λλ€. μ΄μ λ°λΌ λ€μν νμκ³Όμ μ΄ μ‘΄μ¬νλ©°, λνμκ³Όμ κ³Ό νμ¬κ³Όμ , μμ¬κ³Όμ , λ°μ¬κ³Όμ , μγλ°μ¬ν΅ν©κ³Όμ , νμ°μ°νλκ³Όμ , νγμμ¬μ°κ³κ³Όμ , μ λ¬Έκ³Όμ λ±μ΄ ν¬ν¨λμ΄ μμ΅λλ€. μ΄λ¬ν λ€μν νμκ³Όμ κ³Ό κΈ°κ΄μ΄ μ‘΄μ¬νλ μ΄μ μ λν΄ λ¨κ³μ μΌλ‘ μ€λͺ
ν΄ λ³΄μΈμ. λ¨Όμ , κ° νμκ³Όμ κ³Ό κΈ°κ΄μ μ£Όμ λͺ©μ μ μ€λͺ
ν ν, μ΄λ€μ΄ μ‘΄μ¬νλ λ°°κ²½κ³Ό νμμ±μ λν΄ λ
ΌμνμΈμ. κ° κ³Όμ κ³Ό κΈ°κ΄μ΄ μ΄λ»κ² μνΈ λ³΄μμ μ΄κ³ 보κ°μ μν μ μννλμ§ κ΅¬μ²΄μ μΌλ‘ μμ νμΈμ. λ§μ§λ§μΌλ‘, μ΄λ¬ν νμκ³Όμ κ³Ό κΈ°κ΄μ΄ νμλ€μ νμ΅ κ²½νκ³Ό λνμ λͺ©νμ μ΄λ»κ² κΈ°μ¬νλμ§ νκ°ν΄ μ£ΌμΈμ.
[[A]] νμκ³Όμ κ³Ό λν κΈ°κ΄μ λν κ΅μ‘ μμ€ν
μ μ€μν κ΅¬μ± μμλ‘μ λ€μν νμκ³Όμ κ³Ό κΈ°κ΄μ΄ μ‘΄μ¬νλ μ΄μ λ₯Ό μ΄ν΄λ³΄κ² μ΅λλ€.
λ¨Όμ , νμκ³Όμ μ νμ¬, μμ¬, λ°μ¬κ³Όμ μ ν¬ν¨ν λνμκ³Όμ , μγλ°μ¬ν΅ν©κ³Όμ , μ λ¬Έκ³Όμ λ±μ΄ μ‘΄μ¬ν©λλ€. νμκ³Όμ μ νμ
λ° μ°κ΅¬μ νμν κ΅μ‘κ³Όμ μ ν΅ν΄ νμ¬νμ, μμ¬νμ, λ°μ¬νμλ₯Ό μ·¨λν μ μλ κΈ°νλ₯Ό μ 곡ν©λλ€. κ° νμκ³Όμ μ ν΄λΉ λΆμΌμμ μ λ¬Έμ§μμ μ΅λνκ³ νλ¬Έμ μλμ κ°μΆκΈ° μν μ€μν μν μ ν©λλ€. μ΄λ€μ λνμ κ΅μ‘μ μ€μν λΆλΆμ΄λ©°, νμλ€μ΄ νλ¬Έμ μ
μ μ μ΄λ£° μ μλλ‘ λμμ€λλ€.
μ΄μ ν¨κ», λνμ νμ°μ°νλκ³Όμ , νγμμ¬μ°κ³κ³Όμ , νμ°μ°νλκ³Όμ , νγμμ¬μ°κ³κ³Όμ , μ λ¬Έκ³Όμ λ± λ€μν κΈ°κ΄μ μ΄μνκ³ μμ΅λλ€. μ΄λ¬ν λν κΈ°κ΄μ λνμ κ΅μ‘ λ° μ°κ΅¬ λͺ©νλ₯Ό μ§μνκ³ , λ€μν κ΅μ‘κ³Όμ μ μ΄μν¨μΌλ‘μ¨ νμλ€μ νμ΅ κ²½νμ 보μνκ³ νλ¬Έμ μ±μ₯μ μ§μν©λλ€. λνμκ³Όμ κ³Ό νμ¬κ³Όμ , μμ¬κ³Όμ , λ°μ¬κ³Όμ , μγλ°μ¬ν΅ν©κ³Όμ , μ λ¬Έκ³Όμ λ±μ μνΈ λ³΄μμ μ΄κ³ 보κ°μ μΈ μν μ μννμ¬ νμλ€μ΄ λ€μν κ΅μ‘ κ²½νμ μ 곡νκ³ νλ¬Έμ μλμ κ°νν μ μλλ‘ μ§μν©λλ€.
μ΄λ¬ν νμκ³Όμ κ³Ό λν κΈ°κ΄λ€μ΄ μ‘΄μ¬νλ λ°°κ²½μ νμλ€μ νμ΅ κ²½νμ ν₯μμν€κ³ , λνμ κ΅μ‘ λ° μ°κ΅¬ λͺ©νλ₯Ό λ¬μ±νκΈ° μν¨μ
λλ€. νμλ€μ λ€μν νμκ³Όμ κ³Ό κΈ°κ΄μ ν΅ν΄ νλ¬Έμ μ§μμ μ΅λνκ³ μ λ¬Έκ°λ‘μμ μλμ ν€μ°λ©°, λνμ νμλ€μ νμ΅μ μ§μνκ³ νλ¬Έμ λ°μ μ μ΄μ§νλ μν μ μνν©λλ€. λ°λΌμ, νμκ³Όμ κ³Ό λν κΈ°κ΄μ νμλ€μ νμ΅ κ²½νκ³Ό λνμ λͺ©νμ μ€μν κΈ°μ¬λ₯Ό νκ³ μμ΅λλ€. κ° νμκ³Όμ κ³Ό κΈ°κ΄μ μνΈ λ³΄μμ μ΄κ³ 보κ°μ μΌλ‘ μμ©νμ¬ λν κ΅μ‘ μμ€ν
μ νλΆνκ³ ν¨κ³Όμ μΌλ‘ μ΄μνκ³ μμ΅λλ€.
[[Q]] μμ£Όλνκ΅μ λνμκ³Ό κ΄λ ¨λ μ‘°νμ ν¬ν¨ν νμΉμ λΆμνκ³ , λνμκ³Ό κ΄λ ¨λ λ€μν νμ λ° νλ¬Έμ κ²½ν₯μ ꡬ체μ μΌλ‘ μ€λͺ
νμΈμ. λνμ κ³Όμ μμ μ 곡λλ μ°κ΅¬ μ격, νλ¬Έμ μ±μ·¨λ, κ·Έλ¦¬κ³ μ°κ΅¬ μνκ³κ° νμλ€μ μ°κ΅¬ λ₯λ ₯ ν₯μμ λ―ΈμΉλ μν₯μ λν΄ νκ°ν΄ μ£ΌμΈμ. λν, λνμ νμκ° νμλ€μ΄ ν₯ν νλ¬Έμ λ° μ§μ
μ μ±κ³Όμ μ΄λ»κ² κΈ°μ¬ν μ μλμ§μ λν μμμ μμΈν μμ±νμΈμ. λ§μ§λ§μΌλ‘, λνμ κ΅μ‘μ΄ νλ¬Έμ μ λ¬Έμ±κ³Ό μ§μ νμ±μ λ―ΈμΉλ μν₯μ λ
Όμν΄ μ£ΌμΈμ.
[[A]] μμ£Όλνκ΅μ λνμμ λ€μν νμ μ νλ¬Έμ κ²½ν₯μ κ°μ§ λ€μν νλ‘κ·Έλ¨μ μ 곡νκ³ μμ΅λλ€. μ΄ λνμμμ μ 곡λλ νμ¬, μμ¬, λ°μ¬ νμλ νμλ€μκ² μ°κ΅¬ μ격μ λΆμ¬νκ³ νλ¬Έμ μ±μ·¨λ₯Ό μΈμ λ°λ κΈ°νλ₯Ό μ 곡ν©λλ€. λν, λνμ κ³Όμ μ νμλ€μκ² νλ¬Έμ μλμ ν₯μμν€κ³ μ°κ΅¬ λ₯λ ₯μ κΈ°λ₯Ό μ μλ νκ²½μ μ 곡νμ¬ νμλ€μ΄ νλ¬Έμ μ λ¬Έμ±μ ν€μ°λλ° ν° λμμ΄ λ©λλ€.
λνμ κ³Όμ μμ μ 곡λλ μ°κ΅¬ μ격μ νμλ€μκ² νλ¬Έμ μ±μ·¨λ₯Ό μΈμ λ°μ μ μλ κΈ°νλ₯Ό μ 곡ν©λλ€. νμλ€μ μμ λ§μ μ°κ΅¬ μ£Όμ λ₯Ό μ μ νκ³ μ΄λ₯Ό ν΅ν΄ νλ¬Έμ μ±κ³Όλ₯Ό μ΄λ£¨μ΄λ΄λ©° νμ νλμ μν΄ λ
Έλ ₯ν©λλ€. μ΄ κ³Όμ μμ νμλ€μ κ΅μμ§μ μ§λλ₯Ό λ°κ³ μ°κ΅¬λ₯Ό μ§ννλ©°, νλ¬Έμ μΈ ν λ‘ κ³Ό λΉνμ ν΅ν΄ μμ μ μ°κ΅¬μ λν μ¬νλ μ΄ν΄λ₯Ό μμ μ μμ΅λλ€.
λν, λνμ μ°κ΅¬ μνκ³λ νμλ€μ μ°κ΅¬ λ₯λ ₯ ν₯μμ ν° μν₯μ λ―ΈμΉ©λλ€. νμλ€μ λ€μν μ°κ΅¬ νλμ κ²½ννλ©° μ°κ΅¬ λ°©λ²λ‘ μ μ΅λνκ³ , μ°κ΅¬λ₯Ό ν΅ν΄ νλ¬Έμ μλμ ν₯μμν¬ μ μμ΅λλ€. λν, νλ¬Έμ λ
Όμκ³Ό ν λ‘ μ ν΅ν΄ λ€μν κ΄μ μ μμ©νκ³ λΆμνλ λ₯λ ₯μ ν€μ°λ©°, νλ¬Έμ μ λ¬Έμ±μ ꡬμΆν μ μμ΅λλ€.
λνμ νμκ° νμλ€μ΄ ν₯ν νλ¬Έμ λ° μ§μ
μ μ±κ³Όμ λ―ΈμΉλ μν₯μ λ§€μ° ν½λλ€. λνμ νμλ νμλ€μκ² νλ¬Έμ μ λ¬Έμ±κ³Ό νλ¬Έμ μμ§μ μΈμ λ°λ μ격μ λΆμ¬νλ©°, μ΄λ₯Ό ν΅ν΄ νμλ€μ λ―Έλμ νλ¬Έμ κ²½μλ ₯κ³Ό μ§μ
μ μ μ¬λ ₯μ ν보ν μ μμ΅λλ€. λν, λνμ μ‘Έμ
μμ νλ¬Έμ μ λ¬Έμ±κ³Ό μ°κ΅¬ λ₯λ ₯μ λ°νμΌλ‘ νλ¬Έ λΆμΌμμ κ²½μ μ°μλ₯Ό ν보ν μ μμ΅λλ€.
λ§μ§λ§μΌλ‘, λνμ κ΅μ‘μ΄ νλ¬Έμ μ λ¬Έμ±κ³Ό μ§μ νμ±μ λ―ΈμΉλ μν₯μ λ§€μ° μ€μν©λλ€. λνμμ νμλ€μκ² νλ¬Έμ λ°©λ²λ‘ κ³Ό μ΄λ‘ μ κΉμ΄ μκ² μ΄ν΄νκ³ μ°κ΅¬ν μ μλ νκ²½μ μ 곡νμ¬ νμλ€μ΄ νλ¬Έμ μ λ¬Έμ±μ ν€μ°λλ° ν° λμμ μ€λλ€. λν, λνμ κ΅μ‘μ ν΅ν΄ νμλ€μ μλ‘μ΄ μ§μμ μ΅λνκ³ μ§μ νμ±μ κΈ°μ¬νλ©°, νλ¬Έμ λ°μ μ μ΄λ°μ§ν μ μμ΅λλ€. λ°λΌμ, λνμ κ΅μ‘μ νμλ€μ νλ¬Έμ μ±μ₯κ³Ό νλ¬Έμ μ λ¬Έμ±μ λμ΄λ λ° μ€μν μν μ νλ€.
[[Q]] λν ꡬμ±μλ€μ΄ μννλ μ£Όμ μν κ³Ό μ±
μμ λν΄ κ° κ΅¬μ±μμ΄ μμ μ μ§λ¬΄ μνμ μν΄ μ΄λ€ μ λ΅μ μ¬μ©ν μ μλμ§ κ΅¬μ²΄μ μΌλ‘ μ€λͺ
νμμμ€. λν, κ° κ΅¬μ±μμ΄ νλ ₯νκΈ° μν΄ νμν μ μ°¨μ λ°©λ²μ λ¨κ³λ³λ‘ μμ νκ³ , μ΄μ λ°λ₯Έ νλ ₯ λ°©μμ μ μνμμμ€. λ¨, 300μ μ΄λ΄λ‘ μμ±νλ©°, κ° λ¨κ³μ λν ꡬ체μ μΈ μμλ₯Ό ν¬ν¨ν΄μΌ ν©λλ€. λ§μ§λ§μΌλ‘, λνμ μ λ°μ μΈ λͺ©νλ₯Ό λ¬μ±νκΈ° μν νμν¬μ μ€μμ±μ κ°μ‘°νμμμ€.
[[A]] λν ꡬμ±μλ€μ μ΄μ₯, λΆμ΄μ₯, κ° λν, λνμ, μ λ¬Έλνμ, νΉμλνμ, λνκ΅λ³ΈλΆ, λΆμκΈ°κ΄, μ°κ΅¬κΈ°κ΄, μ§μκΈ°κ΄, μ°ννλ ₯λ¨, μλ£μ λ±μ΄ μλ€. κ° κ΅¬μ±μμ μμ μ μν κ³Ό μ±
μμ μννκΈ° μν΄ λ€μν μ λ΅μ μ¬μ©ν μ μλ€. μλ₯Ό λ€μ΄, μ΄μ₯μ λνμ λͺ©νλ₯Ό λ¬μ±νκΈ° μν΄ κ΅λ¬΄λΆμ΄μ₯μ ν΅νμ¬ μ‘°μ§μ μ΄λκ³ , κ° λΆμ΄μ₯μ μ°νλΆμ΄μ₯μ ν΅ν΄ νλ ₯νμ¬ μ
무λ₯Ό μ‘°μ νλ€. λνμκ³Ό μ λ¬Έλνμ, νΉμλνμμ νμ¬, μμ¬, λ°μ¬ νμλ₯Ό ν΅ν΄ μ°κ΅¬ λ° κ΅μ‘μ μννλ©°, λνκ΅λ³ΈλΆλ λ€μν λΆμ²λ₯Ό μ΄μνμ¬ νμ¬κ³Όμ , μμ¬κ³Όμ , λ°μ¬κ³Όμ λ±μ μ§μνλ€. μ΄λ€μ κ°κΈ° λ€λ₯Έ μν κ³Ό μ±
μμ μννλ©΄μ νλ ₯νμ¬ λνμ λͺ©νλ₯Ό λ¬μ±ν μ μλ€. μ΄λ₯Ό μν΄ κ΅¬μ±μλ€μ μ
무 λΆλ΄μ λͺ
νν νκ³ , μ κΈ°μ μΈ νμ λ° μμ¬ μν΅μ ν΅ν΄ μ 보 곡μ λ° λ¬Έμ ν΄κ²°μ μ£Όμν΄μΌ νλ€. νμν¬λ₯Ό ν΅ν΄ μλ‘μ μλμ μ΅λν λ°ννκ³ νλ ₯νμ¬ λνμ λ°μ μ μ΄λμ΄ λκ°μΌ νλ€.
[[Q]] λ³Έ λνκ΅μ μ‘°μ§ κ΅¬μ‘°λ₯Ό κ·μ νλ μ 2μ₯μ λ΄μ©μ λ°νμΌλ‘, λνμ κΈ°κ΄κ³Ό μ§μ λ₯Ό μμΈν μ€λͺ
νμΈμ. κ° κΈ°κ΄κ³Ό μ§μ μ μν λ° κΈ°λ₯μ ꡬ체μ μΌλ‘ κΈ°μ νκ³ , μ£Όμ μ
무μ μ±
μμ ν¬ν¨νμ¬ μ€λͺ
ν΄μ£ΌμΈμ. λ΅λ³μ μ΅μ 300μ μ΄μμΌλ‘ μμ±ν΄ μ£ΌμΈμ. λν, μ΄μ₯κ³Ό λΆμ΄μ₯μ μν μ΄ μ΄λ»κ² μνΈ λ³΄μμ μΌλ‘ μμ©νλμ§μ λν μ€λͺ
λ ν¬ν¨ν΄ μ£ΌμΈμ. μ΅μ’
μ μΌλ‘, κ° κΈ°κ΄μ μν μ λΉκ΅νκ³ λμ‘°νλ μκ°λ μΆκ°ν΄ μ£ΌμΈμ.
[[A]] λ³Έ λνκ΅μ μ‘°μ§ κ΅¬μ‘°λ μ 2μ₯μ λ°λΌ μ΄μ₯, κ΅λ¬΄λΆμ΄μ₯, μ무λΆμ΄μ₯, μ°νλΆμ΄μ₯, λν, μΌλ°λνμ, μ λ¬Έλνμ, νΉμλνμ, νΉμνλΆ, λνκ΅λ³ΈλΆ, λΆμκΈ°κ΄, μ°κ΅¬κΈ°κ΄, μ§μκΈ°κ΄, μμ£Όλνκ΅μ°ννλ ₯λ¨, μλ£μ, μ΄μ₯μ§μ기ꡬ, λΆμ΄μ₯μ§μ기ꡬ λ° νΉλ³κΈ°κ΅¬ λ±μΌλ‘ ꡬμ±λμ΄ μλ€. μ΄μ₯μ κ΅λ¬΄λ₯Ό ν΅ν νκ³ λ³Έ λνκ΅λ₯Ό λννλ©°, κ΅λ¬΄λΆμ΄μ₯μ μ무λΆμ΄μ₯μ μ΄μ₯μ 보μ’νλ μν μ λ΄λΉνλ€. λν, λνκ΅λ³ΈλΆμλ κ΅λ¬΄μ², μ°κ΅¬μ 보μ², νμμ², μ΄λ¬΄μ², κΈ°νμ², μ
νμ², κ΅μ νλ ₯μ² λ±μ΄ μμΌλ©°, κ° μ²μ μ
무λγμμ£Όλνκ΅ μ§μ κ·μ γμ λ°λΌ μ ν΄μ Έ μλ€.
μ΄μ₯κ³Ό λΆμ΄μ₯μ μνΈ λ³΄μμ μΈ μν μ μννλ©°, μ΄μ₯μ κ΅λ¬΄λ₯Ό ν΅ν νκ³ λνμλ‘μμ μν μ λ§‘κ³ , λΆμ΄μ₯μ μ΄μ₯μ μ§μλ₯Ό λ°μ κ°μμ λΆμ²μμ 맑μ μ
무λ₯Ό μννλ€. μ΄μ₯μ΄ κΆμλκ±°λ μ§λ¬΄λ₯Ό μνν μ μλ κ²½μ°μλ λΆμ΄μ₯μ λνμ΄ μ΄λ£¨μ΄μ§λ©°, μ΄λ€μ μ§μνλ μ΄μ₯μ§μ기ꡬλ λΆμ΄μ₯μ§μκΈ°κ΅¬κ° μ‘΄μ¬νλ€.
κ° κΈ°κ΄μ μν μ λΉκ΅νκ³ λμ‘°νλ©΄, κ΅λ¬΄λΆμ΄μ₯μ μ무μ μ°ννλ ₯ μ
무λ₯Ό λ΄λΉνλ λ°λ©΄μ μ무λΆμ΄μ₯μ μ무 μ
무λ₯Ό, μ°νλΆμ΄μ₯μ μ°ννλ ₯ μ
무λ₯Ό μ΄μ₯μκ² λ³΄μ’νλ κ²μΌλ‘ νμΈλλ€. λν, λνκ΅λ³ΈλΆλ κ΅λ¬΄, μ°κ΅¬μ 보, νμ, μ΄λ¬΄, κΈ°ν, μ
ν, κ΅μ νλ ₯ λ±μ λ€μν μ
무λ₯Ό μννλ€.
μ΄λ₯Ό ν΅ν΄ λ³Έ λνκ΅λ λ€μν λΆμ²κ° νλ ₯νμ¬ μ΄μ₯ λ° λΆμ΄μ₯μ ν΅ν΄ ν¨μ¨μ μΌλ‘ μ‘°μ§μ μ΄μνλ©°, κ° κΈ°κ΄μ μν μ λͺ
ννκ² μ ν΄ λμμΌλ‘μ¨ μνν μ
무 μνμ΄ μ΄λ€μ§κ³ μλ€. λν, μ΄μ₯κ³Ό λΆμ΄μ₯μ μνΈ λ³΄μμ μΈ μν μ ν΅ν΄ μ‘°μ§μ μνν μ΄μμ΄ μ΄λ£¨μ΄μ§κ³ μμΌλ©°, κ° κΈ°κ΄μ μν μ λΉκ΅ λ° λμ‘°ν¨μΌλ‘μ¨ μ‘°μ§μ ν¨μ¨μ±μ λμ΄κ³ μλ κ²μ νμΈν μ μλ€.
[[Q]] μ£Όμ΄μ§ κΈμ λ°νμΌλ‘ μμ£Όλνκ΅μ μ‘°μ§ λ° κΈ°κ΄μ λν ꡬ체μ μΈ μ€λͺ
μ μμ½νμΈμ. μ€λͺ
μ 300μ μ΄λ΄λ‘ μμ½ν΄ μ£ΌμΈμ. μ΄μ₯, λΆμ΄μ₯, λνκ΅λ³ΈλΆ, νμνμ΅μ€μ¬λνμΆμ§λ³ΈλΆ, κΈ°κ΄μλͺ
μ€λ¦¬μμν λ±μ μ£Όμ μΈλ¬Όκ³Ό μ‘°μ§μ λν΄ μΈκΈλ μν κ³Ό μ±
μμ μμΈν μ€λͺ
νμΈμ. κ°κ°μ μ‘°μ§μ΄ μ΄λ€ λͺ©μ μ κ°μ§κ³ μκ³ , μ΄λ€ λ°©μμΌλ‘ μ΄μλκ³ μλμ§ λͺ
ννκ² μ λ¬ν΄ μ£ΌμΈμ. κΈμ λ΄μ©μ λ°νμΌλ‘ μΆκ°μ μΈ λ΄μ©μ μΆλ‘ ν΄ λ³΄λλ‘ μ λνλ μ§λ¬Έμ ν¬ν¨ν΄ μ£ΌμΈμ.
[[A]] μμ£Όλνκ΅λ μ΄μ₯μ μ€μ¬μΌλ‘ μ΄μ₯, λΆμ΄μ₯, λνκ΅λ³ΈλΆ, νμνμ΅μ€μ¬λνμΆμ§λ³ΈλΆ, κΈ°κ΄μλͺ
μ€λ¦¬μμν λ±μ λ€μν μΈλ¬Όκ³Ό μ‘°μ§μΌλ‘ ꡬμ±λμ΄ μμ΅λλ€. μ΄μ₯μ κ΅λ¬΄λ₯Ό ν΅ν νκ³ λ³Έ λνκ΅λ₯Ό λννλ©°, λΆμ΄μ₯μ μ΄μ₯μ 보μ’νλ μν μ ν©λλ€. λνκ΅λ³ΈλΆλ κ΅λ¬΄, μ°κ΅¬μ 보, νμ, μ΄λ¬΄, κΈ°ν, μ
ν, κ΅μ νλ ₯ λ± λ€μν μ
무λ₯Ό λ΄λΉνκ³ μμ΅λλ€. νμνμ΅μ€μ¬λνμΆμ§λ³ΈλΆλ νμκ΅μ‘ κ΄λ ¨ μ
무λ₯Ό κ΄ν νλ©°, κΈ°κ΄μλͺ
μ€λ¦¬μμνλ μΈκ°λμμ°κ΅¬ λ° μΈμ²΄μ λλ¬Όμ°κ΅¬μ μ€λ¦¬μ μμ μ λ΄λΉν©λλ€. μ΄λ¬ν μ‘°μ§λ€μ κ°κΈ° λ€λ₯Έ λͺ©μ μ κ°μ§κ³ μ΄μλλ©°, νκ΅μ μ λ°μ μΈ μ΄μκ³Ό μ°κ΅¬, κ΅μ‘μ μ€μν μν μ νκ³ μμ΅λλ€. μ΄λ¬ν μ‘°μ§λ€μ΄ μ΄λ»κ² ν¨μ¨μ μΌλ‘ νλ ₯νκ³ μ΄μλ μ§μ λν μΆκ°μ μΈ μ§λ¬Έμ΄ μ κΈ°λ μ μμ΅λλ€.
(μμ½: 287μ)
μΆκ°μ μΈ μ§λ¬Έ: κ° μ‘°μ§μ΄ μ΄λ€ λ°©μμΌλ‘ νλ ₯νμ¬ νκ΅μ λͺ©νλ₯Ό λ¬μ±ν μ μμμ§ κ΅¬μ²΄μ μΈ μ¬λ‘λ₯Ό λ€μ΄ μ€λͺ
νμΈμ. λν, μ‘°μ§ κ°μ ν¨μ¨μ μΈ νλ ₯ λ°©μμ μ μν΄ λ³΄μΈμ. κ° μ‘°μ§μ μν μ λΉκ΅νμ¬ μ΄λ€ μ μμ μμ΄μ±μ΄ μμΌλ©°, κ·Έ μ°¨μ΄κ° νκ΅μ μ΄μμ μ΄λ€ μν₯μ λ―ΈμΉλμ§ λΆμν΄ λ³΄μΈμ. λ§μ§λ§μΌλ‘, νκ΅μ λ―Έλ λ°μ μ μν μ‘°μ§μ μν κ³Ό μλμ νκ°νμ¬ κ°μ μ μ μ μν΄ λ³΄μΈμ. μ΄λ₯Ό ν΅ν΄ νκ΅μ ν¨μ¨μ μΈ μ‘°μ§ μ΄μμ μν΄ μ΄λ€ μ‘°μΉκ° νμν μ§ λ
ΌμνμΈμ.
```
# Model
- **Developed by:** iknow-lab
- **License:** apache-2.0
- **Finetuned from model :** MLP-KTLim/llama-3-Korean-Bllossom-8B
This llama model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth) |