File size: 2,622 Bytes
4a51346
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
{
 "cells": [
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 이 λ¬Έμ„œλ₯Ό μˆ˜μ •ν•  λ‹Ήμ‹ μ—κ²Œ...\n",
    "#### ν˜„μž¬ 상황은 μ•„λž˜μ™€ κ°™μŠ΅λ‹ˆλ‹€.\n",
    "1. Assistant와 Agent의 μ„±λŠ₯ 츑정을 μœ„ν•΄μ„œλŠ” 이에 λŒ€ν•œ evaluation μ œμž‘μ΄ ν•„μš”ν•©λ‹ˆλ‹€.\n",
    "\n",
    "#### λ‹Ήμ‹ μ˜ λͺ©ν‘œλŠ” μ•„λž˜μ™€ κ°™μŠ΅λ‹ˆλ‹€.\n",
    "1. [generate dialog λ…ΈνŠΈλΆ](generate_dialog.ipynb)μ—μ„œ μƒμ„±λœ λŒ€ν™” 데이터셋을 λ°›μ•„μ„œ Assistant에 λŒ€ν•œ evaluation set을 κ΅¬μ„±ν•©λ‹ˆλ‹€.\n",
    "2. Agent의 evaluation을 μˆ˜ν–‰ν•  수 μžˆλŠ” 방법을 μƒκ°ν•˜κ³ , evaluation set을 μ œμž‘ν•©λ‹ˆλ‹€.(Toolμ—μ„œ 데이터λ₯Ό 잘 λΉΌμ˜€λŠ”μ§€μ— λŒ€ν•œ evaluation이 λ”°λ‘œ ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.)\n",
    "\n",
    "\n",
    "#### 생각할 수 μžˆλŠ” ν•΄κ²° 방식은 μ•„λž˜μ™€ κ°™μŠ΅λ‹ˆλ‹€.\n",
    "문제 1에 λŒ€ν•˜μ—¬...\n",
    "1. Format μ„€μ •\n",
    "μ–΄λ–€ format으둜 evaluation을 μž‘μ„±ν• μ§€ λ¨Όμ € μƒκ°ν•©λ‹ˆλ‹€. μ•„λž˜λŠ” format의 μ˜ˆμ‹œμž…λ‹ˆλ‹€.\n",
    "```\n",
    "conversation_history:\n",
    "   μ΄μš°μ„ : μ•ˆλ…•ν•˜μ„Έμš”! μ €λŠ” μ΄μš°μ„ μ΄λΌκ³  ν•©λ‹ˆλ‹€. 와인에 λŒ€ν•΄ κΆκΈˆν•œ 점이 μžˆμœΌμ‹œλ©΄ μ–Έμ œλ“ μ§€ λ¬Όμ–΄λ³΄μ„Έμš”! 😊\n",
    "    User: 와인 μΆ”μ²œν•΄μ£Όμ„Έμš” \n",
    "    μ΄μš°μ„ : μ’‹μ•„μš”! 와인 μΆ”μ²œμ„ μœ„ν•΄ λͺ‡ 가지 μ§ˆλ¬Έμ„ λ“œλ¦¬κ² μŠ΅λ‹ˆλ‹€. λ¨Όμ €, μ–΄λ–€ μ’…λ₯˜μ˜ 와인을 μ„ ν˜Έν•˜μ‹œλ‚˜μš”?\n",
    "    User: λ ˆλ“œ μ™€μΈμ΄μš” \n",
    "Answer: 2\n",
    "```\n",
    "2. LLM ν™œμš©ν•˜κΈ°\n",
    "LLM이 μ΄λŸ¬ν•œ annotation을 ν•˜λŠ”λ° νŠΉν™”λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. LLM을 ν™œμš©ν•˜μ—¬ 일단 μ œμž‘ν•œ 이후 μ‚¬λžŒμ΄ κ²€μˆ˜ν•˜λŠ” 방식을 μ‚¬μš©ν•˜λ©΄ λΉ λ₯Έ μˆ˜ν–‰μ΄ 될 것 으둜 μƒκ°λ©λ‹ˆλ‹€.\n",
    "\n",
    "assistant 단계가 확정지어지고, λŒ€ν™” 데이터셋 생성이 마무리 된 후에 이λ₯Ό μˆ˜ν–‰ν•  수 μžˆμ„ λ“― ν•©λ‹ˆλ‹€.\n",
    "\n",
    "\n",
    "#### μ°Έκ³  사항\n",
    "μ•„λž˜ 논문은 직접적이진 μ•Šμ§€λ§Œ λΉ„μ‹Ό μ‚¬λžŒ λ°μ΄ν„°λŒ€μ‹  μ–Έμ–΄λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬ 데이터λ₯Ό μˆ˜μ§‘ν•˜λŠ” 방식에 근간이 된 λ…Όλ¬Έμž…λ‹ˆλ‹€. 이 논문이 도움이 될 μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€. \n",
    "- [Self-Instruct: Aligning Language Models with Self-Generated Instructions](https://arxiv.org/pdf/2212.10560.pdf)\n",
    "\n",
    "μΆ”κ°€λ‘œ μ΄λŸ¬ν•œ μž‘μ—…μ„ ν•˜λŠ” 방식에 λŒ€ν•œ 논문도 λ§Žμ„ κ²ƒμœΌλ‘œ μƒκ°λ˜λ‹ˆ 논문을 λ¨Όμ € μ°Ύμ•„λ³΄λŠ” 것도 μ’‹μŠ΅λ‹ˆλ‹€."
   ]
  }
 ],
 "metadata": {
  "language_info": {
   "name": "python"
  },
  "orig_nbformat": 4
 },
 "nbformat": 4,
 "nbformat_minor": 2
}