Update README.md
Browse files
README.md
CHANGED
|
@@ -11,6 +11,7 @@ base_model:
|
|
| 11 |
|
| 12 |
`polyglot-ko-1b-txt2sql`์ ํ๊ตญ์ด ์์ฐ์ด ์ง๋ฌธ์ SQL ์ฟผ๋ฆฌ๋ก ๋ณํํ๊ธฐ ์ํด ํ์ธํ๋๋ ํ
์คํธ ์์ฑ ๋ชจ๋ธ์
๋๋ค.
|
| 13 |
๊ธฐ๋ฐ ๋ชจ๋ธ์ [`EleutherAI/polyglot-ko-1.3b`](https://huggingface.co/EleutherAI/polyglot-ko-1.3b)๋ฅผ ์ฌ์ฉํ์ผ๋ฉฐ, LoRA๋ฅผ ํตํด ๊ฒฝ๋ ํ์ธํ๋๋์์ต๋๋ค.
|
|
|
|
| 14 |
|
| 15 |
---
|
| 16 |
|
|
@@ -23,13 +24,33 @@ base_model:
|
|
| 23 |
|
| 24 |
---
|
| 25 |
|
| 26 |
-
## ํ์ต
|
| 27 |
|
| 28 |
๋ชจ๋ธ์ ํ๊ตญ์ด SQL ๋ณํ ํ์คํฌ๋ฅผ ์ํด ์ค๊ณ๋ ์์ฐ์ด ์ง๋ฌธ-์ฟผ๋ฆฌ ํ์ด๋ก ํ์ธํ๋๋์์ต๋๋ค.
|
| 29 |
-
๋ฐ์ดํฐ๋ ๋ค์ ๋ ๊ฐ์ง ์์ค ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ฑ๋์์ต๋๋ค:
|
| 30 |
-
|
| 31 |
- [shangrilar/ko_text2sql](https://huggingface.co/datasets/shangrilar/ko_text2sql) ๋ฐ์ดํฐ์
์ผ๋ถ
|
| 32 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 33 |
|
| 34 |
---
|
| 35 |
|
|
|
|
| 11 |
|
| 12 |
`polyglot-ko-1b-txt2sql`์ ํ๊ตญ์ด ์์ฐ์ด ์ง๋ฌธ์ SQL ์ฟผ๋ฆฌ๋ก ๋ณํํ๊ธฐ ์ํด ํ์ธํ๋๋ ํ
์คํธ ์์ฑ ๋ชจ๋ธ์
๋๋ค.
|
| 13 |
๊ธฐ๋ฐ ๋ชจ๋ธ์ [`EleutherAI/polyglot-ko-1.3b`](https://huggingface.co/EleutherAI/polyglot-ko-1.3b)๋ฅผ ์ฌ์ฉํ์ผ๋ฉฐ, LoRA๋ฅผ ํตํด ๊ฒฝ๋ ํ์ธํ๋๋์์ต๋๋ค.
|
| 14 |
+
ํ์ธํ๋์ ์ฒ์ ํด๋ณธ ๊ธ์ด์ด๊ฐ ์ค์ต์ฉ์ผ๋ก ๋ง๋ ์ฒซ ๋ชจ๋ธ๋ก ์ฑ๋ฅ์ ๋ณด์ฅํ ์ ์์ผ๋ ์ฐธ๊ณ ๋ฐ๋๋๋ค.
|
| 15 |
|
| 16 |
---
|
| 17 |
|
|
|
|
| 24 |
|
| 25 |
---
|
| 26 |
|
| 27 |
+
## ํ์ต ๋ฐ์ดํฐ์
|
| 28 |
|
| 29 |
๋ชจ๋ธ์ ํ๊ตญ์ด SQL ๋ณํ ํ์คํฌ๋ฅผ ์ํด ์ค๊ณ๋ ์์ฐ์ด ์ง๋ฌธ-์ฟผ๋ฆฌ ํ์ด๋ก ํ์ธํ๋๋์์ต๋๋ค.
|
|
|
|
|
|
|
| 30 |
- [shangrilar/ko_text2sql](https://huggingface.co/datasets/shangrilar/ko_text2sql) ๋ฐ์ดํฐ์
์ผ๋ถ
|
| 31 |
+
|
| 32 |
+
- ์ ์ฒ๋ฆฌ: DDL-Question-SQL ๊ตฌ์กฐ๋ก prompt ๊ตฌ์ฑ
|
| 33 |
+
- ํฌ๊ธฐ: ์ฝ 25,000๊ฑด์ DDL + ์์ฐ์ด ์ง๋ฌธ + SQL ์ ๋ต ์
|
| 34 |
+
|
| 35 |
+
---
|
| 36 |
+
|
| 37 |
+
## ํ๊ฐ ๊ฒฐ๊ณผ
|
| 38 |
+
- ํ๊ฐ ๋ฐฉ์: GPT-4.1-nano ๋ชจ๋ธ์๊ฒ gen_sql๊ณผ gt_sql ๋น๊ต ํ ํ๊ฐ ์์ฒญ
|
| 39 |
+
- ํ๊ฐ ๊ธฐ์ค: ๊ฒฐ๊ณผ ๋์ผ ์ฌ๋ถ ๊ธฐ๋ฐ yes/no ํ๋จ (JSON response: {"resolve_yn": "yes"})
|
| 40 |
+
- ํ๊ฐ ๊ฒฐ๊ณผ:
|
| 41 |
+
- **๋ฒ ์ด์ค ๋ชจ๋ธ ์ ํ๋**: 68%
|
| 42 |
+
- **ํ์ธํ๋ ๋ชจ๋ธ ์ ํ๋**: 19%
|
| 43 |
+
|
| 44 |
+
---
|
| 45 |
+
|
| 46 |
+
## ๋ฌธ์ ์
|
| 47 |
+
- ๋ฒ ์ด์ค๋ผ์ธ ๋ชจ๋ธ์ gen_sql์ SQL ์ฟผ๋ฆฌ๋ฅผ ์์ฑํ์ง ๋ชปํ๊ณ , ์ง๋ฌธ์ ๋ฐ๋ณตํ๊ฑฐ๋ ์๋ฏธ ์๋ ํ
์คํธ๋ฅผ ์ถ๋ ฅํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์๋ค.
|
| 48 |
+
- ํ์ธํ๋ ๋ชจ๋ธ์ SQL ํํ๋ฅผ ํ๋ด๋ด๊ธด ํ์ง๋ง, ์กด์ฌํ์ง ์๋ ์ปฌ๋ผ๋ช
์ด๋ ํ
์ด๋ธ๋ช
์ ํฌํจํ๋ ๋ฑ ๋
ผ๋ฆฌ์ ์ผ๋ก ํ๋ฆฐ ์ฟผ๋ฆฌ๋ฅผ ์์ฑํ๋ค.
|
| 49 |
+
|
| 50 |
+
- ํ๊ฐ ๋ชจ๋ธ(GPT-4.1-nano)์ ๋ฒ ์ด์ค๋ผ์ธ ๋ชจ๋ธ์ด ์๋ชป ์์ฑํ ์ฟผ๋ฆฌ์ ๋ํด "resolve_yn": "yes"๋ผ๊ณ ์๋ชป ํ๋จํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์๋ค.
|
| 51 |
+
- ์๋ฅผ ๋ค์ด, gen_sql์ด SQL ํ์์ ์ ํ ๋ฐ๋ฅด์ง ์๋๋ผ๋ resolve_yn = yes๋ก ์๋ชป ํ๊ฐ๋๋ ๊ฒฝ์ฐ๊ฐ ์์๋ค.
|
| 52 |
+
- ์ปฌ๋ผ๋ช
๋ฐ ํ
์ด๋ธ๋ช
์ด ์กด์ฌํ์ง ์๊ฑฐ๋ ์๋ชป๋ ์ฟผ๋ฆฌ์์๋ resolve_yn = yes๋ก ์๋ชป ๋ถ๋ฅ๋ ๊ฒฝ์ฐ๊ฐ ์กด์ฌํ๋ค.
|
| 53 |
+
- ํ๊ฐ์(GPT ๋ชจ๋ธ)๋ ๋ฌธ๋ฒ์ ํ๋น์ฑ์ด๋ ํ
์ด๋ธ ๊ตฌ์กฐ ๋ฐ์ ์ฌ๋ถ๋ฅผ ์ ๋๋ก ํ๋จํ์ง ๋ชปํ๊ณ , ๋จ์ ํ
์คํธ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐํด ํ๋ณํ๋ ๊ฒฝํฅ์ ๋ณด์๋ค.
|
| 54 |
|
| 55 |
---
|
| 56 |
|