๐ 1. GPT-1
โช๏ธ ๋ ผ๋ฌธ ์ ๋ชฉ
Improving Language Understanding by Generative Pre-Training
โช๏ธ ๋ฐํ ์ฐ๋
2018๋ (OpenAI)
โช๏ธ ํ๊ธ ์์ฝ
- GPT์ ์์์ . "์์ฑ ๊ธฐ๋ฐ ์ฌ์ ํ์ต(Generative Pre-Training)"์ด๋ผ๋ ๊ฐ๋ ์ ์ฒ์ ๋์ .
- ๋จผ์ ๋๊ท๋ชจ ๋ง๋ญ์น๋ก ๋ฌธ์ฅ ๊ตฌ์กฐ๋ฅผ **๋น์ง๋ํ์ต(pretraining)**ํ ํ,
๊ตฌ์ฒด์ ์ธ ๊ณผ์ ์ ๋ํด **์ง๋ํ์ต(finetuning)**์ ์ํํจ. - ์ฌ์ฉ ๋ฐ์ดํฐ: BookCorpus (์ฑ ๊ธฐ๋ฐ ๋ง๋ญ์น, ์ฝ 7์ฒ๋ง ๋ฌธ์ฅ)
- ๊ตฌ์กฐ: ํธ๋์คํฌ๋จธ ๋์ฝ๋(Transformer Decoder) ๊ธฐ๋ฐ
- ์ฑ๋ฅ ๊ฐ์ ํฌ์ธํธ: ์ฌ์ ํ์ต๋ง์ผ๋ก๋ ๋ค์ํ ์์ฐ์ด ์ฒ๋ฆฌ ๊ณผ์ ์์ ํฅ์๋ ์ฑ๋ฅ ํ์ธ
๐ 2. GPT-2
โช๏ธ ๋ ผ๋ฌธ ์ ๋ชฉ
Language Models are Unsupervised Multitask Learners
โช๏ธ ๋ฐํ ์ฐ๋
2019๋ (OpenAI)
โช๏ธ ํ๊ธ ์์ฝ
- ํ๋ผ๋ฏธํฐ ์๋ฅผ ํฌ๊ฒ ํ์ฅํ ๋๊ท๋ชจ ๋ชจ๋ธ (์ต๋ 15์ต ๊ฐ ํ๋ผ๋ฏธํฐ)
- WebText๋ผ๋ ์๋ก์ด ๋ฐ์ดํฐ์ ์ผ๋ก ํ๋ จ (์น์์ ์์งํ ๊ณ ํ์ง ํ ์คํธ)
- ์ฌ์ ํ์ต๋ง์ผ๋ก๋ ๋ฒ์ญ, ์์ฝ, ์ง์์๋ต ๋ฑ ๋ค์ํ ์์ ๊ฐ๋ฅํจ์ ๋ณด์ฌ์ค
- ๋ ผ๋ฌธ์ ํต์ฌ ์ฃผ์ฅ: "๋ณ๋์ ํ์คํฌ ํ์ต ์์ด๋ ๋ค์ค์์ ์ ํ ์ ์๋ค"
- ์ ์ฉ ์ฐ๋ ค๋ก ์ธํด ์ ์ฒด ๋ชจ๋ธ ๊ณต๊ฐ๊ฐ ํ๋์ ๋ณด๋ฅ๋จ (ํ์ ์ ์ค์ฌ)
๐ 3. GPT-3
โช๏ธ ๋ ผ๋ฌธ ์ ๋ชฉ
Language Models are Few-Shot Learners
โช๏ธ ๋ฐํ ์ฐ๋
2020๋ (OpenAI)
โช๏ธ ํ๊ธ ์์ฝ
- GPT-2๋ณด๋ค ํจ์ฌ ๋ ํฐ 1750์ต ๊ฐ ํ๋ผ๋ฏธํฐ
- ์ฌ์ ํ์ต๋ง์ผ๋ก ๋ค์ํ ๋ฌธ์ ํด๊ฒฐ ๊ฐ๋ฅ:
- Zero-shot: ์์ ์์ด๋ ๋ฌธ์ ํด๊ฒฐ
- One-shot: ์์ 1๊ฐ
- Few-shot: ์์ ๋ช ๊ฐ๋ง ์ ์
- ๊ธฐ์กด์ ๋ณต์กํ ํ์ต ๊ณผ์ ์์ด๋ ๊ฐ๋จํ ๋ฌธ์ฅ ๋ช ๊ฐ๋ก ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์
- GPT์ ๋์ค์ ์ธ์ง๋๋ฅผ ๋์ด๋ ๊ณ๊ธฐ๊ฐ ๋ ๋ชจ๋ธ
- ์ฌ์ ํ ํธ๋์คํฌ๋จธ ๋์ฝ๋ ๊ธฐ๋ฐ
- OpenAI API๋ฅผ ํตํด ์์ฉํ๊ฐ ์์๋จ (ChatGPT์ ๊ธฐ๋ฐ ๋ชจ๋ธ)
๐ 4. GPT-4
โช๏ธ ๋ฌธ์ ์ ๋ชฉ
GPT-4 Technical Report
โช๏ธ ๋ฐํ ์ฐ๋
2023๋ (OpenAI)
โช๏ธ ํ๊ธ ์์ฝ
- GPT-3.5 ๋๋น ๋ ์ ๋ฐํ๊ณ , ๋ ์์ ํ๊ณ , ๋ ์ฐฝ์์
- ์ ๋ ฅ์ผ๋ก ํ ์คํธ + ์ด๋ฏธ์ง๋ฅผ ๋ฐ์ ์ ์๋ ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ๋ฅ ํ์ฌ
- ๋ ๊ธด ๋งฅ๋ฝ ์ดํด (์ต๋ ์์ญ๋ง ํ ํฐ)
- ์ ํ๋์ ํธํฅ ๊ฐ์๋ฅผ ์ํ ์์ ์ฑ ํฅ์ ๊ฐ์กฐ
- ๋ ผ๋ฌธ ์์ค์ ์์ธ ์ ๋ณด๋ ๋ฏธ๊ณต๊ฐ (๋น๊ณต๊ฐ ๋ชจ๋ธ ์ธ๋ถ ์ฌ์)
๐ ์ด์ ๋ฆฌ ํ (๋น๊ต)
GPT-1 | 2018 | 1.1์ต | ๋น์ง๋ ์ฌ์ ํ์ต + ์ง๋ ๋ฏธ์ธ์กฐ์ ๊ตฌ์กฐ ์ ์ |
GPT-2 | 2019 | ์ต๋ 15์ต | ๋ค์ค ์์ ์ํ ๊ฐ๋ฅ, ๊ณต๊ฐ ๋ ผ๋ |
GPT-3 | 2020 | 1750์ต | Few-shot ํ์ต ๊ฐ๋ ํ๋ฆฝ, ์์ฉํ ์์ |
GPT-4 | 2023 | ๋น๊ณต๊ฐ | ๋ฉํฐ๋ชจ๋ฌ, ๊ณ ์ฑ๋ฅ, ์์ ์ฑ ๊ฐํ |