์ •๋ณด

GPT ์‹œ๋ฆฌ์ฆˆ ๋…ผ๋ฌธ ์ •๋ฆฌ (GPT-1 ~ GPT-4)

ERDA 2025. 5. 30. 02:29

 

๐Ÿ“˜ 1. GPT-1

โ–ช๏ธ ๋…ผ๋ฌธ ์ œ๋ชฉ

Improving Language Understanding by Generative Pre-Training

โ–ช๏ธ ๋ฐœํ‘œ ์—ฐ๋„

2018๋…„ (OpenAI)

โ–ช๏ธ ํ•œ๊ธ€ ์š”์•ฝ

  • GPT์˜ ์‹œ์ž‘์ . "์ƒ์„ฑ ๊ธฐ๋ฐ˜ ์‚ฌ์ „ํ•™์Šต(Generative Pre-Training)"์ด๋ผ๋Š” ๊ฐœ๋…์„ ์ฒ˜์Œ ๋„์ž….
  • ๋จผ์ € ๋Œ€๊ทœ๋ชจ ๋ง๋ญ‰์น˜๋กœ ๋ฌธ์žฅ ๊ตฌ์กฐ๋ฅผ **๋น„์ง€๋„ํ•™์Šต(pretraining)**ํ•œ ํ›„,
    ๊ตฌ์ฒด์ ์ธ ๊ณผ์ œ์— ๋Œ€ํ•ด **์ง€๋„ํ•™์Šต(finetuning)**์„ ์ˆ˜ํ–‰ํ•จ.
  • ์‚ฌ์šฉ ๋ฐ์ดํ„ฐ: BookCorpus (์ฑ… ๊ธฐ๋ฐ˜ ๋ง๋ญ‰์น˜, ์•ฝ 7์ฒœ๋งŒ ๋ฌธ์žฅ)
  • ๊ตฌ์กฐ: ํŠธ๋žœ์Šคํฌ๋จธ ๋””์ฝ”๋”(Transformer Decoder) ๊ธฐ๋ฐ˜
  • ์„ฑ๋Šฅ ๊ฐœ์„  ํฌ์ธํŠธ: ์‚ฌ์ „ํ•™์Šต๋งŒ์œผ๋กœ๋„ ๋‹ค์–‘ํ•œ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๊ณผ์ œ์—์„œ ํ–ฅ์ƒ๋œ ์„ฑ๋Šฅ ํ™•์ธ

 

 

๐Ÿ“™ 2. GPT-2

โ–ช๏ธ ๋…ผ๋ฌธ ์ œ๋ชฉ

Language Models are Unsupervised Multitask Learners

โ–ช๏ธ ๋ฐœํ‘œ ์—ฐ๋„

2019๋…„ (OpenAI)

โ–ช๏ธ ํ•œ๊ธ€ ์š”์•ฝ

  • ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋ฅผ ํฌ๊ฒŒ ํ™•์žฅํ•œ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ (์ตœ๋Œ€ 15์–ต ๊ฐœ ํŒŒ๋ผ๋ฏธํ„ฐ)
  • WebText๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ›ˆ๋ จ (์›น์—์„œ ์ˆ˜์ง‘ํ•œ ๊ณ ํ’ˆ์งˆ ํ…์ŠคํŠธ)
  • ์‚ฌ์ „ํ•™์Šต๋งŒ์œผ๋กœ๋„ ๋ฒˆ์—ญ, ์š”์•ฝ, ์งˆ์˜์‘๋‹ต ๋“ฑ ๋‹ค์–‘ํ•œ ์ž‘์—… ๊ฐ€๋Šฅํ•จ์„ ๋ณด์—ฌ์คŒ
  • ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ์ฃผ์žฅ: "๋ณ„๋„์˜ ํƒœ์Šคํฌ ํ•™์Šต ์—†์ด๋„ ๋‹ค์ค‘์ž‘์—…์„ ํ•  ์ˆ˜ ์žˆ๋‹ค"
  • ์•…์šฉ ์šฐ๋ ค๋กœ ์ธํ•ด ์ „์ฒด ๋ชจ๋ธ ๊ณต๊ฐœ๊ฐ€ ํ•œ๋™์•ˆ ๋ณด๋ฅ˜๋จ (ํ™”์ œ์˜ ์ค‘์‹ฌ)

 

 

๐Ÿ“— 3. GPT-3

โ–ช๏ธ ๋…ผ๋ฌธ ์ œ๋ชฉ

Language Models are Few-Shot Learners

โ–ช๏ธ ๋ฐœํ‘œ ์—ฐ๋„

2020๋…„ (OpenAI)

โ–ช๏ธ ํ•œ๊ธ€ ์š”์•ฝ

  • GPT-2๋ณด๋‹ค ํ›จ์”ฌ ๋” ํฐ 1750์–ต ๊ฐœ ํŒŒ๋ผ๋ฏธํ„ฐ
  • ์‚ฌ์ „ํ•™์Šต๋งŒ์œผ๋กœ ๋‹ค์–‘ํ•œ ๋ฌธ์ œ ํ•ด๊ฒฐ ๊ฐ€๋Šฅ:
    • Zero-shot: ์˜ˆ์‹œ ์—†์ด๋„ ๋ฌธ์ œ ํ•ด๊ฒฐ
    • One-shot: ์˜ˆ์‹œ 1๊ฐœ
    • Few-shot: ์˜ˆ์‹œ ๋ช‡ ๊ฐœ๋งŒ ์ œ์‹œ
  • ๊ธฐ์กด์˜ ๋ณต์žกํ•œ ํ•™์Šต ๊ณผ์ • ์—†์ด๋„ ๊ฐ„๋‹จํ•œ ๋ฌธ์žฅ ๋ช‡ ๊ฐœ๋กœ ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Œ
  • GPT์˜ ๋Œ€์ค‘์  ์ธ์ง€๋„๋ฅผ ๋†’์ด๋Š” ๊ณ„๊ธฐ๊ฐ€ ๋œ ๋ชจ๋ธ
  • ์—ฌ์ „ํžˆ ํŠธ๋žœ์Šคํฌ๋จธ ๋””์ฝ”๋” ๊ธฐ๋ฐ˜
  • OpenAI API๋ฅผ ํ†ตํ•ด ์ƒ์šฉํ™”๊ฐ€ ์‹œ์ž‘๋จ (ChatGPT์˜ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ)

 

 

๐Ÿ“• 4. GPT-4

โ–ช๏ธ ๋ฌธ์„œ ์ œ๋ชฉ

GPT-4 Technical Report

โ–ช๏ธ ๋ฐœํ‘œ ์—ฐ๋„

2023๋…„ (OpenAI)

โ–ช๏ธ ํ•œ๊ธ€ ์š”์•ฝ

  • GPT-3.5 ๋Œ€๋น„ ๋” ์ •๋ฐ€ํ•˜๊ณ , ๋” ์•ˆ์ „ํ•˜๊ณ , ๋” ์ฐฝ์˜์ 
  • ์ž…๋ ฅ์œผ๋กœ ํ…์ŠคํŠธ + ์ด๋ฏธ์ง€๋ฅผ ๋ฐ›์„ ์ˆ˜ ์žˆ๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ธฐ๋Šฅ ํƒ‘์žฌ
  • ๋” ๊ธด ๋งฅ๋ฝ ์ดํ•ด (์ตœ๋Œ€ ์ˆ˜์‹ญ๋งŒ ํ† ํฐ)
  • ์ •ํ™•๋„์™€ ํŽธํ–ฅ ๊ฐ์†Œ๋ฅผ ์œ„ํ•œ ์•ˆ์ „์„ฑ ํ–ฅ์ƒ ๊ฐ•์กฐ
  • ๋…ผ๋ฌธ ์ˆ˜์ค€์˜ ์ƒ์„ธ ์ •๋ณด๋Š” ๋ฏธ๊ณต๊ฐœ (๋น„๊ณต๊ฐœ ๋ชจ๋ธ ์„ธ๋ถ€ ์‚ฌ์–‘)

 

 

๐Ÿ“Œ ์ด์ •๋ฆฌ ํ‘œ (๋น„๊ต)

GPT-1 2018 1.1์–ต ๋น„์ง€๋„ ์‚ฌ์ „ํ•™์Šต + ์ง€๋„ ๋ฏธ์„ธ์กฐ์ • ๊ตฌ์กฐ ์ œ์•ˆ
GPT-2 2019 ์ตœ๋Œ€ 15์–ต ๋‹ค์ค‘ ์ž‘์—… ์ˆ˜ํ–‰ ๊ฐ€๋Šฅ, ๊ณต๊ฐœ ๋…ผ๋ž€
GPT-3 2020 1750์–ต Few-shot ํ•™์Šต ๊ฐœ๋… ํ™•๋ฆฝ, ์ƒ์šฉํ™” ์‹œ์ž‘
GPT-4 2023 ๋น„๊ณต๊ฐœ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ, ๊ณ ์„ฑ๋Šฅ, ์•ˆ์ „์„ฑ ๊ฐ•ํ™”