AI 모델 작동 원리
트랜스포머 (Transformer)
현재 모든 주요 LLM의 기반이 되는 아키텍처 (2017년 구글 논문).
핵심 개념은 "어텐션(Attention)" — 문장에서 어떤 단어가 다른 단어와 얼마나 관련있는지를 계산.
학습 과정 3단계
1단계: 사전학습 (Pre-training)
- 인터넷의 수조 개 토큰을 학습
- "다음 단어 예측" 방식으로 언어 패턴 습득
- 수천 개의 GPU로 수개월 소요
- 비용: 수백억원~수천억원
2단계: 지시 튜닝 (Instruction Tuning)
- 질문-답변 형태의 고품질 데이터로 추가 학습
- "질문에 도움이 되는 답변을 하라"는 행동 패턴 학습
- 이 단계에서 AI가 "비서"처럼 동작하기 시작
3단계: RLHF (인간 피드백 강화학습)
- 인간 평가자가 AI 답변을 평가 (좋음/나쁨)
- 좋은 답변 패턴을 강화, 나쁜 패턴을 억제
- 안전성·유용성·정확성 향상
추론 (Inference) 과정
사용자가 질문을 보내면:
- 텍스트를 토큰으로 변환