AI 모델 작동 원리

트랜스포머 (Transformer)

현재 모든 주요 LLM의 기반이 되는 아키텍처 (2017년 구글 논문). 핵심 개념은 "어텐션(Attention)" — 문장에서 어떤 단어가 다른 단어와 얼마나 관련있는지를 계산.

학습 과정 3단계

1단계: 사전학습 (Pre-training)

2단계: 지시 튜닝 (Instruction Tuning)

3단계: RLHF (인간 피드백 강화학습)

추론 (Inference) 과정

사용자가 질문을 보내면:

  1. 텍스트를 토큰으로 변환