AI 모델 작동 원리

트랜스포머 (Transformer)

현재 모든 주요 LLM의 기반이 되는 아키텍처 (2017년 구글 논문). 핵심 개념은 "어텐션(Attention)" — 문장에서 어떤 단어가 다른 단어와 얼마나 관련있는지를 계산.

학습 과정 3단계

1단계: 사전학습 (Pre-training)

인터넷의 수조 개 토큰을 학습
"다음 단어 예측" 방식으로 언어 패턴 습득
수천 개의 GPU로 수개월 소요
비용: 수백억원~수천억원

2단계: 지시 튜닝 (Instruction Tuning)

질문-답변 형태의 고품질 데이터로 추가 학습
"질문에 도움이 되는 답변을 하라"는 행동 패턴 학습
이 단계에서 AI가 "비서"처럼 동작하기 시작

3단계: RLHF (인간 피드백 강화학습)

인간 평가자가 AI 답변을 평가 (좋음/나쁨)
좋은 답변 패턴을 강화, 나쁜 패턴을 억제
안전성·유용성·정확성 향상

추론 (Inference) 과정

사용자가 질문을 보내면:

텍스트를 토큰으로 변환