LLM이란?
한 줄 정의
대규모 텍스트 데이터를 학습한 AI 모델로, 사람처럼 텍스트를 이해하고 생성하는 기술
쉬운 비유
"수십억 권의 책을 읽고 요약·번역·작문·분석을 할 수 있는 초고속 비서"
작동 원리 (초간단)
- 학습 단계: 인터넷의 방대한 텍스트(웹페이지, 책, 논문 등)를 읽고 언어 패턴을 학습
- 추론 단계: 사용자가 질문(프롬프트)을 보내면, 학습된 패턴을 바탕으로 가장 적절한 다음 단어를 예측하며 답변 생성
- 피드백 단계: 인간 피드백(RLHF)으로 답변 품질을 개선
LLM의 한계
- 학습 데이터 이후의 최신 정보를 모름 (→ RAG로 해결)
- 사실이 아닌 내용을 자신있게 말할 수 있음 (할루시네이션)
- 수학 계산이나 정확한 숫자에 약함
- 이미지·영상 등 멀티모달은 별도 학습 필요
주요 LLM 제공사
| 회사 |
대표 모델 |
특징 |
| OpenAI |
GPT-4o, o1 |
가장 대중적, 범용성 높음 |
| Anthropic |
Claude 4 시리즈 |
안전성 강조, 긴 컨텍스트 |
| Google |
Gemini 2.5 |
검색 연동, 멀티모달 강점 |
| Meta |
Llama 3.2 |
오픈소스, 로컬 실행 가능 |
| Mistral |
Mistral, Mixtral |
유럽 기반 오픈소스 |
튜나PD에게 중요한 포인트
- 현재 제갈량은 Gemini 2.5 Flash를 메인으로 사용 중
- 모든 사업의 콘텐츠 생성·분석·자동화에 LLM 활용 가능
- 모델마다 장단점이 다르므로 용도별 선택이 핵심