API 비용 = 인풋 토큰 × 인풋 단가 + 아웃풋 토큰 × 아웃풋 단가 토큰을 줄이면 비용이 직접 줄어듦
나쁜 예: "안녕하세요, 저는 튜나PD인데요, 제가 운영하는 dwlifelog.com 블로그에 올릴 글을 하나 작성해 주시면 감사하겠습니다. 주제는 '아침 운동의 효과'로 해주시고, SEO를 고려해서 작성해 주시면 좋겠습니다."
좋은 예: "dwlifelog.com용 블로그 글 작성. 주제: '아침 운동의 효과'. SEO 최적화 포함."
→ 토큰 50% 이상 절감, 결과 품질은 동일
SOUL.md가 너무 길면 매 호출마다 토큰 소모. 핵심 지시만 남기고, 상세 규칙은 필요한 대화에서만 추가.
이전 대화 전체를 매번 보내지 않기. 관련 있는 최근 2~3턴만 포함.
한국어 "이 글을 요약해 주세요" → ~10 토큰 영어 "Summarize this" → ~3 토큰 프롬프트를 영어로 쓰고 "답변은 한국어로" 추가 시 토큰 절약
"3줄로 요약해 줘" "표로 정리해 줘" "핵심 키워드 5개만" → 불필요한 장문 답변 방지
API 호출 시 최대 출력 토큰 제한 가능. 짧은 답변이 필요하면 max_tokens=500으로 설정.