세션 = 고객 1명과의 대화 전체 (시작 ~ 종료)
고객이 메신저로 첫 메시지를 보낸 시점부터 대화가 종료될 때까지를 1세션으로 정의합니다. 고객 메시지 + AI 응답을 합쳐 1턴이라 합니다.
매 턴마다 전체 대화 히스토리를 다시 전송
시스템 프롬프트 + 이전 대화 전체가 매번 입력으로 전송됩니다. 따라서 후반 턴일수록 비용이 높아집니다.
평균 상담 시나리오 기준 턴별 상세 비용
| 턴 | 입력 토큰 | 출력 토큰 | 입력 비용 | 출력 비용 | 턴 소계 |
|---|---|---|---|---|---|
| 1 | 4,200 | 100 | $0.00105 | $0.00015 | $0.00120 |
| 2 | 4,500 | 100 | $0.00113 | $0.00015 | $0.00128 |
| 3 | 4,900 | 100 | $0.00123 | $0.00015 | $0.00138 |
| 4 | 5,400 | 100 | $0.00135 | $0.00015 | $0.00150 |
| 5 | 6,000 | 100 | $0.00150 | $0.00015 | $0.00165 |
| 6 | 6,700 | 100 | $0.00168 | $0.00015 | $0.00183 |
| 7 | 7,500 | 100 | $0.00188 | $0.00015 | $0.00203 |
| 8 | 8,400 | 100 | $0.00210 | $0.00015 | $0.00225 |
| 합계 | 47,600 | 800 | $0.01190 | $0.00120 | $0.01310 |
Input: $0.25 / 1M tokens
Output: $1.50 / 1M tokens
$1 = ₩1,484 (2026.04.16 기준)
대화 외에 발생하는 분석/요약 API 호출
| 호출 | 입력 | 출력 | 비용 | 발생 조건 |
|---|---|---|---|---|
| 구조화 분석 (JSON Mode) | 3,000 | 500 | $0.0015 | 매 세션 1회 |
| 에스컬레이션 요약 | 5,000 | 1,000 | $0.00275 | 20% 세션만 (가중: $0.00055) |
세션 종료 시 대화 내용을 분석하여 고객 의도, 관심 시술, 전환 점수 등을 JSON으로 구조화합니다. 모든 세션에 1회 발생합니다.
AI가 처리하지 못하는 상담(복잡한 의료 질문, 불만 등)을 담당자에게 전달할 때, 대화 요약을 생성합니다. 전체 세션의 약 20%에서만 발생하므로 가중 비용은 $0.00055입니다.
8턴 평균 상담 기준, 추가 API 호출 포함
상담 유형별 세션 비용 시나리오
| 시나리오 | 평균 턴 | 세션당 비용 | 예시 |
|---|---|---|---|
| 단순 FAQ | 3턴 | ~$0.006 (~₩9) | "가격 얼마?" → 답변 → "감사합니다" |
| 평균 상담 | 8턴 | ~$0.015 (~₩22) | 상세 상담 + 추가 질문 |
| 장기 상담 | 15턴 | ~$0.035 (~₩52) | 여러 시술 비교 + 예약 |
단순 FAQ(3턴) 70%, 상세 상담(8턴) 25%, 장기(15턴) 5%라면 가중 평균 ~$0.010/세션 (~₩15)
세션 규모별 월 운영비 비교
| 항목 | 월 1,000 세션 | 월 10,000 세션 |
|---|---|---|
| AWS 인프라 | ₩100,000 | ₩100,000 |
| Gemini API | ₩22,260 | ₩222,600 |
| LINE | ₩0 | ₩150,000 |
| ₩0 | ₩0 | |
| ₩5,000 | ₩5,000 | |
| 총 운영비 | ₩127,260 | ₩477,600 |
| 세션당 비용 | ₩127 | ₩48 |
AWS 인프라와 메신저 고정 비용은 세션 수에 관계없이 일정합니다. Gemini API 비용만 비례 증가하므로, 세션 수가 많을수록 건당 단가가 급격히 낮아집니다.