📘 Amazon Bedrock – Pricing & Model Improvement
1️⃣ Pricing Options
🔹 On-Demand (즉시 사용, 사용량만큼 결제)
- 방식: 전기요금처럼 쓴 만큼만 지불 (Pay-as-you-go)
- 요금 기준
- 텍스트 모델 → 입력/출력 토큰 수
- 임베딩 모델 → 입력 토큰 수
- 이미지 모델 → 생성된 이미지 수
- 사용 가능 모델: Base Models 전용
- ✅ 장점: 유연성, 사용량 예측이 어려운 경우 적합
- ❌ 단점: 장기간 사용 시 비용 부담 ↑
🔹 Batch Mode (묶음 처리, 최대 50% 할인)
- 방식: 여러 요청을 한 번에 묶어서 처리 → 결과는 Amazon S3에 단일 파일 저장
- 할인 혜택: 최대 50% 저렴
- ✅ 장점: 대량 처리에 유리, 비용 절감 효과 큼
- ❌ 단점: 실시간 응답 불가, 결과 지연 발생
- 적합 상황: 즉각적인 응답 필요 없고, 대량 요청을 처리할 때
🔹 Provisioned Throughput (예약제, 안정적 성능 보장)
- 방식: 헬스장 정액제처럼 일정 기간(1~6개월 등) 처리 용량 예약
- 보장 성능: 분당 최대 입력/출력 토큰 수 보장
- 사용 가능 모델: Base, Fine-tuned, Custom Models
- ✅ 장점: 안정적인 성능 및 용량 확보, 커스텀 모델 사용 가능
- ❌ 단점: 비용 절감 효과는 거의 없음 → 목적은 “성능 보장”
📊 가격 옵션 비교표
| 옵션 | 결제 방식 | 요금 기준 | 사용 가능 모델 | 장점 | 단점 | 적합한 경우 |
|---|---|---|---|---|---|---|
| On-Demand | 사용한 만큼 결제 | – 텍스트: 입력/출력 토큰 – 임베딩: 입력 토큰 – 이미지: 생성 수 | Base Models 전용 | 유연성 ↑ 예측 불가 워크로드 적합 | 장기 사용 시 비용 ↑ | 가끔 사용 / 사용량 예측 어려움 |
| Batch Mode | 여러 요청 묶음 처리 | 결과 Amazon S3에 저장 | Base Models 전용 | 최대 50% 할인 대량 처리 유리 | 실시간 처리 불가 지연 발생 | 대량 요청 / 즉각 응답 불필요 |
| Provisioned Throughput | 일정 기간 용량 예약 | 분당 토큰 처리량 보장 | Base, Fine-tuned, Custom Models | 안정적 성능 보장 커스텀 모델 가능 | 비용 절약 효과 거의 없음 | 커스텀 모델 / 성능 보장 필요 |
2️⃣ Model Improvement Techniques (저비용 → 고비용)
1. Prompt Engineering
- 프롬프트 설계 최적화만으로 개선
- 추가 연산 없음 → 가장 저렴
2. Retrieval Augmented Generation (RAG)
- 외부 지식 DB(Vector DB) 활용
- 모델 재학습 없음 → 비용 적음
- 단, 벡터 DB 구축·운영 비용 발생
RAG = “모델 + 검색기능” → 모델이 모르는 것도 외부에서 찾아서 똑똑하게 답하는 방법이에요.
3. Instruction-based Fine-tuning
- 라벨링된 데이터로 모델을 특정 지침에 맞게 조정
- 추가 연산 필요 → 비용 증가
4. Domain Adaptation Fine-tuning
- 도메인 특화 데이터셋으로 대규모 재학습
- 데이터 준비 + 연산 집약적 → 가장 비용 높음
3️⃣ Cost Optimization Tips
- 토큰 수 관리 → 비용 절감의 핵심
- 프롬프트는 짧고 간결하게
- 출력도 불필요하게 길지 않게
- Batch Mode 활용 → 최대 50% 절감
- 작은 모델 선택 → 일반적으로 더 저렴
- 하이퍼파라미터(Temperature, Top-K, Top-P) 조정
- 성능에는 영향 주지만 비용에는 영향 없음
📝 최종 정리 (시험/실무 포인트)
- On-Demand = 유연성 / Batch = 대량·할인 / Provisioned = 성능 보장
- 비용 순서: Prompt Engineering < RAG < Instruction Fine-tuning < Domain Adaptation
- 비용 절감 핵심: 토큰 수 관리 + Batch 활용
Leave a comment