📘 Amazon Bedrock – Pricing & Model Improvement

1️⃣ Pricing Options

🔹 On-Demand (즉시 사용, 사용량만큼 결제)

  • 방식: 전기요금처럼 쓴 만큼만 지불 (Pay-as-you-go)
  • 요금 기준
  • 텍스트 모델 → 입력/출력 토큰 수
  • 임베딩 모델 → 입력 토큰 수
  • 이미지 모델 → 생성된 이미지 수
  • 사용 가능 모델: Base Models 전용
  • 장점: 유연성, 사용량 예측이 어려운 경우 적합
  • 단점: 장기간 사용 시 비용 부담 ↑

🔹 Batch Mode (묶음 처리, 최대 50% 할인)

  • 방식: 여러 요청을 한 번에 묶어서 처리 → 결과는 Amazon S3에 단일 파일 저장
  • 할인 혜택: 최대 50% 저렴
  • 장점: 대량 처리에 유리, 비용 절감 효과 큼
  • 단점: 실시간 응답 불가, 결과 지연 발생
  • 적합 상황: 즉각적인 응답 필요 없고, 대량 요청을 처리할 때

🔹 Provisioned Throughput (예약제, 안정적 성능 보장)

  • 방식: 헬스장 정액제처럼 일정 기간(1~6개월 등) 처리 용량 예약
  • 보장 성능: 분당 최대 입력/출력 토큰 수 보장
  • 사용 가능 모델: Base, Fine-tuned, Custom Models
  • 장점: 안정적인 성능 및 용량 확보, 커스텀 모델 사용 가능
  • 단점: 비용 절감 효과는 거의 없음 → 목적은 “성능 보장”

📊 가격 옵션 비교표

옵션결제 방식요금 기준사용 가능 모델장점단점적합한 경우
On-Demand사용한 만큼 결제– 텍스트: 입력/출력 토큰
– 임베딩: 입력 토큰
– 이미지: 생성 수
Base Models 전용유연성 ↑
예측 불가 워크로드 적합
장기 사용 시 비용 ↑가끔 사용 / 사용량 예측 어려움
Batch Mode여러 요청 묶음 처리결과 Amazon S3에 저장Base Models 전용최대 50% 할인
대량 처리 유리
실시간 처리 불가
지연 발생
대량 요청 / 즉각 응답 불필요
Provisioned Throughput일정 기간 용량 예약분당 토큰 처리량 보장Base, Fine-tuned, Custom Models안정적 성능 보장
커스텀 모델 가능
비용 절약 효과 거의 없음커스텀 모델 / 성능 보장 필요

2️⃣ Model Improvement Techniques (저비용 → 고비용)

1. Prompt Engineering

  • 프롬프트 설계 최적화만으로 개선
  • 추가 연산 없음 → 가장 저렴

2. Retrieval Augmented Generation (RAG)

  • 외부 지식 DB(Vector DB) 활용
  • 모델 재학습 없음 → 비용 적음
  • 단, 벡터 DB 구축·운영 비용 발생

RAG = “모델 + 검색기능” → 모델이 모르는 것도 외부에서 찾아서 똑똑하게 답하는 방법이에요.

3. Instruction-based Fine-tuning

  • 라벨링된 데이터로 모델을 특정 지침에 맞게 조정
  • 추가 연산 필요 → 비용 증가

4. Domain Adaptation Fine-tuning

  • 도메인 특화 데이터셋으로 대규모 재학습
  • 데이터 준비 + 연산 집약적 → 가장 비용 높음

3️⃣ Cost Optimization Tips

  • 토큰 수 관리 → 비용 절감의 핵심
  • 프롬프트는 짧고 간결하게
  • 출력도 불필요하게 길지 않게
  • Batch Mode 활용 → 최대 50% 절감
  • 작은 모델 선택 → 일반적으로 더 저렴
  • 하이퍼파라미터(Temperature, Top-K, Top-P) 조정
  • 성능에는 영향 주지만 비용에는 영향 없음

📝 최종 정리 (시험/실무 포인트)

  • On-Demand = 유연성 / Batch = 대량·할인 / Provisioned = 성능 보장
  • 비용 순서: Prompt Engineering < RAG < Instruction Fine-tuning < Domain Adaptation
  • 비용 절감 핵심: 토큰 수 관리 + Batch 활용

Leave a comment