Code & Coffee: Real Life, Real Tech

(12) AWS Certified AI Practitioner Study Guide – Pricing Models & Continuous Model Improvement (비용 관리 & 모델 개선)

📘 Amazon Bedrock – Pricing & Model Improvement

1️⃣ Pricing Options

🔹 On-Demand (즉시 사용, 사용량만큼 결제)

방식: 전기요금처럼 쓴 만큼만 지불 (Pay-as-you-go)
요금 기준
텍스트 모델 → 입력/출력 토큰 수
임베딩 모델 → 입력 토큰 수
이미지 모델 → 생성된 이미지 수
사용 가능 모델: Base Models 전용
✅ 장점: 유연성, 사용량 예측이 어려운 경우 적합
❌ 단점: 장기간 사용 시 비용 부담 ↑

🔹 Batch Mode (묶음 처리, 최대 50% 할인)

방식: 여러 요청을 한 번에 묶어서 처리 → 결과는 Amazon S3에 단일 파일 저장
할인 혜택: 최대 50% 저렴
✅ 장점: 대량 처리에 유리, 비용 절감 효과 큼
❌ 단점: 실시간 응답 불가, 결과 지연 발생
적합 상황: 즉각적인 응답 필요 없고, 대량 요청을 처리할 때

🔹 Provisioned Throughput (예약제, 안정적 성능 보장)

방식: 헬스장 정액제처럼 일정 기간(1~6개월 등) 처리 용량 예약
보장 성능: 분당 최대 입력/출력 토큰 수 보장
사용 가능 모델: Base, Fine-tuned, Custom Models
✅ 장점: 안정적인 성능 및 용량 확보, 커스텀 모델 사용 가능
❌ 단점: 비용 절감 효과는 거의 없음 → 목적은 “성능 보장”

📊 가격 옵션 비교표

옵션	결제 방식	요금 기준	사용 가능 모델	장점	단점	적합한 경우
On-Demand	사용한 만큼 결제	– 텍스트: 입력/출력 토큰 – 임베딩: 입력 토큰 – 이미지: 생성 수	Base Models 전용	유연성 ↑ 예측 불가 워크로드 적합	장기 사용 시 비용 ↑	가끔 사용 / 사용량 예측 어려움
Batch Mode	여러 요청 묶음 처리	결과 Amazon S3에 저장	Base Models 전용	최대 50% 할인 대량 처리 유리	실시간 처리 불가 지연 발생	대량 요청 / 즉각 응답 불필요
Provisioned Throughput	일정 기간 용량 예약	분당 토큰 처리량 보장	Base, Fine-tuned, Custom Models	안정적 성능 보장 커스텀 모델 가능	비용 절약 효과 거의 없음	커스텀 모델 / 성능 보장 필요

2️⃣ Model Improvement Techniques (저비용 → 고비용)

1. Prompt Engineering

프롬프트 설계 최적화만으로 개선
추가 연산 없음 → 가장 저렴

2. Retrieval Augmented Generation (RAG)

외부 지식 DB(Vector DB) 활용
모델 재학습 없음 → 비용 적음
단, 벡터 DB 구축·운영 비용 발생

RAG = “모델 + 검색기능” → 모델이 모르는 것도 외부에서 찾아서 똑똑하게 답하는 방법이에요.

3. Instruction-based Fine-tuning

라벨링된 데이터로 모델을 특정 지침에 맞게 조정
추가 연산 필요 → 비용 증가

4. Domain Adaptation Fine-tuning

도메인 특화 데이터셋으로 대규모 재학습
데이터 준비 + 연산 집약적 → 가장 비용 높음

3️⃣ Cost Optimization Tips

토큰 수 관리 → 비용 절감의 핵심
프롬프트는 짧고 간결하게
출력도 불필요하게 길지 않게
Batch Mode 활용 → 최대 50% 절감
작은 모델 선택 → 일반적으로 더 저렴
하이퍼파라미터(Temperature, Top-K, Top-P) 조정
성능에는 영향 주지만 비용에는 영향 없음

📝 최종 정리 (시험/실무 포인트)

On-Demand = 유연성 / Batch = 대량·할인 / Provisioned = 성능 보장
비용 순서: Prompt Engineering < RAG < Instruction Fine-tuning < Domain Adaptation
비용 절감 핵심: 토큰 수 관리 + Batch 활용

August 27, 2025

Leave a comment Cancel reply