Gemini 1.5 Pro¶
개요¶
- 출시일: 2024년 2월 (Preview), 2024년 5월 (GA)
- 개발사: Google DeepMind
- 멀티모달 특징: 텍스트, 이미지, 비디오, 오디오, PDF 입력 지원. Mixture-of-Experts (MoE) 아키텍처 기반의 획기적인 장문맥 처리
사양¶
| 항목 | 내용 |
|---|---|
| Context Window | 2,000,000 tokens (최대) |
| 기본 Context | 128,000 tokens |
| 최대 출력 토큰 | 8,192 tokens |
| 파라미터 | 비공개 (MoE 아키텍처) |
| 지식 기준일 | 2023년 11월 |
가격¶
Google AI Studio¶
| 유형 | 가격 (1M tokens) - 128K 이하 | 가격 (1M tokens) - 128K 초과 |
|---|---|---|
| 입력 | $1.25 | $2.50 |
| 출력 | $5.00 | $10.00 |
Vertex AI¶
| 유형 | 가격 (1M tokens) - 128K 이하 | 가격 (1M tokens) - 128K 초과 |
|---|---|---|
| 입력 | $1.25 | $2.50 |
| 출력 | $5.00 | $10.00 |
| Context Caching | $0.3125 (입력) | $0.625 (입력) |
주요 특징¶
- 업계 최초 2M 토큰 컨텍스트 윈도우 지원
- MoE (Mixture-of-Experts) 아키텍처로 효율성 극대화
- Near-perfect recall: 1M 토큰 내에서 99% 이상의 정보 검색 정확도
- 비디오 전체 분석 가능 (최대 1시간 분량)
- 대규모 코드베이스 전체를 한 번에 분석
- Context Caching으로 반복 요청 비용 75% 절감
장점¶
- 업계 최대 컨텍스트 윈도우로 장문서 분석에 탁월
- 책 전체, 긴 비디오, 대형 코드베이스 일괄 처리 가능
- 높은 수준의 추론 능력
- 코드 생성 및 분석에서 강점
- 멀티모달 입력의 자연스러운 통합
단점/한계¶
- 2M 컨텍스트 사용 시 비용 급증 (128K 초과 시 2배 가격)
- 응답 속도가 Flash 모델 대비 느림
- 이미지 생성 기능 미지원
- 2023년 11월 기준 지식으로 최신 정보 부족
적합한 사용 사례¶
- 장문서 분석 및 요약 (법률 문서, 논문, 책)
- 전체 코드베이스 분석 및 리팩토링
- 긴 비디오 콘텐츠 분석 및 요약
- 복잡한 멀티턴 대화 시스템
- 연구 및 분석 작업