Gemini 1.5 Flash¶
개요¶
- 출시일: 2024년 5월 (Google I/O 2024)
- 개발사: Google DeepMind
- 멀티모달 특징: 텍스트, 이미지, 비디오, 오디오 입력 지원. 1.5 Pro의 경량화 버전으로 속도에 최적화
사양¶
| 항목 | 내용 |
|---|---|
| Context Window | 1,000,000 tokens |
| 기본 Context | 128,000 tokens |
| 최대 출력 토큰 | 8,192 tokens |
| 파라미터 | 비공개 (1.5 Pro보다 경량화) |
| 지식 기준일 | 2023년 11월 |
가격¶
Google AI Studio¶
| 유형 | 가격 (1M tokens) - 128K 이하 | 가격 (1M tokens) - 128K 초과 |
|---|---|---|
| 입력 | $0.075 | $0.15 |
| 출력 | $0.30 | $0.60 |
Vertex AI¶
| 유형 | 가격 (1M tokens) - 128K 이하 | 가격 (1M tokens) - 128K 초과 |
|---|---|---|
| 입력 | $0.075 | $0.15 |
| 출력 | $0.30 | $0.60 |
| Context Caching | $0.01875 (입력) | $0.0375 (입력) |
주요 특징¶
- Gemini 1.5 Pro 대비 60% 이상 빠른 응답 속도
- 1M 토큰 컨텍스트 윈도우로 장문맥 처리 가능
- 1.5 Pro의 지식 증류(distillation) 기반 학습
- 극도로 저렴한 가격 (1M 입력 토큰 $0.075)
- Fine-tuning 지원
장점¶
- 업계 최고 수준의 가성비
- 빠른 응답 속도로 실시간 애플리케이션에 적합
- 1M 컨텍스트로 장문서 처리 가능
- GPT-3.5 Turbo 대비 우수한 성능
- Context Caching으로 추가 비용 절감
단점/한계¶
- 1.5 Pro 대비 복잡한 추론 능력 저하
- 코드 생성 품질이 Pro 모델 대비 낮음
- 이미지 생성 기능 미지원
- 매우 복잡한 지시사항에서 성능 저하
적합한 사용 사례¶
- 대용량 문서 분류 및 요약
- 고빈도 API 호출이 필요한 서비스
- 채팅 애플리케이션
- 비용 민감한 프로덕션 환경
- 멀티모달 콘텐츠 빠른 분석