콘텐츠로 이동

Eommydocs

Gemini 1.5 Flash

Gemini 1.5 Flash¶

개요¶

출시일: 2024년 5월 (Google I/O 2024)
개발사: Google DeepMind
멀티모달 특징: 텍스트, 이미지, 비디오, 오디오 입력 지원. 1.5 Pro의 경량화 버전으로 속도에 최적화

사양¶

항목	내용
Context Window	1,000,000 tokens
기본 Context	128,000 tokens
최대 출력 토큰	8,192 tokens
파라미터	비공개 (1.5 Pro보다 경량화)
지식 기준일	2023년 11월

가격¶

Google AI Studio¶

유형	가격 (1M tokens) - 128K 이하	가격 (1M tokens) - 128K 초과
입력	$0.075	$0.15
출력	$0.30	$0.60

Vertex AI¶

유형	가격 (1M tokens) - 128K 이하	가격 (1M tokens) - 128K 초과
입력	$0.075	$0.15
출력	$0.30	$0.60
Context Caching	$0.01875 (입력)	$0.0375 (입력)

주요 특징¶

Gemini 1.5 Pro 대비 60% 이상 빠른 응답 속도
1M 토큰 컨텍스트 윈도우로 장문맥 처리 가능
1.5 Pro의 지식 증류(distillation) 기반 학습
극도로 저렴한 가격 (1M 입력 토큰 $0.075)
Fine-tuning 지원

장점¶

업계 최고 수준의 가성비
빠른 응답 속도로 실시간 애플리케이션에 적합
1M 컨텍스트로 장문서 처리 가능
GPT-3.5 Turbo 대비 우수한 성능
Context Caching으로 추가 비용 절감

단점/한계¶

1.5 Pro 대비 복잡한 추론 능력 저하
코드 생성 품질이 Pro 모델 대비 낮음
이미지 생성 기능 미지원
매우 복잡한 지시사항에서 성능 저하

적합한 사용 사례¶

대용량 문서 분류 및 요약
고빈도 API 호출이 필요한 서비스
채팅 애플리케이션
비용 민감한 프로덕션 환경
멀티모달 콘텐츠 빠른 분석

참고 자료¶