콘텐츠로 이동

Eommydocs

Gemini 2.0 Flash

Gemini 2.0 Flash¶

개요¶

출시일: 2024년 12월
개발사: Google DeepMind
멀티모달 특징: 텍스트, 이미지, 비디오, 오디오 입력 지원. 네이티브 이미지 생성, 텍스트-투-스피치 출력 기능 제공

사양¶

항목	내용
Context Window	1,000,000 tokens
최대 출력 토큰	8,192 tokens
파라미터	비공개
지식 기준일	2024년 8월

가격¶

Google AI Studio¶

유형	가격 (1M tokens)
입력 (텍스트/이미지/비디오)	무료 (일일 한도 내)
출력	무료 (일일 한도 내)

Vertex AI¶

유형	가격 (1M tokens)	Batch API
입력 (텍스트/이미지/비디오)	$0.15	$0.075
입력 (오디오)	$1.00	$0.50
출력 (텍스트)	$0.60	$0.30
출력 (이미지)	$30.00	-

Gemini 2.0 Flash Lite¶

유형	가격 (1M tokens)	Batch API
입력	$0.075	$0.0375
출력 (텍스트)	$0.30	$0.15

주요 특징¶

Gemini 2.0 세대의 첫 번째 모델로 속도와 성능 균형 최적화
네이티브 멀티모달 출력: 이미지 생성 및 텍스트-투-스피치 기능 내장
Live API 지원으로 실시간 스트리밍 대화 가능
Agentic 워크플로우를 위한 네이티브 도구 사용 기능
Google Search Grounding 지원
1M 토큰의 대규모 컨텍스트 윈도우

장점¶

뛰어난 가성비: 저렴한 가격에 높은 성능 제공
멀티모달 입출력 모두 지원하는 통합 모델
빠른 응답 속도로 실시간 애플리케이션에 적합
Function Calling 및 Code Execution 기능 내장
Batch API로 대량 처리 시 50% 비용 절감

단점/한계¶

파라미터 수 비공개로 정확한 성능 예측 어려움
GPT-4 Turbo 대비 복잡한 추론 작업에서 다소 부족
이미지 생성 품질이 전용 이미지 모델 대비 제한적
일부 언어에서 성능 편차 존재

적합한 사용 사례¶

실시간 챗봇 및 대화형 에이전트
멀티모달 콘텐츠 분석 및 요약
코드 생성 및 디버깅 보조
대량 문서 처리 및 분석 (Batch API 활용)
비용 효율적인 프로덕션 배포

참고 자료¶