콘텐츠로 이동

Gemini 2.0 Flash

개요

  • 출시일: 2024년 12월
  • 개발사: Google DeepMind
  • 멀티모달 특징: 텍스트, 이미지, 비디오, 오디오 입력 지원. 네이티브 이미지 생성, 텍스트-투-스피치 출력 기능 제공

사양

항목 내용
Context Window 1,000,000 tokens
최대 출력 토큰 8,192 tokens
파라미터 비공개
지식 기준일 2024년 8월

가격

Google AI Studio

유형 가격 (1M tokens)
입력 (텍스트/이미지/비디오) 무료 (일일 한도 내)
출력 무료 (일일 한도 내)

Vertex AI

유형 가격 (1M tokens) Batch API
입력 (텍스트/이미지/비디오) $0.15 $0.075
입력 (오디오) $1.00 $0.50
출력 (텍스트) $0.60 $0.30
출력 (이미지) $30.00 -

Gemini 2.0 Flash Lite

유형 가격 (1M tokens) Batch API
입력 $0.075 $0.0375
출력 (텍스트) $0.30 $0.15

주요 특징

  • Gemini 2.0 세대의 첫 번째 모델로 속도와 성능 균형 최적화
  • 네이티브 멀티모달 출력: 이미지 생성 및 텍스트-투-스피치 기능 내장
  • Live API 지원으로 실시간 스트리밍 대화 가능
  • Agentic 워크플로우를 위한 네이티브 도구 사용 기능
  • Google Search Grounding 지원
  • 1M 토큰의 대규모 컨텍스트 윈도우

장점

  • 뛰어난 가성비: 저렴한 가격에 높은 성능 제공
  • 멀티모달 입출력 모두 지원하는 통합 모델
  • 빠른 응답 속도로 실시간 애플리케이션에 적합
  • Function Calling 및 Code Execution 기능 내장
  • Batch API로 대량 처리 시 50% 비용 절감

단점/한계

  • 파라미터 수 비공개로 정확한 성능 예측 어려움
  • GPT-4 Turbo 대비 복잡한 추론 작업에서 다소 부족
  • 이미지 생성 품질이 전용 이미지 모델 대비 제한적
  • 일부 언어에서 성능 편차 존재

적합한 사용 사례

  • 실시간 챗봇 및 대화형 에이전트
  • 멀티모달 콘텐츠 분석 및 요약
  • 코드 생성 및 디버깅 보조
  • 대량 문서 처리 및 분석 (Batch API 활용)
  • 비용 효율적인 프로덕션 배포

참고 자료