콘텐츠로 이동

Eommydocs

Gemini 1.5 Pro

Gemini 1.5 Pro¶

개요¶

출시일: 2024년 2월 (Preview), 2024년 5월 (GA)
개발사: Google DeepMind
멀티모달 특징: 텍스트, 이미지, 비디오, 오디오, PDF 입력 지원. Mixture-of-Experts (MoE) 아키텍처 기반의 획기적인 장문맥 처리

사양¶

항목	내용
Context Window	2,000,000 tokens (최대)
기본 Context	128,000 tokens
최대 출력 토큰	8,192 tokens
파라미터	비공개 (MoE 아키텍처)
지식 기준일	2023년 11월

가격¶

Google AI Studio¶

유형	가격 (1M tokens) - 128K 이하	가격 (1M tokens) - 128K 초과
입력	$1.25	$2.50
출력	$5.00	$10.00

Vertex AI¶

유형	가격 (1M tokens) - 128K 이하	가격 (1M tokens) - 128K 초과
입력	$1.25	$2.50
출력	$5.00	$10.00
Context Caching	$0.3125 (입력)	$0.625 (입력)

주요 특징¶

업계 최초 2M 토큰 컨텍스트 윈도우 지원
MoE (Mixture-of-Experts) 아키텍처로 효율성 극대화
Near-perfect recall: 1M 토큰 내에서 99% 이상의 정보 검색 정확도
비디오 전체 분석 가능 (최대 1시간 분량)
대규모 코드베이스 전체를 한 번에 분석
Context Caching으로 반복 요청 비용 75% 절감

장점¶

업계 최대 컨텍스트 윈도우로 장문서 분석에 탁월
책 전체, 긴 비디오, 대형 코드베이스 일괄 처리 가능
높은 수준의 추론 능력
코드 생성 및 분석에서 강점
멀티모달 입력의 자연스러운 통합

단점/한계¶

2M 컨텍스트 사용 시 비용 급증 (128K 초과 시 2배 가격)
응답 속도가 Flash 모델 대비 느림
이미지 생성 기능 미지원
2023년 11월 기준 지식으로 최신 정보 부족

적합한 사용 사례¶

장문서 분석 및 요약 (법률 문서, 논문, 책)
전체 코드베이스 분석 및 리팩토링
긴 비디오 콘텐츠 분석 및 요약
복잡한 멀티턴 대화 시스템
연구 및 분석 작업

참고 자료¶