Gemma (1.0/1.1)
개요
- 출시일: 2024년 2월 (Gemma 1.0), 2024년 4월 (Gemma 1.1)
- 개발사: Google DeepMind
- 멀티모달 특징: 텍스트 전용 오픈소스 모델. Google의 첫 번째 오픈 LLM 시리즈
사양
| 항목 |
내용 |
| Context Window |
8,192 tokens |
| 파라미터 |
2B, 7B 버전 제공 |
| 아키텍처 |
Transformer (Decoder-only) |
| 라이선스 |
Gemma Terms of Use (상업적 사용 가능) |
모델 변형
| 모델 |
파라미터 |
특징 |
| gemma-2b |
2B |
초경량, 모바일/엣지용 |
| gemma-7b |
7B |
일반 용도 |
| gemma-2b-it |
2B |
Instruction-tuned |
| gemma-7b-it |
7B |
Instruction-tuned |
가격
- 오픈소스: 무료 다운로드 및 배포
- Google AI Studio: 무료 API 제공 (Rate limit 적용)
- Vertex AI: 배포 인프라 비용만 발생
자체 호스팅 시
- 하드웨어 비용만 발생
- 2B: CPU/저사양 GPU 실행 가능
- 7B: 8GB+ VRAM GPU 권장
주요 특징
- Google의 첫 번째 오픈소스 LLM
- Gemini 모델과 동일한 연구 및 기술 기반
- 사전 학습 및 Instruction-tuned 버전 제공
- Responsible AI 도구킷과 함께 출시
- 다양한 추론 프레임워크 지원
장점
- 완전 오픈소스로 자유로운 사용
- 7B 파라미터로 로컬 실행 용이
- 동급 모델 (Llama 2 7B, Mistral 7B) 대비 경쟁력 있는 성능
- Google의 안전성 검증 완료
- 활발한 커뮤니티 생태계
단점/한계
- Gemma 2 출시 이후 레거시 모델로 분류
- 8K 토큰의 제한된 컨텍스트
- 텍스트 전용 (멀티모달 미지원)
- 복잡한 추론 작업에서 한계
- 한국어 등 비영어 성능 부족
적합한 사용 사례
- 오픈소스 LLM 학습 및 연구
- 리소스 제한 환경에서의 배포
- 파인튜닝 기반 커스텀 모델 개발
- 간단한 텍스트 생성 및 분류 작업
- 프라이버시 중요 로컬 애플리케이션
참고 자료
마이그레이션 권장
신규 프로젝트에서는 Gemma 2로의 마이그레이션을 권장합니다. Gemma 2는 동일한 파라미터 대비 현저히 향상된 성능을 제공합니다.