콘텐츠로 이동

Mistral Large 2

개요

  • 출시일: 2024년 7월 24일
  • MoE 구조 여부: No (Dense Model)

사양

항목 내용
파라미터 (총/활성) 123B / 123B
Context Window 128K tokens
GPU RAM (bf16/fp4) 약 297GB / 75GB

라이선스

  • Mistral Research License (MRL)
  • 연구 및 비상업적 용도: 무료
  • 상업적 용도: 별도 상용 라이선스 필요

가격 (API)

Provider Input Output
Mistral AI $2.00/1M tokens $6.00/1M tokens
Google Vertex AI $2.00/1M tokens $6.00/1M tokens

주요 특징

  • 128K 컨텍스트 윈도우로 장문 처리에 최적화
  • 80개 이상 프로그래밍 언어 지원 (Python, Java, C, C++, JavaScript, Bash 등)
  • 다국어 지원: 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 아랍어, 힌디어, 러시아어, 중국어, 일본어, 한국어
  • 향상된 함수 호출(Function Calling) 기능
  • 병렬 및 순차적 함수 호출 지원
  • 단일 노드 추론에 최적화

장점

  • GPT-4o, Claude 3 Opus, Llama 3 405B와 동등한 코드 및 추론 성능
  • MMLU 84.0% (사전학습 버전) 달성
  • 환각(Hallucination) 감소를 위한 집중적인 학습
  • 정보가 부족할 때 인정하도록 훈련됨
  • 간결한 응답 생성으로 비용 효율적

단점/한계

  • 상업적 사용 시 별도 라이선스 필요
  • 대규모 파라미터로 인한 높은 하드웨어 요구사항
  • 2025년 3월 30일 지원 종료 예정 (Mistral Large 3로 대체)

참고 자료

  • 공식 발표: https://mistral.ai/news/mistral-large-2407
  • HuggingFace: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
  • 공식 문서: https://docs.mistral.ai/models/mistral-large-2-0-24-07