생성 및 조정 예시는 Gemma Cookbook 저장소를 확인하세요. 자세히 알아보기

이 페이지는 Cloud Translation API를 통해 번역되었습니다.

Gemma 개방형 모델

Gemini 모델을 만드는 데 사용된 것과 동일한 연구 및 기술을 바탕으로 빌드된 최첨단 경량 개방형 모델 제품군입니다.

시작하기

책임감 있는 설계

포괄적인 안전 조치가 적용된 이 모델들은 선별된 데이터 세트 및 엄격한 조정을 통해 책임감 있고 신뢰할 수 있는 AI 솔루션을 보장하도록 도와줍니다.

크기 대비 독보적인 성능

Gemma 모델은 2B, 7B, 9B, 27B 크기에서 탁월한 벤치마크 결과를 달성하며 일부 대형 개방형 모델보다 성능이 우수합니다.

유연한 프레임워크

Keras 3.0의 경우 JAX, TensorFlow, PyTorch와 원활하게 호환되므로 작업에 따라 프레임워크를 손쉽게 선택하고 전환할 수 있습니다.

Gemma 2를 소개합니다.

Gemma 2는 최고의 성능과 효율성을 위해 재설계되어 다양한 하드웨어에서 초고속 추론을 위해 최적화되었습니다.

Google AI Studio에서 Gemma 2 사용해 보기

5샷

MMLU

MMLU 벤치마크는 사전 학습 중에 대규모 언어 모델이 얻은 폭넓은 지식과 문제 해결 능력을 측정하는 테스트입니다.

25샷

ARC-C

ARC-c 벤치마크는 ARC-e 데이터 세트의 보다 구체적인 하위 집합으로, 일반적인 (검색 기반 및 단어 공동발생) 알고리즘에 의해 잘못 답변된 질문만 포함되어 있습니다.

5샷

GSM8K

GSM8K 벤치마크는 여러 단계의 추론이 자주 필요한 초등학교 수준의 수학 문제를 해결하는 언어 모델의 능력을 테스트합니다.

3-5샷

AGIEval

AGIEval 벤치마크는 인간의 지적 능력을 평가하도록 설계된 실제 시험에서 파생된 질문을 사용하여 언어 모델의 일반적인 지능을 테스트합니다.

3샷, CoT

BBH

BBH (BIG-Bench Hard) 벤치마크는 현재 언어 모델의 능력을 넘어선 것으로 간주되는 작업에 중점을 두고 다양한 추론 및 이해 도메인에서 한계를 테스트합니다.

3샷, F1

버리기

DROP은 단락에 대한 개별적인 추론이 필요한 독해력 벤치마크입니다.

5샷

Winogrande

Winogrande 벤치마크는 일반화된 상식적 추론이 필요한 이진 옵션으로 모호한 빈칸 채우기 작업을 해결하는 언어 모델의 능력을 테스트합니다.

10샷

HellaSwag

HellaSwag 벤치마크는 스토리에 가장 논리적인 결말을 선택하여 상식적 추론을 이해하고 적용하는 언어 모델의 능력에 도전합니다.

4샷

MATH

MATH는 추론, 다단계 문제 해결, 수학적 개념에 대한 이해가 필요한 복잡한 수학 단어 문제를 해결하는 언어 모델의 능력을 평가합니다.

제로샷

ARC-e

ARC-e 벤치마크는 실제 초등학교 수준의 객관식 과학 문제로 언어 모델의 고급 질문-답변 기술을 테스트합니다.

제로샷

PIQA

PIQA 벤치마크는 일상적인 신체적 상호작용에 관한 질문에 답변하여 물리적 상식 지식을 이해하고 적용하는 언어 모델의 능력을 테스트합니다.

제로샷

SIQA

SIQA 벤치마크는 사람들의 행동과 그 사회적 영향에 대한 질문을 함으로써 사회적 상호작용과 사회적 상식에 대한 언어 모델의 이해도를 평가합니다.

제로샷

Boolq

BoolQ 벤치마크는 자연스럽게 발생하는 예/아니요 질문에 답하는 언어 모델의 기능을 테스트하여 실제 자연어 추론 작업을 실행하는 모델 기능을 테스트합니다.

5샷

TriviaQA

TriviaQA 벤치마크에서는 질의응답 증거를 3배로 하여 독해 능력을 테스트합니다.

5샷

NQ (자연 질문) 벤치마크는 Wikipedia 문서 전체 내에서 답변을 찾고 이해하는 언어 모델의 능력을 테스트하여 실제 질의 응답 시나리오를 시뮬레이션합니다.

1번 인증

HumanEval

HumanEval 벤치마크는 솔루션이 프로그래밍 문제의 기능 단위 테스트를 통과하는지 평가하여 언어 모델의 코드 생성 능력을 테스트합니다.

3샷

MBPP

MBPP 벤치마크는 기본 프로그래밍 개념과 표준 라이브러리 사용에 중점을 두고 언어 모델이 기본 Python 프로그래밍 문제를 해결하는 능력을 테스트합니다.

100%

75%

50%

25%

100%

75%

50%

25%

Gemma 1

25억

42.3

Gemma 2

26억

51.3

Mistral

62.5

LLAMA 3

66.6

Gemma 1

64.4

Gemma 2

90억

71.3

Gemma 2

270억

75.2

Gemma 1

25억

48.5

Gemma 2

26억

55.4

Mistral

60.5

LLAMA 3

80억

59.2

Gemma 1

61.1

Gemma 2

90억

68.4

Gemma 2

270억

71.4

Gemma 1

25억

15.1

Gemma 2

26억

23.9

Mistral

39.6

LLAMA 3

45.7

Gemma 1

51.8

Gemma 2

90억

68.6

Gemma 2

270억

74.0

Gemma 1

25억

24.2

Gemma 2

26억

30.6

Mistral

44.0

LLAMA 3

45.9

Gemma 1

44.9

Gemma 2

90억

52.8

Gemma 2

270억

55.1

Gemma 1

25억

35.2

Gemma 2

26억

41.9

Mistral

56.0

LLAMA 3

61.1

Gemma 1

59.0

Gemma 2

90억

68.2

Gemma 2

270억

74.9

Gemma 1

25억

48.5

Gemma 2

26억

52.0

Mistral

63.8

LLAMA 3

58.4

Gemma 1

56.3

Gemma 2

90억

69.4

Gemma 2

270억

74.2

Gemma 1

25억

66.8

Gemma 2

26억

70.9

Mistral

78.5

LLAMA 3

80억

76.1

Gemma 1

79.0

Gemma 2

90억

80.6

Gemma 2

270억

83.7

Gemma 1

25억

71.7

Gemma 2

26억

73.0

Mistral

83.0

LLAMA 3

82.0

Gemma 1

82.3

Gemma 2

90억

81.9

Gemma 2

270억

86.4

Gemma 1

25억

11.8

Gemma 2

26억

15.0

Mistral

12.7

Gemma 1

24.3

Gemma 2

90억

36.6

Gemma 2

270억

42.3

Gemma 1

25억

73.2

Gemma 2

26억

80.1

Mistral

80.5

Gemma 1

81.5

Gemma 2

90억

88.0

Gemma 2

270억

88.6

Gemma 1

25억

77.3

Gemma 2

26억

77.8

Mistral

82.2

Gemma 1

81.2

Gemma 2

90억

81.7

Gemma 2

270억

83.2

Gemma 1

25억

49.7

Gemma 2

26억

51.9

Mistral

47.0

Gemma 1

51.8

Gemma 2

90억

53.4

Gemma 2

270억

53.7

Gemma 1

25억

69.4

Gemma 2

26억

72.5

Mistral

83.2

Gemma 1

83.2

Gemma 2

90억

84.2

Gemma 2

270억

84.8

Gemma 1

25억

53.2

Gemma 2

26억

59.4

Mistral

62.5

Gemma 1

63.4

Gemma 2

90억

76.6

Gemma 2

270억

83.7

Gemma 1

25억

12.5

Gemma 2

26억

16.7

Mistral

23.2

Gemma 1

23.0

Gemma 2

90억

29.2

Gemma 2

270억

34.5

Gemma 1

25억

22.0

Gemma 2

26억

17.7

Mistral

26.2

Gemma 1

32.3

Gemma 2

90억

40.2

Gemma 2

270억

51.8

Gemma 1

25억

29.2

Gemma 2

26억

29.6

Mistral

40.2

Gemma 1

44.4

Gemma 2

90억

52.4

Gemma 2

270억

62.6

*이는 사전 학습된 모델의 벤치마크입니다. 다른 방법의 성능에 관한 자세한 내용은 기술 보고서를 참고하세요.

기술 보고서 읽기

Gemma 모델 계열

신규 출시

Gemma 2

Gemma 2는 2, 9, 270억 가지 매개변수 크기로 강력하고 효율적인 새 모델 3개를 제공하며, 모든 모델에 안전 관련 개선사항이 내장되어 있습니다.

Hugging Face 시작하기 Kaggle 시작하기

신규 출시

DataGemma

DataGemma는 Google의 Data Commons에서 가져온 광범위한 실제 데이터와 LLM을 연결하도록 설계된 최초의 개방형 모델입니다.

Kaggle 시작하기

Gemma 1

Gemma 모델은 다양한 자연어 처리 작업을 위해 텍스트, 코드, 수학적 콘텐츠의 방대한 데이터 세트로 학습된 가볍고 텍스트 간 디코더 전용 대규모 언어 모델입니다.

Kaggle 시작하기

RecurrentGemma

RecurrentGemma는 순환 신경망과 로컬 어텐션을 활용하여 메모리 효율을 개선하는 기술적으로 고유한 모델입니다.

Kaggle 시작하기

PaliGemma

PaliGemma는 PaLI-3에서 영감을 얻은 오픈 비전 언어 모델로, SigLIP 및 Gemma를 활용하며 다양한 비전 언어 작업으로 전송할 수 있는 다목적 모델로 설계되었습니다.

Kaggle 시작하기

CodeGemma

CodeGemma는 기존의 선행 학습된 Gemma 모델의 기반을 토대로 로컬 컴퓨터에 적합한 크기로 강력한 코드 완성 및 생성 기능을 제공합니다.

Kaggle 시작하기

Google 도구 살펴보기

ShieldGemma

ShieldGemma는 AI 모델의 입력과 출력을 필터링하고 사용자를 안전하게 보호하기 위해 Gemma 2를 기반으로 구축된 안전 콘텐츠 분류기 모델 모음입니다.

Gemma 범위

Gemma Scope는 연구원들이 Gemma 2 모델의 의사결정 과정에 전례 없는 수준의 투명성을 제공합니다.

개발자를 위한 빠른 시작 가이드

Kaggle에서 빠른 시작 살펴보기

Kaggle 모델 페이지에서 빠른 시작, 코드 예제, Gemma 관련 토론을 찾아보세요.

Kaggle에서 열기

Google Cloud에서 학습 및 배포

Gemma 2는 Vertex에서 업계 최고의 성능과 총소유비용을 제공하는 엔드 투 엔드 TPU 최적화를 통해 Google Cloud에서 가장 잘 작동합니다.

Vertex AI에서 열기

Keras 3을 통한 JAX로 저순위 적응 시도

Keras 3를 통해 선택한 백엔드 프레임워크를 사용하여 Gemma 모델을 고유한 도메인 및 데이터에 맞게 조정합니다.

Colab에서 열기

문서의 모든 빠른 시작 보기 모든 빠른 시작 보기

파트너 빠른 시작 가이드

Hugging Face

Hugging Face Transformer와 TRL을 활용하여 Gemma 모델로 미세 조정 및 추론 작업을 수행합니다.

NVIDIA

NVIDIA NeMo 프레임워크로 Gemma 모델을 미세 조정하고 프로덕션을 위해 TensorRT-LLM으로 내보냅니다.

LangChain

이 튜토리얼에서는 Google Cloud 또는 Colab 환경에서 실행되는 Gemma 및 LangChain을 시작하는 방법을 보여줍니다.

Anyscale

이 문서에서는 Anyscale Endpoint를 통해 Gemma를 완전 관리형 API 엔드포인트로 사용하는 방법을 보여줍니다.

MongoDB

이 문서에서는 검색 증강 생성 파이프라인 또는 시스템에서 Gemma를 기반 모델로 활용하는 방법을 설명합니다.

Weights and Biases

Google의 Gemma 모델을 사용한 단계별 예시를 통해 W&B의 모델 레지스트리 및 실행 도구를 자세히 알아보세요.

Gemma 설명서

PaliGemma를 사용한 이미지 캡션, CodeGemma를 사용한 코드 생성, 미세 조정된 Gemma 모델을 사용한 챗봇 빌드와 같은 작업을 위한 Gemma의 강력함과 다목적성을 보여주는 실용적인 레시피와 예시 모음을 살펴보세요.

요리 시작하기

지금 Gemma 모델에 액세스하세요

Kaggle 모델

Kaggle에서 Gemma 2 모델에 액세스

Vertex AI Model Garden

자체 데이터로 Gemma 2 맞춤설정하기

Hugging Face 모델

Gemma에 액세스하고, 미세 조정하고, 배포합니다.

책임감 있는 AI 개발

책임감 있는 설계

신중하게 선별된 데이터로 사전 학습되고 안전을 위해 조정되어 Gemma 모델을 기반으로 안전하고 책임감 있는 AI 개발을 지원합니다.

강력하고 투명한 평가

포괄적인 평가와 투명한 보고를 통해 각 사용 사례에 대해 책임감 있는 접근 방식을 채택해야 하는 모델 한계가 드러납니다.

책임감 있는 개발 지원

책임감 있는 생성형 AI 도구 키트는 개발자가 책임감 있는 AI 권장사항을 설계하고 구현할 수 있도록 지원합니다.

책임감 있는 생성형 AI 툴킷 살펴보기

Google Cloud에 최적화

Google Cloud에서 Gemma 모델을 사용하면 Vertex AI의 완전 관리형 도구 또는 GKE의 자체 관리형 옵션으로 모델을 특정 니즈에 맞게 심층적으로 맞춤설정하고, 유연하고 비용 효율적인 AI에 최적화된 인프라에 배포할 수 있습니다.

Google Cloud 블로그에서 자세히 알아보기

Google Cloud 크레딧으로 학술 연구 가속화

학술 연구 프로그램의 신청 기간이 최근에 종료되었으며, Gemma 모델을 사용하여 과학적 발견의 한계를 넓히는 연구원을 지원하기 위해 Google Cloud 크레딧이 제공되었습니다. 이 이니셔티브에서 획기적인 연구가 나오기를 기대합니다.

Google Cloud로 연구를 발전시킬 수 있는 향후 기회에도 계속 관심을 가져 주세요.

커뮤니티 가입

ML 모델 커뮤니티에서 다른 사용자와 소통하고, 탐색하고, 지식을 공유하세요.

Gemma 개방형 모델

책임감 있는 설계

크기 대비 독보적인 성능

유연한 프레임워크

Gemma 2를 소개합니다.

Gemma 모델 계열

Gemma 2

DataGemma

Gemma 1

RecurrentGemma

PaliGemma

CodeGemma

Google 도구 살펴보기

개발자를 위한 빠른 시작 가이드

Kaggle에서 빠른 시작 살펴보기

Google Cloud에서 학습 및 배포

Keras 3을 통한 JAX로 저순위 적응 시도

파트너 빠른 시작 가이드

Gemma 설명서

지금 Gemma 모델에 액세스하세요

책임감 있는 AI 개발

Google Cloud에 최적화

Google Cloud 크레딧으로 학술 연구 가속화

커뮤니티 가입

Kaggle

Discord

블로그