米Googleは3月12日、最新のオープン大規模言語モデル(LLM)「Gemma 3」をリリースした。マルチモーダル対応を果たし、テキストだけでなく画像や動画の処理も可能に(1Bモデルを除く)。また、軽量かつ高性能を強みとし、スマートフォンやノートPCなどの端末でも動作する点が特徴だ。

「Gemma 3」の進化ポイント
1. 4サイズ展開で用途に応じた柔軟な選択肢
従来のGemmaシリーズは2サイズ展開だったが、「Gemma 3」は以下の4種類のモデルサイズを提供する。
- 10億(1B)
- 40億(4B)
- 120億(12B)
- 270億(27B)
特に最大規模の270億パラメータモデルは、米OpenAIの「o3-mini」や中国DeepSeekの「v3」などを上回る性能をベンチマークテストで示しているという。

2. マルチモーダル対応:テキスト・画像・動画の処理が可能に
Gemma 3では、テキストだけでなく画像や動画の理解・処理が可能(1Bモデルを除く)。これにより、チャットボットや検索エンジンだけでなく、クリエイティブなコンテンツ生成や視覚データ分析にも活用できる。
3. 140以上の言語をサポート&長文処理能力の向上
- 140以上の言語に対応し、グローバルな利用を想定。
- 12万8000トークンのコンテキストウィンドウを備え、長文の処理もスムーズに。
4. 高速&効率化されたAI処理
- 関数呼び出しや構造化出力に対応し、開発者向けの利便性が向上。
- 「量子化版」も提供し、計算負荷を抑えつつ性能を維持可能。
どこで使える?
「Gemma 3」は、以下のプラットフォームで利用・ダウンロードできる。
✅ Google AI Studio
✅ Kaggle
✅ Hugging Face
また、主要なAI開発ツールとの互換性も確保されており、Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM、Gemma.cppなどに対応。ユーザーは「Gemma利用規約」に基づき、使用・複製・配布が可能となっている。
AIの安全性も強化:「ShieldGemma 2」導入
Googleは「Gemma 3」と同時に、出力画像の安全性をチェックする「ShieldGemma 2」を発表。
- 暴力表現や性的に露骨なコンテンツを自動検出できる。
- 開発者がカスタマイズ可能な安全基準を設定でき、コンテンツ管理が容易に。
Gemma 3は、開発者向けの柔軟な環境と、高いパフォーマンスを両立した次世代LLMとして注目されている。あなたのプロジェクトにどのモデルサイズが最適か、ぜひチェックしてみてほしい。
いずれかの画像をクリックし、楽天アカウントでログインまたは新規登録後に、楽天モバイル特別キャンペーンページに遷移します。