OpenAIのGPT-OSSモデルについて紹介
2025年8月5日、OpenAIは公式にGPT-OSS-120BとGPT-OSS-20Bを発表しました。これらはオープンウェイト(open-weight)で高性能な2つのオープンソース言語モデルです。
主な特徴:
- Apache 2.0ライセンス:商用利用を含む自由な使用と改変が可能。
- 同サイズの他のオープンモデルと比較して優れたパフォーマンス。
- 推論とツール使用(tool use)の最適化が強力。
- 一般的なハードウェアとの互換性:
- 120BはGPU 80GBで動作
- 20Bはわずか16GBのRAMで動作可能。
- 120BはGPU 80GBで動作
GPT-OSSモデルのトレーニング
GPT-OSSモデルは、OpenAIによって先進的な事前トレーニングおよび事後トレーニング技術を用いて訓練されており、推論能力、パフォーマンスの最適化、さまざまなデプロイ環境での実用性に重点が置かれています。これは、GPT-2(2019年)以来、OpenAIが初めて公開するオープンウェイト言語モデルであり、以前にはWhisperやCLIPなどのオープンモデルをリリースしていました。
アーキテクチャ面では、GPT-OSSはMixture of Experts(MoE)を採用し、トークンごとのアクティブパラメータ数を削減しています:
- GPT-OSS-120B:トークンあたり51億のアクティブパラメータ。
- GPT-OSS-20B:トークンあたり36億のアクティブパラメータ。
トレーニングデータセットは主に高品質な英語テキストで構成されており、STEM、プログラミング、一般知識に焦点を当て、o200k_harmonyトークンセット(o4-miniやGPT-4oでも使用)でエンコードされています。
事後トレーニング段階では、監視付き微調整やRLHFを通じてOpenAI Model Specに適合するよう調整され、Chain-of-Thought推論やツール使用のトレーニングが組み合わされています。
両モデルは3段階の推論レベル(低、中、高)をサポートしており、開発者はシステムプロンプトの設定だけで速度と精度のバランスを柔軟に調整できます。
モデル | 層数 | 総パラメータ数 | トークンごとのアクティブパラメータ数 | 総エキスパート数 | トークンごとのアクティブエキスパート数 | コンテキスト長 |
---|---|---|---|---|---|---|
gpt-oss-120b | 36 | 1170億 | 51億 | 128 | 4 | 128千 |
gpt-oss-20b | 24 | 210億 | 36億 | 32 | 4 | 128千 |
GPT-OSSモデルのパフォーマンス評価
OpenAIは、GPT-OSS-120BとGPT-OSS-20Bを標準的な学術ベンチマークで評価し、プログラミング、競技数学、医療、ツール使用能力を測定し、o3、o3-mini、o4-miniと直接比較しました。
- GPT-OSS-120B:
- Codeforces、MMLU、HLE、TauBenchでo3-miniを上回り、o4-miniと同等またはやや優れる。
- HealthBenchおよびAIME 2024&2025のテストでo4-miniを上回る。
- GPT-OSS-20B:
- サイズが小さいにもかかわらず、同じテストセットでo3-miniと同等または上回る。
- 特に競技数学と医療タスクで強力。
GPT-OSS-120Bは多くのシナリオで小型のプロプライエタリーモデルに迫る(場合によっては超える)性能を持ち、GPT-OSS-20Bは軽量ながら競争力のあるパフォーマンスを提供し、ローカル実行や低コストに適しています。
結論
GPT-OSS-120BとGPT-OSS-20Bのリリースは、OpenAIがオープンウェイト言語モデルをコミュニティに提供する重要な転換点です。プロプライエタリーモデルと競合するパフォーマンス、ハードウェアに最適化されたアーキテクチャ、厳格な安全基準を備えたGPT-OSSは、大企業だけでなく、個人、スタートアップ、小規模組織にも先進的なAI技術へのアクセスを提供します。
この2つのモデルは、優れた推論能力、柔軟なカスタマイズ性、クロスプラットフォームの互換性を兼ね備えており、誰でも独自のインフラ上でAIソリューションを構築、デプロイ、最適化できる環境を整えています。透明性、民主化、アクセスの容易さを求めるAIの需要が高まる中、GPT-OSSはOpenAIのビジョンを体現するものです:強力なAIはすべての人に属するべきだ。
注目ポイント | 詳細 |
---|---|
オープンソース、柔軟性 | Apache 2.0ライセンス、自由なカスタマイズと利用が可能 |
高パフォーマンス | gpt-oss-120b ≈ o4-mini; gpt-oss-20b ≈ o3-mini |
ハードウェア最適化 | GPU 80GBまたは一般的なデバイスで16GB RAM |
簡単な統合 | クラウドからローカルまで、複数のプラットフォームをサポート |
安全性確保 | 厳格なテストと明確なドキュメントで信頼性を向上 |