YutoIT ブログ
トップへ戻る

GPT-OSS の詳細 - 無料オープンソース LLM でローカル PC で実行可能

2025/08/10 21:28
17回閲覧
OpenAI が GPT-OSS をリリース - 無料オープンソース LLM でローカル PC で実行可能
目次

OpenAIのGPT-OSSモデルについて紹介

2025年8月5日、OpenAIは公式にGPT-OSS-120BとGPT-OSS-20Bを発表しました。これらはオープンウェイト(open-weight)で高性能な2つのオープンソース言語モデルです。

主な特徴:

  • Apache 2.0ライセンス:商用利用を含む自由な使用と改変が可能。
  • 同サイズの他のオープンモデルと比較して優れたパフォーマンス。
  • 推論とツール使用(tool use)の最適化が強力。
  • 一般的なハードウェアとの互換性:
    • 120BはGPU 80GBで動作
    • 20Bはわずか16GBのRAMで動作可能。


GPT-OSS の詳細 - 無料オープンソース LLM でローカル PC で実行可能

GPT-OSSモデルのトレーニング

GPT-OSSモデルは、OpenAIによって先進的な事前トレーニングおよび事後トレーニング技術を用いて訓練されており、推論能力、パフォーマンスの最適化、さまざまなデプロイ環境での実用性に重点が置かれています。これは、GPT-2(2019年)以来、OpenAIが初めて公開するオープンウェイト言語モデルであり、以前にはWhisperやCLIPなどのオープンモデルをリリースしていました。

アーキテクチャ面では、GPT-OSSはMixture of Experts(MoE)を採用し、トークンごとのアクティブパラメータ数を削減しています:

  • GPT-OSS-120B:トークンあたり51億のアクティブパラメータ。
  • GPT-OSS-20B:トークンあたり36億のアクティブパラメータ。

トレーニングデータセットは主に高品質な英語テキストで構成されており、STEM、プログラミング、一般知識に焦点を当て、o200k_harmonyトークンセット(o4-miniやGPT-4oでも使用)でエンコードされています。

事後トレーニング段階では、監視付き微調整やRLHFを通じてOpenAI Model Specに適合するよう調整され、Chain-of-Thought推論やツール使用のトレーニングが組み合わされています。

両モデルは3段階の推論レベル(低、中、高)をサポートしており、開発者はシステムプロンプトの設定だけで速度と精度のバランスを柔軟に調整できます。

モデル 層数 総パラメータ数 トークンごとのアクティブパラメータ数 総エキスパート数 トークンごとのアクティブエキスパート数 コンテキスト長
gpt-oss-120b 36 1170億 51億 128 4 128千
gpt-oss-20b 24 210億 36億 32 4 128千


GPT-OSS の詳細 - 無料オープンソース LLM でローカル PC で実行可能

GPT-OSSモデルのパフォーマンス評価

OpenAIは、GPT-OSS-120BとGPT-OSS-20Bを標準的な学術ベンチマークで評価し、プログラミング、競技数学、医療、ツール使用能力を測定し、o3、o3-mini、o4-miniと直接比較しました。

  • GPT-OSS-120B:
    • Codeforces、MMLU、HLE、TauBenchでo3-miniを上回り、o4-miniと同等またはやや優れる。
    • HealthBenchおよびAIME 2024&2025のテストでo4-miniを上回る。
  • GPT-OSS-20B:
    • サイズが小さいにもかかわらず、同じテストセットでo3-miniと同等または上回る。
    • 特に競技数学と医療タスクで強力。

GPT-OSS-120Bは多くのシナリオで小型のプロプライエタリーモデルに迫る(場合によっては超える)性能を持ち、GPT-OSS-20Bは軽量ながら競争力のあるパフォーマンスを提供し、ローカル実行や低コストに適しています。

結論

GPT-OSS-120BとGPT-OSS-20Bのリリースは、OpenAIがオープンウェイト言語モデルをコミュニティに提供する重要な転換点です。プロプライエタリーモデルと競合するパフォーマンス、ハードウェアに最適化されたアーキテクチャ、厳格な安全基準を備えたGPT-OSSは、大企業だけでなく、個人、スタートアップ、小規模組織にも先進的なAI技術へのアクセスを提供します。

この2つのモデルは、優れた推論能力、柔軟なカスタマイズ性、クロスプラットフォームの互換性を兼ね備えており、誰でも独自のインフラ上でAIソリューションを構築、デプロイ、最適化できる環境を整えています。透明性、民主化、アクセスの容易さを求めるAIの需要が高まる中、GPT-OSSはOpenAIのビジョンを体現するものです:強力なAIはすべての人に属するべきだ。

注目ポイント 詳細
オープンソース、柔軟性 Apache 2.0ライセンス、自由なカスタマイズと利用が可能
高パフォーマンス gpt-oss-120b ≈ o4-mini; gpt-oss-20b ≈ o3-mini
ハードウェア最適化 GPU 80GBまたは一般的なデバイスで16GB RAM
簡単な統合 クラウドからローカルまで、複数のプラットフォームをサポート
安全性確保 厳格なテストと明確なドキュメントで信頼性を向上
共有リンク:
著者
Yuto
Yuto

このブログは2024年、AI技術が急速に発展している時期に作りました。このブログの目的は、基本的な知識やパソコンのヒント、そして基本的なAIツールの使い方を共有することです。
ウェブサイトを訪問していただきありがとうございます。このサイトの記事がお役に立てば幸いです。

コメント

コメントなし

コメントを残して返信通知を受け取る

コメントを残すにはサインインしてください

ログイン