OpenAIの製品とアプリケーション
| シリーズの一部 |
| オープンAI |
|---|
| 製品 |
| モデル |
| 人々 |
| 概念 |
アメリカの人工知能(AI)組織OpenAIは、2013年の設立以来、さまざまな製品やアプリケーションをリリースしてきました。
強化学習
OpenAIの設立当初、その研究には強化学習(RL)に焦点を当てた多くのプロジェクトが含まれていました。[ 1 ] OpenAIはDeepMindの重要な競合相手と見なされてきました。[ 2 ]
ジム
2016年に発表されたGymは、強化学習アルゴリズムの開発を容易にするために設計されたオープンソースのPythonライブラリです。AI研究における環境の定義方法を標準化し、公開された研究の再現性を高めることを目的としていました[ 3 ] [ 4 ]。また、ユーザーにこれらの環境を操作するためのシンプルなインターフェースを提供しました。2022年には、Gymの新規開発はGymnasiumライブラリに移行されました[ 5 ] [ 6 ] 。
ジムレトロ
2018年にリリースされたGym Retroは、強化学習(RL)アルゴリズムを用いてビデオゲーム[ 7 ]における強化学習(RL)研究のためのプラットフォームであり、一般化を研究します。従来のRL研究は、主に単一のタスクを解決するエージェントの最適化に焦点を当てていました。Gym Retroは、コンセプトは似ているものの見た目が異なるゲーム間での一般化を可能にします。
ロボ相撲
2017年にリリースされたRoboSumoは、ヒューマノイド型メタラーニングロボットエージェントが最初は歩くことさえ知らない仮想世界ですが、移動を学習し、相手エージェントをリングから押し出すという目標が与えられます。 [ 8 ]この敵対的学習プロセスを通じて、エージェントは変化する状況に適応する方法を学習します。その後、エージェントがこの仮想環境から移動し、強風の吹く新しい仮想環境に置かれると、エージェントは直立姿勢を保とうとします。これは、一般的な方法でバランスをとる方法を学習したことを示しています。[ 8 ] [ 9 ] OpenAIのIgor Mordatchは、エージェント間の競争は知能の「軍拡競争」を生み出し、競争の文脈外でもエージェントの機能能力を高める可能性があると主張しました。[ 8 ]
オープンAIファイブ
OpenAI Fiveは、5対5の対戦型ビデオゲームDota 2で使用されているOpenAIがキュレートした5つのボットのチームであり、完全に試行錯誤のアルゴリズムを通じて、高いスキルレベルで人間のプレイヤーと対戦することを学習します。5人チームになる前に、最初の公開デモンストレーションは、このゲームの毎年恒例のプレミアチャンピオンシップトーナメントであるThe International 2017で行われ、ウクライナのプロプレイヤーであるDendiがライブの1対1の対戦でボットに敗れました。[ 10 ] [ 11 ]試合後、CTOのGreg Brockmanは、ボットが2週間のリアルタイムでの自分自身との対戦によって学習し、学習ソフトウェアは外科医のような複雑なタスクを処理できるソフトウェアを作成する方向への一歩であると説明しました。[ 12 ] [ 13 ]このシステムは強化学習の一種を使用しており、ボットは数ヶ月間毎日何百回も自分自身と対戦することで時間をかけて学習し、敵を倒したりマップの目標を達成したりするなどの行動に対して報酬を得ます。[ 14 ] [ 15 ] [ 16 ]
2018年6月までに、ボットの能力は5人チームとして一緒にプレイできるまで拡張され、アマチュアやセミプロのチームを倒すことができました。[ 17 ] [ 14 ] [ 18 ] [ 19 ] The International 2018では、OpenAI Fiveはプロの選手と2つのエキシビションマッチをプレイしましたが、両方のゲームで負けました。[ 20 ] [ 21 ] [ 22 ] 2019年4月、OpenAI Fiveはサンフランシスコでライブエキシビションマッチで、当時ゲームの世界チャンピオンだったOGを2:0で破りました。 [ 23 ] [ 24 ]ボットが最後に公に登場したのはその月の後半で、4日間のオープンオンライン大会で合計42,729試合をプレイし、その試合の99.4%に勝ちました。[ 25 ]
OpenAI FiveのDota 2のボットプレイヤーのメカニズムは、マルチプレイヤーオンラインバトルアリーナ(MOBA)ゲームにおけるAIシステムの課題を示しており、OpenAI Fiveが深層強化学習(DRL)エージェントを使用してDota 2の試合で超人的な能力を達成する方法を実証しました。[ 26 ]
ダクティル
2018年に開発されたDactylは、機械学習を使用して、人間のようなロボットハンドであるShadow Handをトレーニングし、物理的なオブジェクトを操作します。 [ 27 ] OpenAI Fiveと同じRLアルゴリズムとトレーニングコードを使用して、完全にシミュレーションで学習します。OpenAIは、ドメインランダム化を使用してオブジェクトの方向付けの問題に取り組みました。これは、学習者が現実に合わせようとするのではなく、さまざまな経験にさらすシミュレーション手法です。Dactylのセットアップには、モーショントラッキングカメラの他に、ロボットが任意のオブジェクトを見て操作できるようにするためのRGBカメラも搭載されています。2018年に、OpenAIはシステムが立方体と八角柱を操作できることを示しました。[ 28 ]
2019年、OpenAIはDactylがルービックキューブを解けることを実証しました。このロボットは60%の確率でパズルを解くことができました。ルービックキューブのような物体は、モデル化が難しい複雑な物理特性を持ちます。OpenAIは、段階的に難易度が上がる環境を生成するシミュレーション手法である自動ドメインランダム化(ADR)を用いることで、Dactylの摂動に対する堅牢性を向上させることでこれを実現しました。ADRは、人間がランダム化範囲を指定する必要がない点で、手動ドメインランダム化とは異なります。[ 29 ]
API
2020年6月、OpenAIは「OpenAIが開発した新しいAIモデルにアクセスするための」多目的APIを発表し、開発者が「あらゆる英語AIタスク」にこれを利用できるようにした。[ 30 ] [ 31 ]
エージェントキット
2025年10月6日、サム・アルトマンは2025 Dev Dayのオープニング基調講演で、OpenAIの新しいAgentKitを発表しました。AgentKitは、AIエージェントの構築、展開、最適化のための新しい統合ツールスイートです。
OpenAIによると、AgentKitは3月にリリースされたResponses APIを基盤としており、エージェント作成のためのより効率的なアプローチを提供します。複数のアーリーアダプターは、新しいエージェントツールの使用により、大幅な時間節約と効率性の向上が得られたと報告しています。[ 32 ]
| 能力 | 説明 |
|---|---|
| エージェントビルダー | マルチエージェントワークフローの作成とバージョン管理のためのビジュアルキャンバス |
| チャットキット | カスタマイズ可能なチャットベースのエージェントエクスペリエンスを製品に組み込むためのツールキット |
| コネクタレジストリ | OpenAI 製品全体のデータソースを管理するための中央管理パネル |
| 強化された評価 | データセット、トレースのグレーディング、自動プロンプト最適化、サードパーティモデルのサポートなどの新しい評価機能 |
| ガードレール | カスタムガードレール構成 |
| 強化の微調整 | カスタムツール呼び出しやカスタム採点者を含む、OpenAI の推論モデルをカスタマイズする機能 |
テキスト生成
同社は生成的事前学習済みトランスフォーマー(GPT)を普及させた。[ 33 ]
| モデル | 建築 | パラメータ数 | トレーニングデータ | 発売日 | 研修費用 |
|---|---|---|---|---|---|
| GPT-1 | 12レベル、12ヘッドのTransformerデコーダ(エンコーダなし)、続いて線形ソフトマックス | 1億1700万 | BookCorpus : [ 34 ]様々なジャンルの未出版書籍7,000冊から、4.5GBのテキスト。 | 2018年6月11日[ 35 ] | 8枚のP600グラフィックカードで30日間、または1ペタFLOPS /日[ 35 ] |
| GPT-2 | GPT-1(ただし正規化を修正) | 15億 | WebText: Redditで投票された4,500 万のウェブページからの 40 GB のテキスト、800 万のドキュメント。 | 2019年2月14日(初回限定版)および2019年11月5日(完全版)[ 36 ] | 「数十ペタFLOPS日」[ 37 ]または1.5×10 21 FLOPS [ 38 ] |
| GPT-3 | GPT-2だが、より大きなスケールを可能にするために修正されている | 1750億[ 39 ] | CommonCrawl(570 GB)、WebText、英語版Wikipedia、2つの書籍コーパス(Books1とBooks2) で構成される4990億トークン | 2020年5月28日[ 37 ] | 3640ペタFLOPS日(表D.1 [ 37 ])、または3.1 × 10 23 FLOPS [ 38 ] |
| GPT-3.5 | 非公開 | 1750億 | 非公開 | 2022年3月15日 | 非公開 |
| GPT-4 | テキスト予測とRLHFの両方で学習済みで、テキストと画像の両方を入力として受け入れます。詳細は非公開です。[ 40 ] | 非公開。推定1.7兆ドル。[ 41 ] | 非公開 | 2023年3月14日 | 非公開。推定2.1 × 10 25 FLOPS。[ 38 ] |
| GPT-4o | ? | ? | ? | 2024年5月13日 | ? |
| GPT-4.5 | ? | ? | ? | 2025年2月27日 | ? |
| GPT-4.1 | ? | ? | ? | 2025年4月14日 | ? |
| GPT-5 | ? | ? | ? | 2025年8月7日 | ? |
OpenAI独自のGPTモデル(「GPT-1」)

トランスフォーマーベースの言語モデルの生成的事前トレーニングに関する最初の論文は、アレック・ラドフォードと彼の同僚によって書かれ、2018年6月11日にOpenAIのウェブサイトでプレプリントとして公開されました。 [ 42 ]この論文では、言語の生成モデルが、連続した長いテキストを含む多様なコーパスで事前トレーニングすることによって、どのように世界知識を獲得し、長距離依存関係を処理できるかを示しました。
GPT-2

生成的事前学習済みトランスフォーマー2(GPT-2)は、教師なし学習型トランスフォーマー言語モデルであり、OpenAIのオリジナルGPTモデル(GPT-1)の後継です。GPT-2は2019年2月に発表され、当初は限定的なデモ版のみが一般公開されました。GPT-2のフルバージョンは、フェイクニュースの作成への応用など、潜在的な悪用への懸念から、すぐにはリリースされませんでした。[ 43 ]一部の専門家は、GPT-2が重大な脅威をもたらすという懐疑的な見解を示しました。
GPT-2への対応として、アレン人工知能研究所は「ニューラルフェイクニュース」を検出するツールを開発しました。[ 44 ]ジェレミー・ハワードなどの他の研究者は、「Twitter、メール、ウェブを、文脈に合致した、妥当な響きの散文で埋め尽くし、他のすべての発言をかき消してフィルタリング不可能にする技術」について警告しました。[ 45 ] 2019年11月、OpenAIはGPT-2言語モデルの完全版をリリースしました。[ 46 ]いくつかのウェブサイトでは、GPT-2やその他のトランスフォーマーモデルのさまざまなインスタンスのインタラクティブなデモが公開されています。[ 47 ] [ 48 ] [ 49 ]
GPT-2 の著者らは、教師なし言語モデルは汎用学習者であると主張しており、GPT-2 は8 つのゼロショットタスクのうち 7 つで最先端の精度と複雑性を達成しています(つまり、モデルはタスク固有の入出力例についてさらにトレーニングされていません)。
WebTextと呼ばれるこのコーパスは、Redditの投稿で共有されたURLから抽出された約40ギガバイトのテキストで構成されており、3つ以上の賛成票を獲得しています。このコーパスは、バイトペアエンコーディングを用いることで、単語トークンで語彙をエンコードする際に発生する特定の問題を回避しています。これにより、個々の文字と複数文字のトークンの両方をエンコードすることで、任意の文字列を表現することができます。[ 50 ]
GPT-3
2020年5月に初めて説明されたGenerative Pre-trained [ a ] Transformer 3(GPT-3)は、教師なしTransformer言語モデルであり、 GPT-2の後継です。[ 51 ] [ 52 ] [ 53 ] OpenAIは、GPT-3のフルバージョンには1750億のパラメータが含まれており、[ 53 ]これはGPT-2のフルバージョンの15億[ 54 ]よりも2桁大きいと述べています(ただし、1億2500万のパラメータしかないGPT-3モデルもトレーニングされています)。[ 55 ]
OpenAIは、GPT-3が特定の「メタ学習」タスクに成功し、単一の入出力ペアの目的を一般化できると述べています。GPT-3のリリースペーパーでは、英語とルーマニア語、英語とドイツ語間の翻訳と言語間転移学習の例が示されています。 [ 53 ]
GPT-3はGPT-2に比べてベンチマーク結果を劇的に改善した。OpenAIは、このような言語モデルのスケールアップは、予測言語モデルの基本的な機能限界に近づいたり、遭遇したりする可能性があると警告した。[ 56 ] GPT-3の事前トレーニングには数千ペタフロップス/秒日[ b ]の計算量が必要であったのに対し、完全なGPT-2モデルでは数十ペタフロップス/秒日であった。[ 53 ]前任者と同様に[ 43 ] 、GPT-3でトレーニングされたモデルは悪用される可能性を懸念してすぐには一般公開されなかったが、OpenAIは2020年6月から2か月間の無料のプライベートベータ版を開始し、有料のクラウドAPIを介してアクセスできるようにする予定だった。[ 30 ] [ 58 ]
2020年9月23日、GPT-3はマイクロソフトに独占的にライセンス供与されました。[ 59 ] [ 60 ]
コーデックス
2021年半ばに発表されたCodexは、GPT-3の後継であり、5400万のGitHubリポジトリのコードでさらにトレーニングされており、[ 61 ] [ 62 ] 、コード自動補完ツールGitHub Copilotを動かすAIです。[ 62 ] 2021年8月には、APIがプライベートベータ版でリリースされました。[ 63 ] OpenAIによると、このモデルは12を超えるプログラミング言語で動作するコードを作成でき、最も効果的にPythonで作成できます。[ 61 ]
不具合、設計上の欠陥、セキュリティ上の脆弱性などいくつかの問題が指摘された。[ 64 ] [ 65 ]
OpenAIは、2023年3月23日にCodex APIのサポートを終了すると発表した。[ 66 ]
GPT-4
2023年3月14日、OpenAIはテキストや画像の入力に対応できるGenerative Pre-trained Transformer 4(GPT-4)のリリースを発表しました。[ 67 ]同社は、この最新技術が模擬法科大学院の司法試験に合格し、受験者の上位10%程度のスコアを獲得したと発表しました。(対照的に、GPT-3.5は下位10%程度のスコアでした。)また、GPT-4は最大25,000語のテキストを読み取り、分析、生成することができ、すべての主要なプログラミング言語でコードを記述できるとしています。[ 68 ]
オブザーバーによると、GPT-4を使用したChatGPTの反復は、以前のGPT-3.5ベースの反復よりも改善されているが、GPT-4は以前の改訂版で発生した問題のいくつかを保持しているという注意書きがある。[ 69 ] GPT-4は、ChatGPTの入力として画像を取得することもできます。[ 70 ] OpenAIは、モデルの正確なサイズなど、GPT-4に関するさまざまな技術的な詳細や統計を明らかにすることを拒否している。[ 71 ]
GPT-4o
2024年5月13日、OpenAIはテキスト、画像、音声を処理・生成できるGPT-4oを発表・リリースした。 [ 72 ] GPT-4oは音声、多言語、視覚のベンチマークで最先端の結果を達成し、音声音声認識と翻訳で新記録を樹立した。[ 73 ] [ 74 ]大規模マルチタスク言語理解(MMLU)ベンチマークでは88.7%のスコアを記録し、GPT-4は86.5%だった。[ 75 ]
2024年7月18日、OpenAIはChatGPTインターフェース上でGPT-3.5 Turboに代わるGPT-4oの小型版であるGPT-4o miniをリリースしました。APIの料金は、入力トークン100万個あたり0.15ドル、出力トークン100万個あたり0.60ドルです。GPT-4oはそれぞれ5ドルと15ドルです。OpenAIは、AIエージェントによるサービスの自動化を目指す企業、スタートアップ、開発者にとって特に有用であると期待しています。[ 76 ]
2025年3月、OpenAIはDALL-E 3の代替としてGPT-4oのネイティブ画像生成機能をリリースした。[ 77 ]
GPT-4.5
2025年2月27日、OpenAIはコードネームOrionのGPT-4.5をリリースした。サム・アルトマンは、GPT-4.5は以前のモデルよりも不正確な情報を提示する頻度が低いと主張し、「巨大で高価なモデル」と表現した。[ 78 ]
GPT-4.1
2025年4月14日、OpenAIはGPT-4.1モデルをリリースしました。また、GPT-4.1 miniとGPT-4.1 nanoという2つの「小型、高速、低価格」モデルもリリースしました。[ 79 ] [ 80 ] [ 81 ]
GPT-5
GPT-5は、 2025年8月7日にリリースされたOpenAIの主力モデルです。GPT-4o、GPT-4.5、o3などの以前のモデルに取って代わりました。
GPT-5は、必要に応じて素早い応答とより深い「思考」を選択する動的ルーターを使用します。数学、コーディング、健康、マルチモーダルタスクなど、あらゆる分野で博士レベルのパフォーマンスを発揮します。また、SWE-bench Verifiedでは74.9%、Aider polyglotでは88%のスコアを達成しました。[ 82 ]
記者たちはGPT-5の発売をAGIに向けた大きなマイルストーンと評し、その知性、アクセスしやすさ、手頃な価格を称賛した。[ 83 ] [ 84 ]しかし、初期のフィードバックの中には、創造的な執筆における結果がまちまちであることや、 Grok 4 Heavyのようなモデルとの競争を指摘し、「革命的というより進化的」と呼ぶものもあった。 [ 85 ]
o1
2024年9月12日、OpenAIはo1-previewモデルとo1-miniモデルをリリースしました。これらのモデルは、応答を考える時間をより長く取るように設計されており、より高い精度につながります。これらのモデルは、科学、コーディング、推論タスクで特に効果的であり、ChatGPT PlusとTeamメンバーが利用できるようになりました。[ 86 ] [ 87 ] 2024年12月、o1-previewはo1に置き換えられました。[ 88 ] 2025年3月、o1-ProモデルはOpenAIの開発者APIを通じて利用可能になりました。このAPIは、2024年12月からChatGPT Proユーザーが利用できました。価格は、入力トークン100万個あたり150ドル、出力トークン100万個あたり600ドルです。[ 89 ]
o3
2024年12月20日、OpenAIはo1推論モデルの後継となるo3を発表しました。OpenAIはまた、OpenAI o3の軽量・高速版であるo3-miniも発表しました。2024年12月21日現在、このモデルは一般利用できません。OpenAIによると、o3とo3-miniをテスト中とのことです。[ 90 ] [ 91 ] 2025年1月10日まで、安全性とセキュリティの研究者はこれらのモデルへの早期アクセスを申請する機会がありました。[ 92 ]このモデルは、通信サービスプロバイダーのO2との混同を避けるため、o2ではなくo3と呼ばれています。[ 93 ] 2025年4月、OpenAIはすべての有料ユーザーにo3をリリースしました。o3はo1よりも推論能力と問題解決能力が向上しています。[ 94 ]
深い研究
Deep ResearchはOpenAIが開発し、2025年2月2日に発表されたAIエージェントです。OpenAIのo3モデルの機能を活用して、広範なWebブラウジング、データ分析、統合を実行し、5分から30分以内に包括的なレポートを提供します。 [ 95 ]ブラウジングとPythonツールを有効にすると、 HLE(Humanity's Last Exam)ベンチマークで26.6%の精度を達成しました。[ 96 ] 2025年4月、OpenAIはChatGPTの無料ユーザー全員にDeep Researchの軽量版の展開を開始しました。[ 97 ] [ 98 ]
GPT-OSS
GPT-OSS(gpt-ossと表記)は、OpenAIが2025年8月5日にリリースしたオープンウェイト推論モデルのセットです。[ 99 ] [ 100 ]現在、2つのバリエーションがあります。1つはgpt-oss-120bと呼ばれる1170億パラメータの大規模モデル、もう1つはgpt-oss-20bと呼ばれる210億パラメータの小規模モデルです。[ 101 ]どちらのモデルもApache 2.0ライセンスの下でリリースされており、商用および非商用での使用が可能です。OpenAIによると、パフォーマンスの点ではそれぞれo4-miniとo3-miniに匹敵します。[ 101 ]
画像分類
クリップ
2021年に発表されたCLIP(Contrastive Language-Image Pre-training)は、テキストと画像の意味的類似性を分析するように訓練されたモデルです。特に画像分類に利用できます。[ 102 ]
テキストから画像へ
DALL-E

2021年に発表されたDALL-Eは、テキスト記述から画像を生成するTransformerモデルです。[ 103 ] DALL-Eは、120億パラメータのGPT-3バージョンを用いて自然言語入力(「五角形の緑色の革製ハンドバッグ」や「悲しそうなカピバラの等角投影図」など)を解釈し、対応する画像を生成します。現実世界の物体(「青いイチゴの画像が描かれたステンドグラスの窓」)だけでなく、現実には存在しない物体(「ヤマアラシの質感を持つ立方体」)の画像も作成できます。2021年3月現在、APIやコードは公開されていません。
DALL-E 2
2022年4月、OpenAIはより現実的な結果をもたらすモデルの更新版であるDALL-E 2を発表しました。[ 104 ] 2022年12月、OpenAIはテキスト記述を3次元モデルに変換するための新しい基本システムであるPoint-EのソフトウェアをGitHubで公開しました。[ 105 ]
DALL-E 3
2023年9月、OpenAIはDALL-E 3を発表しました。これは、手動プロンプトエンジニアリングなしで複雑な説明から画像を生成し、手やテキストなどの複雑な詳細をレンダリングできる、より強力なモデルです。[ 106 ]これは10月にChatGPT Plusの機能として一般公開されました。[ 107 ]
テキストからビデオへ
ソラ
Soraは、短い説明文に基づいて動画を生成できるテキスト動画変換モデルです[ 108 ]。また、既存の動画を時間的に前後に拡張することもできます[ 109 ] 。最大1920×1080または1080×1920の解像度の動画を生成できます。生成される動画の最大長さは不明です。
SORAの開発チームは、その「無限の創造力」を象徴するため、日本語の「空」にちなんでSORAと名付けました。[ 108 ] SORAの技術は、 DALL·E 3テキスト画像変換モデルの技術を応用したものです。[ 110 ] OpenAIは、公開されている動画だけでなく、その目的でライセンスされた著作権のある動画を使用してシステムをトレーニングしましたが、動画の数や正確な出所は明らかにしていません。[ 108 ]
OpenAIは2024年2月15日、Soraで作成した高解像度動画を一般公開し、最大1分間の動画を生成できると述べました。また、モデルの学習方法と性能を説明した技術レポートも公開しました。[ 110 ] OpenAIは、複雑な物理シミュレーションの難しさなど、いくつかの欠点を認めました。[ 111 ] MIT Technology Reviewのウィル・ダグラス・ヘブン氏は、デモ動画を「素晴らしい」と評しましたが、厳選されたものであり、Soraの典型的な出力を反映していない可能性があると指摘しました。[ 110 ]
SORAの公開デモ後、一部の学術界リーダーからは懐疑的な意見が示されたものの、エンターテインメント業界の著名人はこの技術の可能性に大きな関心を示している。俳優兼映画監督のタイラー・ペリーはインタビューで、テキスト記述からリアルな動画を生成できるこの技術の能力に驚きを表明し、ストーリーテリングとコンテンツ制作に革命をもたらす可能性を指摘した。彼はSORAの可能性に非常に興奮しており、アトランタにある自身の映画スタジオの拡張計画を一時停止することを決めたと述べた。[ 112 ]
『SORA 2』は2025年9月30日に発表され、同時にiOSアプリもリリースされた。 [ 113 ]
音声テキスト変換
ささやき
2022年にリリースされたWhisperは、汎用の音声認識モデルです。[ 114 ]多様な音声の大規模なデータセットでトレーニングされており、多言語音声認識、音声翻訳、言語識別を実行できるマルチタスクモデルでもあります。[ 115 ]
音楽生成
ミューズネット
2019年にリリースされたMuseNetは、 MIDI音楽ファイル内の後続の音符を予測するように訓練されたディープニューラルネットワークです。10種類の楽器と15種類のスタイルで楽曲を生成できます。The Vergeによると、MuseNetで生成された楽曲は、最初はまずまずの調子で始まりますが、再生が進むにつれて混乱に陥る傾向があります。[ 116 ] [ 117 ]ポップカルチャーでは、このツールは2020年にインターネット心理スリラー『Ben Drowned』の主人公の音楽制作に初めて使用されました。 [ 118 ] [ 119 ]
ジュークボックス
2020年にリリースされたJukeboxは、ボーカル付き音楽を生成するオープンソースアルゴリズムです。120万のサンプルで学習した後、このシステムはジャンル、アーティスト、歌詞の断片を受け付け、楽曲のサンプルを出力します。OpenAIは、これらの楽曲は「局所的な音楽的一貫性を示し、伝統的なコードパターンに従っている」と述べていますが、「繰り返されるコーラスなどの馴染みのある大きな音楽構造」が欠けており、Jukeboxと人間が生成した音楽の間には「大きな隔たり」があることを認めています。The Vergeは「たとえ結果が馴染みのある曲のぼんやりとしたバージョンのように聞こえるとしても、技術的には素晴らしい」と述べ、Business Insiderは「驚くべきことに、生成された楽曲の中にはキャッチーで、本物らしく聞こえるものもある」と述べています。[ 120 ] [ 121 ] [ 122 ]
ユーザーインターフェース
ディベートゲーム
2018年、OpenAIは「ディベートゲーム」を立ち上げました。これは、人間の審査員の前で機械におもちゃの問題を議論させるゲームです。このアプローチがAIの意思決定の監査や説明可能なAIの開発に役立つかどうかを研究することが目的です。[ 123 ] [ 124 ]
顕微鏡
2020年にリリースされたMicroscope [ 125 ]は、解釈可能性の研究でよく用いられる8つのニューラルネットワークモデルの主要な層とニューロンの可視化コレクションです。[ 126 ] Microscopeは、これらのニューラルネットワーク内部で形成される特徴を容易に分析するために作成されました。含まれるモデルは、 AlexNet、VGG-19、Inceptionの様々なバージョン、CLIP Resnetの様々なバージョンです。[ 127 ]
チャットGPT

ChatGPTは2022年11月にリリースされた生成型AIチャットボットで、OpenAIのGPTモデルを用いてコンテンツを生成します。ユーザーはテキストまたは音声による会話でChatGPTとインタラクションできます。DALL -E 3の後継であるGPT-4oを用いて画像を生成することもできます。[ 128 ] ChatGPTはリリース後2ヶ月で1億人のユーザーを獲得しました。[ 129 ]
OpenAIは、Plus、Pro、Team、Enterpriseという複数のサブスクリプションプランを開始しました。ChatGPTの無料プランをご利用のお客様はGPT-4oにアクセスできますが、利用制限が制限されています。ChatGPTのサブスクリプション「Plus」、「Pro」、「Team」、「Enterprise」では、利用制限が引き上げられ、追加の機能やモデルにアクセスできます。[ 130 ]
2023年5月、OpenAIはiOSのApp Store向けにChatGPTのユーザーインターフェースをリリースし、その後2023年7月にはAndroidのPlay Store向けにリリースした。 [ 131 ] 2024年12月、OpenAIはユーザーが月に最大15分間ChatGPTを無料で通話できる新機能をリリースした。[ 132 ] [ 133 ]
検索GPT
OpenAIが開発したプロトタイプ検索エンジン「SearchGPT」は、2024年7月25日に公開され、当初は1万人のテストユーザーに限定リリースされました。SearchGPTは、従来の検索エンジンの機能と生成AI機能を組み合わせています。[ 134 ] [ 135 ]
ChatGPTアトラス
2025年10月、OpenAIはChatGPT Atlasと呼ばれるウェブブラウザをリリースした。[ 136 ] [ 137 ]
スターゲイトとその他のスーパーコンピュータ
2024年に発表されたスターゲイトは、当初はOpenAIとMicrosoftが共同でデータセンターを建設する1000億ドル規模のプロジェクトでした。 [ 138 ]「スターゲイト」という名前は、1994年のSF映画『スターゲイト』へのオマージュです。[ 139 ]最終的には、2025年1月にOpenAI、 Oracle、SoftBank、MGXのパートナーシップとして設立されたStargate LLCという会社になりました。[ 140 ] [ 138 ]
ハードウェア開発
2025年5月21日、OpenAIは元Appleデザイナーのジョニー・アイブ氏が設立したAIハードウェアスタートアップのioの買収を発表しました。[ 141 ]約65億ドル相当のこの取引は、OpenAIが消費者向けハードウェア市場への戦略的参入を示すものです。[ 142 ] iPhone、iPad、iMacの設計で知られるアイブ氏が、OpenAIのハードウェアと設計の取り組みを主導します。[ 143 ]
OpenAIのCEO、サム・アルトマン氏とアイブ氏は、従来の画面やインターフェースを超越するAIネイティブデバイスの開発という共通のビジョンを表明した。具体的な製品の詳細は明らかにされていないものの、ワシントン・ポスト紙は、アイブ氏とアルトマン氏が既に新製品の開発に取り組んでいると報じている。「私が開発を進めている最初の製品は、まさに私の想像力を完全に捉えたものでした」とジョニー・アイブ氏は述べた。アルトマン氏はさらに、「これは世界がこれまで目にした中で最もクールなテクノロジーになると思います」と付け加えた。[ 144 ] [ 141 ]
同社はまた、汎用ロボットの開発を目標にロボット工学分野での取り組みも開始している。[ 145 ]
参考文献
このセクションでは、OpenAI の GPT モデルに関する主要な公式出版物を一覧表示します。
- GPT-1: レポート、GitHubリリース。[ 146 ]
- GPT-2: ブログ発表、[ 147 ]「段階的リリース」の決定に関する報告、[ 148 ] GitHubリリース。[ 149 ]
- GPT-3: レポート。[ 150 ]今後GitHubやその他の形式でのコードリリースは行われません。
- WebGPT: ブログでの発表、[ 151 ]レポート。[ 152 ]
- InstructGPT: ブログのお知らせ、[ 153 ]レポート。[ 154 ]
- ChatGPT: ブログでのお知らせ[ 155 ] (報告なし)。
- GPT-4: ブログでの発表、[ 156 ]レポート、[ 157 ] [ 158 ]モデルカード。[ 159 ]
- GPT-4o: ブログでのお知らせ。[ 160 ]
- GPT-4.5: ブログのお知らせ。[ 161 ]
- GPT-4.1: ブログのお知らせ。[ 162 ]
- GPT-OSS: ブログでの発表、[ 99 ]モデルカード。[ 101 ]
- GPT-5: ブログのお知らせ。[ 163 ]
参照
注記
参考文献
- ^ Wiggers, Kyle (2021年7月16日). 「OpenAI、ロボット工学研究チームを解散」 . VentureBeat . 2023年2月12日時点のオリジナルよりアーカイブ。 2023年2月12日閲覧。
- ^ Lee, Dave (2019年10月15日). 「ロボットがルービックキューブを解く、しかし壮大な挑戦ではない」 . BBCニュース. 2020年4月3日時点のオリジナルよりアーカイブ。 2020年2月29日閲覧。
- ^ Dave Gershgorn (2016年4月27日). 「イーロン・マスクの人工知能グループがAI訓練のための『ジム』を開設」Popular Science . 2016年4月30日時点のオリジナルよりアーカイブ。 2016年4月29日閲覧。
- ^ Greg Brockman、John Schulman (2016年4月27日). 「OpenAI Gym Beta」 . OpenAI Blog . OpenAI. 2019年2月26日時点のオリジナルよりアーカイブ。 2016年4月29日閲覧。
- ^ "openai/gym" . GitHub . 2024年8月23日時点のオリジナルよりアーカイブ。 2024年8月29日閲覧。
2021年からGymをメンテナンスしてきたチームは、今後の開発をすべてGymの代替となるGymnasium(import gymnasium as gym)に移行しました。そのため、Gymは今後アップデートを受けなくなります。
- ^ 「Farama Foundationの発表 - オープンソース強化学習の未来」The Farama Foundation . 2022年10月25日. 2024年8月29日時点のオリジナルよりアーカイブ。2024年8月29日閲覧。
- ^ “Gym Retro” . OpenAI . 2018年5月25日. 2023年2月12日時点のオリジナルよりアーカイブ。2023年2月12日閲覧。
- ^ a b c「AI力士が未来のロボットをより機敏にする可能性がある」 Wired 、 2017年10月11日。2017年11月7日時点のオリジナルよりアーカイブ。2017年11月2日閲覧。
- ^ 「OpenAIのグーフィーな相撲ボットは見た目よりも賢い」 MITテクノロジーレビュー。2018年11月9日時点のオリジナルよりアーカイブ。 2017年11月2日閲覧。
- ^ Savov, Vlad (2017年8月14日). 「私のお気に入りのゲームがキラーAIボットとイーロン・マスクの誇大宣伝に侵略された」 The Verge . 2018年6月26日時点のオリジナルよりアーカイブ。 2018年6月25日閲覧。
- ^ Frank, Blair Hanley. 「OpenAIのボットがDota 2のトッププレイヤーを圧倒し、プレイヤーは退場」。Venture Beat 。 2017年8月12日時点のオリジナルよりアーカイブ。 2017年8月12日閲覧。
- ^ “Dota 2” . blog.openai.com . 2017年8月11日.オリジナルより2017年8月11日時点のアーカイブ。 2017年8月12日閲覧。
- ^ “More on Dota 2” . blog.openai.com . 2017年8月16日. 2019年2月23日時点のオリジナルよりアーカイブ。 2017年8月16日閲覧。
- ^ a b Simonite, Tom. 「ボットはeスポーツ最大規模の試合で人間を出し抜くことができるか?」 Wired . 2018年6月25日時点のオリジナルよりアーカイブ。 2018年6月25日閲覧。
- ^ Kahn, Jeremy (2018年6月25日). 「イーロン・マスクが支援するボットがビデオゲーム界でAIのブレイクスルーを実現」 . Bloomberg.com . Bloomberg LP . 2018年6月27日時点のオリジナルよりアーカイブ。 2018年6月27日閲覧。
- ^ Clifford, Catherine (2018年6月28日). 「ビル・ゲイツ氏、イーロン・マスクが支援する非営利団体のゲーマーボットはAIにおける『大きなマイルストーン』だと語る」 CNBC. 2018年6月28日時点のオリジナルよりアーカイブ。 2018年6月29日閲覧。
- ^ “OpenAI Five Benchmark” . blog.openai.com . 2018年7月18日. 2019年2月13日時点のオリジナルよりアーカイブ。 2018年8月25日閲覧。
- ^ Vincent, James (2018年6月25日). 「AIボットは1日180年トレーニングし、Dota 2で人間に勝利した」 The Verge . 2018年6月25日時点のオリジナルよりアーカイブ。 2018年6月25日閲覧。
- ^ Savov, Vlad (2018年8月6日). 「OpenAI Dota 2ボットが元プロチームを破る」 . The Verge . 2018年8月7日時点のオリジナルよりアーカイブ。2018年8月7日閲覧。
- ^ Simonite, Tom. 「プロゲーマー、イーロン・マスク支援のAIボットを今のところは阻止」 Wired . 2018年8月24日時点のオリジナルよりアーカイブ。 2018年8月25日閲覧。
- ^ Quach, Katyanna. 「ゲームオーバー、マシン:ビデオゲームオリンピックで人間が再びOpenAIボットを破る」The Register . 2018年8月25日時点のオリジナルよりアーカイブ。2018年8月25日閲覧。
- ^ “The International 2018: Results” . blog.openai.com . 2018年8月24日.オリジナルより2018年8月24日時点のアーカイブ。 2018年8月25日閲覧。
- ^ Statt, Nick (2019年4月13日). 「OpenAIのDota 2 AIが世界チャンピオンのeスポーツチームを圧倒、連続勝利」 The Verge . 2019年4月15日時点のオリジナルよりアーカイブ。 2019年7月20日閲覧。
- ^ 「OpenAI Fiveのトレーニング方法」 OpenAIブログ2019年4月15日。2019年6月30日時点のオリジナルよりアーカイブ。2019年7月20日閲覧。
- ^ Wiggers, Kyle (2019年4月22日). 「OpenAIのDota 2ボット、公開マッチで99.4%のプレイヤーに勝利」 . Venture Beat . 2019年7月11日時点のオリジナルよりアーカイブ。 2019年4月22日閲覧。
- ^ Fangasadha, Edbert Felix; Soeroredjo, Steffi; Anderies; Gunawan, Alexander Agung Santoso (2022年9月17日). 「Dota 2のボットプレイヤーにおけるOpenAI Fiveのメカニズムに関する文献レビュー」. 2022 International Seminar on Application for Technology of Information and Communication (ISemantic) . IEEE. pp. 183– 190. doi : 10.1109/iSemantic55962.2022.9920480 . ISBN 978-1-6654-8837-2. S2CID 253047170 .
- ^ Vincent, James (2018年7月30日). 「OpenAI、ロボットの器用さに新たなベンチマークを設定」 . The Verge . 2023年2月12日時点のオリジナルよりアーカイブ。 2023年2月12日閲覧。
- ^ OpenAI;アンドリホビッチ、マルシン。ベイカー、ボーエン。チョシエジ、マチェジ。ユゼフォヴィチ、ラファウ;ボブ・マクグルー。パチョッキ、ヤクブ。ペトロン、アーサー。プラパート、マティアス;パウエル、グレン。レイ、アレックス。シュナイダー、ジョナス。シドル、シモン。トービン、ジョシュ。ウェンダー、ピーター。ウェン、リリアン。ザレンバ、ヴォイチェフ (2019)。 「器用な手の操作を学ぶ」。arXiv : 1808.00177v5 [ cs.LG ]。
- ^ OpenAI;アッカヤ、イルゲ。アンドリホビッチ、マルシン。チョシエジ、マチェク。リトウィン、マテウシュ。ボブ・マクグルー。ペトロン、アーサー。パイノ、アレックス。プラパート、マティアス;パウエル、グレン。リバス、ラファエロ(2019)。 「ロボットハンドでルービックキューブを解く」。arXiv : 1910.07113v1 [ cs.LG ]。
- ^ a b “OpenAI API” . OpenAI . 2020年6月11日.オリジナルより2020年6月11日アーカイブ。 2020年6月14日閲覧。
OpenAIはなぜモデルをオープンソース化するのではなく、APIのリリースを選択したのでしょうか。
主な理由は3つあります。第一に、技術を商用化することで、継続的なAI研究、安全性、ポリシーへの取り組みの費用を賄うことができます。第二に、APIの基盤となるモデルの多くは非常に大規模で、開発と展開に多くの専門知識が必要であり、運用コストが非常に高くなります。そのため、大企業以外は基盤となる技術の恩恵を受けることが困難です。APIによって、強力なAIシステムを中小企業や組織がより利用しやすくなることを期待しています。第三に、APIモデルによって、技術の誤用への対応が容易になります。私たちのモデルの下流での使用例を予測するのは難しいため、有害なアプリケーションがあることが判明した場合にアクセスを調整できない
オープンソース
モデルをリリースするよりも、API 経由でモデルをリリースし、徐々にアクセスを拡大していく方が本質的に安全だと考えています。
- ^ Coldewey, Devin (2020年6月11日). 「OpenAI、テキストベースAI機能向けの汎用APIを開発」 . TechCrunch . 2020年6月12日時点のオリジナル記事よりアーカイブ。2020年6月11日閲覧。OpenAI
の誇る機械学習ツールセットを試してみたかったなら、ずっと簡単になりました。同社は、開発者が「事実上あらゆる英語タスク」で同社のAIツールを呼び出せるAPIをリリースしました。
- ^ Hawley, Michelle. 「OpenAI、AIエージェント開発を効率化するAgentKitを発表」 VKTR.com . 2025年10月6日閲覧。
- ^ 「GPT-1からGPT-4まで:OpenAIのGPTモデルそれぞれの説明と比較」 2023年4月11日。2023年4月15日時点のオリジナルよりアーカイブ。 2023年4月29日閲覧。
- ^ Zhu, Yukun; Kiros, Ryan; Zemel, Rich; Salakhutdinov, Ruslan; Urtasun, Raquel; Torralba, Antonio; Fidler, Sanja (2015). Aligning Books and Movies: Towards Story-Like Visual Explains by Watching Movies and Reading Books . IEEE International Conference on Computer Vision (ICCV) 2015. pp. 19– 27. arXiv : 1506.06724 . 2023年2月5日時点のオリジナルよりアーカイブ。 2023年2月7日閲覧。
- ^ a b「教師なし学習による言語理解の向上」 openai.com 2018年6月11日. 2023年3月18日時点のオリジナルよりアーカイブ。2023年3月18日閲覧。
- ^ Vincent, James (2019年11月7日). 「OpenAIは、共有するには危険すぎるとされるテキスト生成AIを公開した」 . The Verge . 2020年6月11日時点のオリジナルよりアーカイブ。 2023年4月28日閲覧。
- ^ a b c Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini; Herbert-Voss, Ariel; Krueger, Gretchen; Henighan, Tom; Child, Rewon; Ramesh, Aditya; Ziegler, Daniel M.; Wu, Jeffrey; Winter, Clemens; Hesse, Christopher; Chen, Mark; Sigler, Eric; Litwin, Mateusz; Gray, Scott; Chess, Benjamin; Clark, Jack; Berner, Christopher; McCandlish, Sam; Radford, Alec; Sutskever, Ilya; Amodei, Dario (2020年5月28日). 「言語モデルは少数ショット学習者である」NeurIPS . arXiv : 2005.14165v4 .
- ^ a b c「ML入力トレンドの視覚化」。Epoch 。 2023年7月16日時点のオリジナルよりアーカイブ。2023年5月2日閲覧。
- ^ Ver Meer, Dave (2023年6月1日). 「ChatGPT統計」 . NamePepper . 2023年6月5日時点のオリジナルよりアーカイブ。 2023年6月9日閲覧。
- ^ OpenAI (2023). 「GPT-4技術レポート」(PDF) . 2023年3月14日時点のオリジナルよりアーカイブ(PDF) . 2023年3月16日閲覧。
- ^ “GPT-4には1兆以上のパラメータがある – レポート” . 2023年3月25日. 2024年3月4日時点のオリジナルよりアーカイブ。2023年10月23日閲覧。
- ^ 「生成的事前トレーニングによる言語理解の向上」(PDF)。2021年1月26日時点のオリジナルよりアーカイブ(PDF) 。 2020年6月9日閲覧。
- ^ a b Hern, Alex (2019年2月14日). 「新しいAI偽テキストジェネレーターはリリースするには危険すぎるかもしれない、とクリエイターは言う」 . The Guardian . 2019年2月14日時点のオリジナルよりアーカイブ。 2019年2月14日閲覧。
- ^ Schwartz, Oscar (2019年7月4日). 「『偽テキスト』は次なる世界的な政治的脅威となるか?」 . The Guardian . 2019年7月16日時点のオリジナルよりアーカイブ。 2019年7月16日閲覧。
- ^ Vincent, James (2019年2月14日). 「OpenAIの新しい多才なAIは、文章を書き、翻訳し、中傷する」 The Verge . 2020年12月18日時点のオリジナルよりアーカイブ。 2019年7月16日閲覧。
- ^ “GPT-2: 1.5B Release” . OpenAI . 2019年11月5日. 2019年11月14日時点のオリジナルよりアーカイブ。2019年11月14日閲覧。
- ^ “Write With Transformer” . 2019年12月4日時点のオリジナルよりアーカイブ。2019年12月4日閲覧。
- ^ “Talk to Transformer” . 2019年12月4日時点のオリジナルよりアーカイブ。2019年12月4日閲覧。
- ^ “CreativeEngines” . 2023年2月3日時点のオリジナルよりアーカイブ。2021年6月25日閲覧。
- ^言語モデルは教師なしマルチタスク学習器である(PDF)、2019年12月12日のオリジナルからアーカイブ(PDF) 、 2019年12月4日取得
- ^ "openai/gpt-3" . OpenAI. 2020年5月29日. 2020年11月14日時点のオリジナルよりアーカイブ。2020年5月29日閲覧。
- ^ Sagar, Ram (2020年6月3日). 「OpenAIがこれまでで最大のモデルGPT-3をリリース」 . Analytics India Magazine . 2020年8月4日時点のオリジナルよりアーカイブ。 2020年6月14日閲覧。
- ^ a b c d Brown, Tom; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini (2020年6月1日). 「言語モデルは少数ショット学習器である」. p. 付録. arXiv : 2005.14165 [ cs.CL ].
- ^言語モデルは教師なしマルチタスク学習器である(PDF)、2019年12月12日のオリジナルからアーカイブ(PDF) 、 2019年12月4日取得、
GPT-2は15億パラメータのTransformerである
- ^ Brown, Tom; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini (2020年6月1日). 「言語モデルは少数ショット学習者だ」. arXiv : 2005.14165 [ cs.CL ].
GPT-2からGPT-3では学習能力が2桁以上向上するため、
- ^ Ray, Tiernan (2020). 「OpenAIの巨大なGPT-3はAI向け言語モデルの限界を示唆している」 ZDNet. 2020年6月1日時点のオリジナルよりアーカイブ。 2020年6月5日閲覧。
- ^ Amodei, Dario; Hernandez, Danny (2018年5月16日). 「AIとコンピューティング」 . 2020年6月17日時点のオリジナルよりアーカイブ。 2020年8月30日閲覧。1
ペタフロップス/秒日(pfs-day)は、1秒間に10
15 回の
ニューラルネット演算を1日で実行すること、つまり合計で約10
20 回
の処理を実行することに相当する。この演算時間は、エネルギーにおけるkW-時間と同様に、精神的な便宜を図るためのものである。
- ^ Eadicicco, Lisa. 「イーロン・マスクが設立を支援した人工知能企業が、以前は発売するには危険すぎると述べていたテキスト生成ソフトウェアを現在販売している」。Business Insider。2020年11月14日時点のオリジナルよりアーカイブ。 2020年7月6日閲覧。
- ^ 「OpenAIがMicrosoftにGPT-3言語モデルへの独占アクセスを提供」 MITテクノロジーレビュー。2021年2月5日時点のオリジナルよりアーカイブ。 2020年9月24日閲覧。
- ^ 「Microsoft、OpenAIのGPT-3言語モデルの独占ライセンスを取得」。VentureBeat 。 2020年9月22日。2020年11月8日時点のオリジナルよりアーカイブ。2020年9月24日閲覧。
- ^ a b Alford, Anthony (2021年8月31日). 「OpenAI、120億パラメータのコード生成AI Codexを発表」 . InfoQ . 2022年7月9日時点のオリジナルよりアーカイブ。 2021年9月3日閲覧。
- ^ a b Wiggers, Kyle (2021年7月8日). 「OpenAI、GitHubのCopilotを支えるAIはバイアスの影響を受けやすい可能性があると警告」 . VentureBeat . 2023年2月3日時点のオリジナルよりアーカイブ。 2021年9月3日閲覧。
- ^ Zaremba, Wojciech (2021年8月10日). 「OpenAI Codex」 . OpenAI . 2023年2月3日時点のオリジナルよりアーカイブ。2021年9月3日閲覧。
- ^ Dickson, Ben (2021年8月16日). 「OpenAIのCodex APIに期待すること」 . VentureBeat . 2023年2月3日時点のオリジナルよりアーカイブ。 2021年9月3日閲覧。
- ^ Claburn, Thomas (2021年8月25日). 「GitHubのCopilotは、約40%の確率で危険な領域に誘導する可能性がある - 研究」 . The Register . 2023年2月3日時点のオリジナルよりアーカイブ。 2021年9月3日閲覧。
- ^ 「OpenAIは法的トラブルを招く可能性がある」。Analytics India Magazine。2023年3月21日。2023年3月23日時点のオリジナルよりアーカイブ。2023年3月23日閲覧。
- ^ Vincent, James (2023年3月14日). 「OpenAI、次世代AI言語モデルGPT-4を発表」 The Verge . 2023年3月14日時点のオリジナルよりアーカイブ。 2023年3月14日閲覧。
- ^ Wiggers, Kyle (2023年3月14日). 「OpenAI、最先端技術を謳うマルチモーダルAI「GPT-4」をリリース」 TechCrunch . 2023年3月15日時点のオリジナルよりアーカイブ。 2023年3月14日閲覧。
- ^ Belfield, Haydn (2023年3月25日). 「AIモデルを販売するなら、安全でなければならない」 . Vox . 2023年3月28日時点のオリジナルよりアーカイブ。2023年3月30日閲覧。
- ^ Roose, Kevin (2023年9月28日). 「新しいChatGPTは『見る』ことも『話す』こともできる。その実力とは?」ニューヨーク・タイムズ. 2023年10月31日時点のオリジナルよりアーカイブ。 2023年12月1日閲覧。
- ^ヴィンセント・ジェームズ(2023年3月15日)「OpenAIの共同創設者、研究の公開に関する同社の過去の取り組みについて語る:「私たちは間違っていました」」「」。The Verge。2023年3月17日時点のオリジナルよりアーカイブ。 2023年3月18日閲覧。
- ^ Wiggers, Kyle (2024年5月13日). 「OpenAIがGPT-4o 'omni'モデルを発表、ChatGPTに搭載」 TechCrunch . 2024年5月22日時点のオリジナルよりアーカイブ。 2024年5月13日閲覧。
- ^ van Rijmenam, Mark (2024年5月13日). 「OpenAIがGPT-4oを発表:AIインタラクションの未来はここに」 . The Digital Speaker . 2024年5月17日時点のオリジナルよりアーカイブ。 2024年5月17日閲覧。
- ^ Daws, Ryan (2024年5月14日). 「GPT-4oはテキスト、音声、視覚の統合により人間のようなAIインタラクションを実現」 . AI News . 2024年5月18日時点のオリジナルよりアーカイブ。 2024年5月18日閲覧。
- ^ “Hello GPT-4o” . OpenAI . 2024年5月14日時点のオリジナルよりアーカイブ。 2024年7月14日閲覧。
- ^ Franzen, Carl (2024年7月18日). 「OpenAI、GPT-4o miniを発表 ― より小型で、はるかに安価なマルチモーダルAIモデル」 . VentureBeat . 2024年7月18日時点のオリジナルよりアーカイブ。 2024年7月18日閲覧。
- ^ Zeff, Kyle Wiggers, Maxwell (2025年3月25日). 「ChatGPTの画像生成機能がアップグレード」 . TechCrunch . 2025年3月27日閲覧。
{{cite web}}: CS1 maint: 複数の名前: 著者リスト (リンク) - ^ノベ、ヨルダン (2025-02-27). 「OpenAI、次期汎用大規模言語モデルである GPT-4.5 を発表」 . CNBC 。2025 年 3 月 18 日に取得。
- ^ Weatherbed, Jess (2025年4月14日). 「OpenAI、GPT-4.1フラッグシップAIモデルを発表」 The Verge . 2025年4月15日閲覧。
- ^ 「APIにGPT-4.1を導入」 openai.com 2025年4月15日閲覧。
- ^ウィル・ナイト「OpenAIの新しいGPT 4.1モデルはコーディングに優れている」 Wired.ISSN 1059-1028 . 2025年4月15日閲覧。
- ^ 「開発者向けGPT-5の紹介」 OpenAI 2025年8月7日2025年8月9日閲覧。
- ^ Robison, Kylie. 「OpenAIがついにGPT-5をリリース。知っておくべきことはすべてここに」 Wired . ISSN 1059-1028 . 2025年8月9日閲覧。
- ^ 「ChatGPT-5が今月登場 ― 次に何が起こるか準備はできていますか?」 The Economic Times 2025年8月6日ISSN 0013-0389 . 2025年8月9日閲覧。
- ^ 「OpenAIのGPT-5モデルは高い期待に応えられるか?」フィナンシャル・タイムズ、2025年8月8日。 2025年8月9日閲覧。
- ^ウィル・ナイト「OpenAI、困難な問題を段階的に解決する新AIモデル『ストロベリー』を発表」 Wired . ISSN 1059-1028 . 2024年9月14日時点のオリジナルよりアーカイブ。 2024年9月14日閲覧。
- ^ Robison, Kylie (2024年9月12日). 「OpenAI、推論機能を備えた初のモデル「o1」をリリース」 The Verge . 2024年9月13日時点のオリジナルよりアーカイブ。 2024年9月17日閲覧。
- ^ Franzen, Carl (2024年12月5日). 「OpenAI、画像のアップロードと分析機能を備えた完全なO1モデルを発表、ChatGPT Proも発表」 . VentureBeat . 2024年12月7日時点のオリジナルよりアーカイブ。 2024年12月7日閲覧。
- ^ Wiggers, Kyle (2025年3月19日). 「OpenAIのo1-proは同社史上最も高価なAIモデル」 . TechCrunch . 2025年3月21日閲覧。
- ^ Zeff, Maxwell; Wiggers, Kyle (2024年12月20日). 「OpenAIが新しいo3モデルを発表」 . TechCrunch . 2024年12月20日時点のオリジナルよりアーカイブ。 2024年12月20日閲覧。
- ^ウィル・ナイト「OpenAI、推論スキルの向上により最もスマートなAIモデルをアップグレード」 Wired誌。ISSN 1059-1028 。 2024年12月20日時点のオリジナルよりアーカイブ。 2024年12月20日閲覧。
- ^ 「安全性テストのための早期アクセス」 OpenAI 2024年12月20日。2024年12月21日時点のオリジナルよりアーカイブ。 2024年12月23日閲覧。
- ^ Zeff, Maxwell; Wiggers, Kyle (2024年12月20日). 「OpenAIが新しいo3モデルを発表」 . TechCrunch . 2024年12月20日時点のオリジナルよりアーカイブ。2024年12月23日閲覧。
- ^ 「OpenAI、新しいAI推論モデルo3と04-miniを発表。旧モデルは段階的に廃止へ」The Hindu、The Hindu Bureau、2025年4月17日。ISSN 0971-751X 。 2025年4月17日閲覧。
- ^ 「OpenAI、研究タスクを容易にする新たなAIツールを発表」ロイター2025年2月3日 – www.reuters.com経由。
- ^ Lawler, Richard (2025年2月3日). 「ChatGPTのエージェントがあなたに代わって詳細な調査を実施できるようになりました」 . The Verge . 2025年2月5日閲覧。
- ^ 「OpenAI、すべてのChatGPTユーザー向けに無料の軽量ディープリサーチツールを提供開始」 India Today、2025年4月25日。 2025年4月25日閲覧。
- ^ 「OpenAI、ChatGPT研究ツールのコスト効率の高い軽量版を発表」 The Times of India . 2025年4月25日. ISSN 0971-8257 . 2025年4月25日閲覧。
- ^ a b「gpt-ossの紹介」 . openai.com . 2025年8月4日. 2025年8月5日閲覧。
- ^ Heath, Alex (2025年8月5日). 「OpenAI、ノートパソコンで実行できる無料のGPTモデルをリリース」 The Verge . 2025年8月5日閲覧。
- ^ a b c「gpt-oss-120b & gpt-oss-20b モデルカード」 . openai.com . 2025年8月5日. 2025年8月5日閲覧。
- ^ “CLIP: テキストと画像を繋ぐ” . 2021年1月5日. 2021年3月25日時点のオリジナルよりアーカイブ。2021年3月27日閲覧。
- ^ “DALL·E: テキストから画像を作成する” . 2021年1月5日. 2021年3月27日時点のオリジナルよりアーカイブ。2021年3月27日閲覧。
- ^ “DALL·E 2” . OpenAI . 2022年4月6日時点のオリジナルよりアーカイブ。 2022年4月6日閲覧。
- ^ 「ChatGPT:科学者がOpenAIのチャットボットの隠れた才能と落とし穴を解説」 BBC Science Focus Magazine 2022年。2023年2月3日時点のオリジナルよりアーカイブ。2022年12月30日閲覧。
- ^ 「OpenAIの新しいAI画像ジェネレーターは、細部とプロンプトの忠実度の限界を押し上げる」。2023年11月16日時点のオリジナルよりアーカイブ。2023年11月21日閲覧。
- ^ 「DALL·E 3がChatGPT PlusおよびEnterpriseで利用可能になりました」。2023年11月20日時点のオリジナルよりアーカイブ。2023年11月21日閲覧。
- ^ a b c Metz, Cade (2024年2月15日). 「OpenAI、目を見張るような動画を瞬時に生成するAIを発表」 . The New York Times . 2024年2月15日時点のオリジナルよりアーカイブ。 2024年2月16日閲覧。
- ^ 「ビデオ生成モデルを世界シミュレーターとして活用」 OpenAI、2024年2月15日。2024年2月16日時点のオリジナルよりアーカイブ。2024年2月16日閲覧。
- ^ a b c Brooks, Tim; Peebles, Bill; Holmes, Connor; DePue, Will; Guo, Yufei; Jing, Li; Schnurr, David; Taylor, Joe; Luhman, Troy; Luhman, Eric; Ng, Clarence Wing Yin; Wang, Ricky; Ramesh, Aditya (2024年2月15日). 「世界シミュレータとしてのビデオ生成モデル」 . Openai.com . OpenAI.オリジナルより2024年2月16日アーカイブ。 2024年2月16日閲覧。
- ^ Pequeño IV, Antonio (2024年2月15日). 「OpenAI、リアルなテキストから動画へのプロンプト表示が可能なAI動画モデル『Sora』を発表」 . Forbes . 2024年2月15日時点のオリジナルよりアーカイブ。 2024年2月16日閲覧。
- ^クラーク、エリヤ。「タイラー・ペリー、SORAデビューで100万スタジオの拡張が停止、AIの脅威を警告」Forbes。2024年3月24日閲覧。
- ^ 「SORA 2 is here」 . openai.com . 2025年9月30日. 2025年10月22日閲覧。
- ^ Wiggers, Kyle (2022年9月21日). 「OpenAI、多言語音声認識システムWhisperをオープンソース化」 TechCrunch . 2023年2月12日時点のオリジナルよりアーカイブ。 2023年2月12日閲覧。
- ^ Radford, Alec; Kim, Jong Wook; Xu, Tao; Brockman, Greg; McLeavey, Christine; Sutskever, Ilya (2022). 「大規模弱教師によるロバストな音声認識」. arXiv : 2212.04356 [ eess.AS ].
- ^ 「OpenAIのMuseNetはボタンを押すだけでAI音楽を生成」 The Verge、2019年4月。2019年6月28日時点のオリジナルよりアーカイブ。2020年6月8日閲覧。
- ^ “MuseNet” . OpenAI. 2019年4月25日. 2020年6月13日時点のオリジナルよりアーカイブ。2020年6月8日閲覧。
- ^ “Arcade Attack Podcast – September (4 of 4) 2020 - Alex Hall (Ben Drowned) - Interview” . Arcade Attack . 2020年9月28日. 2023年2月3日時点のオリジナルよりアーカイブ。 2023年1月29日閲覧。
- ^ Alexander Hall (2020年6月25日). 「ツイートにはタイトルがなく、アーカイブもされない」 . X (旧Twitter) . 2023年2月3日時点のオリジナルよりアーカイブ。 2023年1月29日閲覧。
- ^ 「OpenAI、ジャンルに特化した音楽を生成する新しいAIモデル「Jukebox」を発表」The Verge、2020年4月30日。2020年6月8日時点のオリジナルよりアーカイブ。 2020年6月8日閲覧。
- ^ Stephen, Bijan (2020年4月30日). 「OpenAI、ジャンルに特化した音楽を生成する新しいAIモデル「Jukebox」を発表」 . Business Insider . 2020年6月8日時点のオリジナルよりアーカイブ。 2020年6月8日閲覧。
- ^ “Jukebox” . OpenAI. 2020年4月30日. 2020年6月8日時点のオリジナルよりアーカイブ。2020年6月8日閲覧。
- ^ Greene, Tristan (2018年5月4日). 「OpenAIのディベートゲームは、あなたとあなたの友達にロボットのように嘘をつく方法を教えます」 . The Next Web . 2018年5月5日時点のオリジナルよりアーカイブ。 2018年5月31日閲覧。
- ^ 「なぜ科学者はAIシステムが互いに議論すべきだと考えるのか」 Fast Company、2018年5月8日。2018年5月19日時点のオリジナルよりアーカイブ。2018年6月2日閲覧。
- ^ “OpenAI Microscope” . 2020年4月14日. 2023年2月3日時点のオリジナルよりアーカイブ。 2021年3月27日閲覧。
- ^ Johnson, Khari (2020年4月14日). 「OpenAI、人気機械学習モデルのニューロンを視覚化するMicroscopeをローンチ」 . VentureBeat . 2023年2月12日時点のオリジナルよりアーカイブ。 2023年2月12日閲覧。
- ^ “OpenAI Microscope” . OpenAI Microscope . 2023年2月3日時点のオリジナルよりアーカイブ。 2021年3月27日閲覧。
- ^ 「ChatGPTの画像生成機能がアップグレード」 TechCrunch 2025年3月25日2025年6月12日閲覧。
- ^ Milmo, Dan (2023年12月2日). 「ChatGPT、ローンチから2ヶ月でユーザー数1億人を突破」 . The Guardian . ISSN 0261-3077 . 2023年2月3日時点のオリジナルよりアーカイブ。 2023年2月3日閲覧。
- ^ Sharma, Shubham (2024年5月14日). 「OpenAIがGPT-4oを無料で提供しているのに、ChatGPT Plusに誰がお金を払うべきなのか?」 VentureBeat . 2024年5月21日時点のオリジナルよりアーカイブ。 2024年5月21日閲覧。
- ^ Lawler, Richard (2023年7月25日). 「ChatGPT for Android is now available」 . The Verge . 2023年8月16日時点のオリジナルよりアーカイブ。2023年8月17日閲覧。
- ^ 「OpenAI、ChatGPTで15分間の無料通話を提供開始」 www.socialsamosa.com 2024年12月20日. 2024年12月20日時点のオリジナルよりアーカイブ。 2024年12月20日閲覧。
- ^ Field, Hayden (2024年12月18日). 「OpenAI、ChatGPTを電話とテキストで利用可能に」 . CNBC . 2024年12月20日時点のオリジナルよりアーカイブ。 2024年12月20日閲覧。
- ^ Robison, Kylie (2024年7月25日). 「OpenAI、AI搭載検索エンジンSearchGPTを発表」 The Verge . 2024年7月26日時点のオリジナルよりアーカイブ。 2024年7月27日閲覧。
- ^ Wiggers, Kyle (2024年7月25日). 「Googleを視野に入れ、OpenAIがSearchGPTを発表」 . TechCrunch .オリジナルより2024年7月26日時点のアーカイブ。2024年7月26日閲覧。
- ^ Jamali, Lily (2025年10月21日). 「ChatGPTメーカーのOpenAI、Googleに対抗すべくブラウザをリリース」 BBC . 2025年10月21日閲覧。
- ^ 「ChatGPT Atlasの紹介」 . openai.com . 2025年10月21日. 2025年10月22日閲覧。
- ^ a b Bajwa, Arsheeya; Simao, Paul; Gregorio, David (2024年3月29日). 「MicrosoftとOpenAI、10億ドル規模のデータセンタープロジェクトを計画、メディア報道」ロイター. 2024年6月20日時点のオリジナルよりアーカイブ。2024年6月6日閲覧。
- ^ 「MicrosoftとOpenAI、10億ドル規模のStargate AIスーパーコンピューターを計画」 The Information、2024年3月29日。 2024年6月6日閲覧。
- ^ 「スターゲイト:テック大手、最大10億ドル規模のAI計画を発表」 BBC 、 2025年1月22日。 2025年5月31日閲覧。
- ^ a b「SamとJonyがioを紹介」 openai.com 2025年5月21日閲覧。
- ^ Tatananni, Angela Palumbo|Mackenzie. 「OpenAI、iPhoneデザイナーのジョニー・アイブ氏のAIデバイススタートアップを10億ドルで買収へ。Apple株価は下落」。バロンズ。 2025年5月22日閲覧。
- ^ Peters, Jay (2025年5月21日). 「OpenAIがジョニー・アイブのAIハードウェア企業を買収」 The Verge . 2025年5月22日閲覧。
- ^ De Vynck, Gerrit (2025年5月21日). 「iPhoneデザイナーのジョニー・アイブ氏がOpenAIに入社し、AI搭載デバイスを開発」 .ワシントン・ポスト. 2025年5月21日閲覧。
- ^ Franzen, Carl (2025年1月10日). 「OpenAIがロボット工学チームの構築を開始」 . VentureBeat . 2025年8月25日閲覧。
- ^ finetune-transformer-lm、OpenAI、2018年6月11日、2023年5月19日時点のオリジナルよりアーカイブ。 2023年5月1日閲覧。
- ^ “GPT-2: 1.5B リリース” . OpenAI . 2019年11月5日. 2023年3月31日時点のオリジナルよりアーカイブ。2023年5月1日閲覧。
- ^ Solaiman, Irene ; Brundage, Miles; Clark, Jack; Askell, Amanda; Herbert-Voss, Ariel; Wu, Jeff; Radford, Alec; Krueger, Gretchen; Kim, Jong Wook; Kreps, Sarah; McCain, Miles; Newhouse, Alex; Blazakis, Jason; McGuffie, Kris; Wang, Jasmine (2019年11月12日). 「リリース戦略と言語モデルの社会的影響」. arXiv : 1908.09203 [ cs.CL ].
- ^ gpt-2、OpenAI、2023年5月1日、2023年3月11日時点のオリジナルよりアーカイブ、 2023年5月1日閲覧。
- ^ Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini; Herbert-Voss, Ariel; Krueger, Gretchen; Henighan, Tom; Child, Rewon; Ramesh, Aditya; Ziegler, Daniel M.; Wu, Jeffrey; Winter, Clemens; Hesse, Christopher; Chen, Mark; Sigler, Eric; Litwin, Mateusz; Gray, Scott; Chess, Benjamin; Clark, Jack; Berner, Christopher; McCandlish, Sam; Radford, Alec; Sutskever, Ilya; Amodei, Dario (2020年5月28日). 「言語モデルは少数ショット学習者である」NeurIPS . arXiv : 2005.14165v4 .
- ^ 「WebGPT:ウェブブラウジングによる言語モデルの事実精度の向上」OpenAI 2021年12月16日. 2023年6月21日時点のオリジナルよりアーカイブ。 2023年7月2日閲覧。
- ^ Nakano, Reiichiro; Hilton, Jacob; Balaji, Suchir ; Wu, Jeff; Ouyang, Long; Kim, Christina; Hesse, Christopher; Jain, Shantanu; Kosaraju, Vineet; Saunders, William; Jiang, Xu; Cobbe, Karl; Eloundou, Tyna; Krueger, Gretchen; Button, Kevin (2021年12月1日). “WebGPT: Browser-assisted question-answering with human feedback” . CoRR . arXiv : 2112.09332 . 2023年7月2日時点のオリジナルよりアーカイブ。 2023年7月2日閲覧。
- ^ 「指示に従う言語モデルの調整」 OpenAI 2024年2月14日2025年8月10日閲覧。
- ^ Ouyang, Long; Wu, Jeff; Jiang, Xu; Almeida, Diogo; Wainwright, Carroll L.; Mishkin, Pamela; Zhang, Chong; Agarwal, Sandhini; Slama, Katarina; Ray, Alex; Schulman, John; Hilton, Jacob; Kelton, Fraser; Miller, Luke; Simens, Maddie; Askell, Amanda; Welinder, Peter; Christiano, Paul; Leike, Jan; Lowe, Ryan (2022). 「人間のフィードバックによる指示に従う言語モデルのトレーニング」NeurIPS . arXiv : 2203.02155 .
- ^ 「ChatGPTの紹介」 OpenAI 2024年3月13日。
- ^ “GPT-4” . OpenAI . 2023年3月14日. 2023年3月14日時点のオリジナルよりアーカイブ。 2023年5月1日閲覧。
- ^ OpenAI (2023年3月27日). 「GPT-4技術レポート」. arXiv : 2303.08774 [ cs.CL ].
- ^ビュベック、セバスチャン;チャンドラセカラン、ヴァルン。エルダン、ロネン。ゲールケ、ヨハネス。エリック・ホーヴィッツ。カマル、エセ。リー、ピーター。リー、イン・タット。李元志。ランドバーグ、スコット。ノリ、ハルシャ。パランギ、ハミッド;リベイロ、マルコ・トゥーリオ。張毅(2023年4月13日)。 「汎用人工知能の火花: GPT-4 による初期の実験」。arXiv : 2303.12712 [ cs.CL ]。
- ^ GPT-4 システムカードArchived April 7, 2023, at the Wayback Machine , OpenAI, 2023年3月23日 (2023年5月22日にアクセス)。
- ^ “Hello GPT-4o” . OpenAI . 2024年5月13日. 2024年5月14日時点のオリジナルよりアーカイブ。2024年8月8日閲覧。
- ^ “GPT-4.5の紹介” . OpenAI . 2025年2月27日. 2025年3月19日時点のオリジナルよりアーカイブ。2025年3月18日閲覧。
- ^ 「APIにGPT-4.1を導入」OpenAI 2025年4月14日. 2025年5月17日時点のオリジナルよりアーカイブ。2025年4月14日閲覧。
- ^ 「GPT-5の紹介」 . openai.com . 2025年8月7日. 2025年8月11日閲覧。