世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

OpenAIのGPT-5.5とは何か？「仕事を任せるAI」が一段階進化した話

キーポイント

GPT-5.5 は、OpenAIが発表した新しい高性能モデル
コーディング、調査、データ分析、文書作成、ソフトウェア操作などを、複数のツールをまたいで自律的に進められる
速度を落とさずに性能を上げたのが大きな特徴
エージェント型コーディングやナレッジワーク、科学研究で特に強い
安全対策もかなり強化されており、サイバーセキュリティ面の管理も重視されている
ChatGPTとCodexで提供開始、APIは近日対応予定

GPT-5.5は「ただ賢いAI」ではなく、「仕事を進めるAI」

OpenAIがGPT-5.5を発表しました。ひとことで言うと、「会話がうまいAI」から「実務をかなり任せられるAI」へ、また一歩進んだという印象です。

OpenAIの説明では、GPT-5.5は「これまでで最も高性能で、直感的に使えるモデル」。しかも今回のポイントは、単にベンチマークの数字が良いだけではありません。コードを書く、デバッグする、ネットで調べる、データを分析する、ドキュメントやスプレッドシートを作る、ソフトウェアを操作するといった、実際の仕事の流れそのものを支援できるように設計されているのが大きいです。

ここ、かなり重要だと思います。AIの進化って、つい「文章がうまい」「知識が多い」で見てしまいがちですが、実際の価値はそこだけではありません。
人間がいちいち細かく指示しなくても、途中で確認しながら作業を進めてくれるか。この差が、体感としてはものすごく大きいです。

何が新しいのか：複雑な作業を“丸ごと”任せやすい

GPT-5.5の特徴としてOpenAIが強く押し出しているのは、ユーザーの意図を素早く理解し、自律的に作業を進めることです。

たとえば、ただ「このコード直して」ではなく、

どこが壊れているかを探す
仮説を立てる
ツールで確認する
テストする
必要なら関連箇所も修正する

という流れを、かなり一貫してこなせるわけです。

これが刺さるのは、整理されていないタスクです。
たとえば「この資料、いろんなファイルに情報が散らばっていて面倒」「このバグ、原因が曖昧で追うのがつらい」「この調査、何から手をつけるべきかわからない」みたいな案件ですね。

個人的には、AIが本当に役立つのは、むしろ“きれいに説明されていない仕事”を扱うときだと思っています。現実の仕事って、最初から要件が整っていることのほうが少ないので。GPT-5.5は、その泥臭い部分にかなり寄せてきた印象です。

コーディング性能がかなり強い

今回の記事で最も目立つのは、やはりコーディング能力の強化です。OpenAIはGPT-5.5を「現時点で最も高性能なエージェント型コーディングモデル」と位置づけています。

エージェント型コーディングって何？

簡単にいうと、AIが単発でコードを書くだけでなく、計画→実装→確認→修正を自分で回しながら作業するタイプの使い方です。
いわば「コードを書けるチャットAI」から、「半分くらいは手を動かしてくれるエンジニア補助」への進化です。

OpenAIによると、GPT-5.5は以下のような評価で高いスコアを記録しています。

Terminal-Bench 2.0: 82.7%
SWE-Bench Pro: 58.6%
Expert-SWE: GPT-5.4を上回る

特にTerminal-Bench 2.0では、複雑なコマンドライン作業で高い成績を出したとのことです。
また、実際のGitHub Issueを解決するSWE-Bench Proで、一度の実行で最後まで解けるタスクが増えたというのは地味ですが大事です。AIコーディングは、途中で中途半端に終わると逆に面倒なので、ここが改善されるほど実務で使いやすくなります。

「速いのに強い」が今回の売り

高性能なモデルは、普通は重くなって遅くなりがちです。ところがGPT-5.5は、GPT-5.4と同等のレイテンシ（応答の遅れ）を保ちながら、より高性能だとされています。しかも、同じCodexタスクをより少ないトークンで完了できるケースが多いそうです。

トークンというのは、ざっくり言えばAIが文章を処理するときの“単位”です。少なくて済むなら、速度やコストの面で有利になりやすい。
つまりGPT-5.5は、賢いだけでなく、効率も良いわけです。これは実務ではかなり強いです。

ビジネス作業や日常業務にも効く

GPT-5.5の強みは、ソフトウェア開発だけではありません。OpenAIは、ナレッジワークにもかなり効くと説明しています。

ナレッジワークとは、知識を扱う仕事のこと。
たとえば、

調査
資料作成
分析
要約
企画
スプレッドシート整理
スライド作成

あたりです。

GPT-5.5は、情報を集めて、重要点を見つけて、ツールを使い、結果を確認して、最後に形にする、という流れが得意だとされています。OpenAIの社内でも、ソフトウェア開発、財務、コミュニケーション、マーケティング、データサイエンス、プロダクトマネジメントなどで、毎週かなり広く使われているそうです。

たとえば財務部門では、大量のK-1納税書類をレビューし、前年より2週間短縮できたとしています。
こういう話は、派手ではないけれど実はすごく重要です。AIの価値って、目立つデモよりも、面倒で時間のかかる定型作業をどれだけ減らせるかに出るからです。

研究分野でも存在感を出している

OpenAIはGPT-5.5を、科学研究やデータ分析の領域でも強いと説明しています。

評価例としては、

GeneBench
BixBench

などが挙げられており、遺伝学やバイオインフォマティクスのような、複数段階の分析が必要な作業で高い性能を示したとしています。

ここで面白いのは、GPT-5.5が単に「答えを出す」だけでなく、
仮説を立てる → データを見る → 問題点を洗い出す → 追加で試すべきことを考える
という、研究者っぽい動きに近づいている点です。

もちろん、AIが研究者の代わりになるわけではありません。そこはかなり慎重に見るべきです。
ただ、**“最初のたたき台”を作る力**はかなり上がっているように見えます。研究では、この初速がとても大きい。ゼロから始めるのと、80点の下書きがあるのとでは全然違います。

数学の話まで出てくるのが面白い

記事では、社内版GPT-5.5がラムゼー数に関する新しい証明の発見に貢献した例も紹介されています。
ラムゼー数というのは、簡単にいうと「無秩序に見える中でも、ある規模を超えると必ず秩序が現れる」という組合せ論の話です。かなり難しい分野です。

これ、個人的にはかなりロマンを感じます。
AIがコードを書くのは想像しやすいですが、数学の証明に実際に貢献するとなると、一気に“知的作業の相棒”感が増します。もちろん誇張は禁物ですが、少なくともOpenAIは「単なる文章生成機」ではない世界を見せにきています。

安全対策もかなり強めにしている

高性能モデルが強くなるほど、悪用リスクも上がります。そこは当然、かなり重要です。
OpenAIもその点をかなり意識していて、GPT-5.5にはこれまでで最も強力な安全対策を導入したとしています。

特に重視しているのは、

不正利用の抑制
有益な用途は妨げないこと
サイバーセキュリティやバイオ関連の高リスク領域のテスト強化
社内外のレッドチームによる検証

です。

レッドチームというのは、わざと攻撃者っぽい立場から脆弱性や危険な挙動を探す専門チームのこと。
つまりOpenAIは、「便利にする」だけでなく「危ない使われ方をどう抑えるか」もセットでやっているわけです。

サイバーセキュリティ対応も前進

記事の後半では、サイバーセキュリティに関する話がかなり大きく扱われています。
GPT-5.5は、サイバー防衛を強化する方向で提供され、悪用につながりやすいリクエストにはより厳しい管理を導入しているとのことです。

一方で、認証済みの信頼できるユーザーには、より柔軟に使えるようにする仕組みも進めているそうです。
ここはかなり難しいバランスで、厳しくしすぎると有用性が落ちるし、緩すぎると危険です。OpenAIはその綱渡りをやっている、という理解がよさそうです。

どこで使えるのか

提供状況についても整理しておきます。

ChatGPT: Plus / Pro / Business / Enterpriseユーザー向けに提供開始
Codex: 同様に提供開始
GPT-5.5 Pro: ChatGPTのPro / Business / Enterpriseユーザー向けに提供開始
API: 近日中に提供予定

つまり、まずはChatGPTとCodexで触れられるようになり、APIは少し後、という流れです。
API提供時には別の安全対策が必要になるため、段階的に進めるようです。

率直にいうと、かなり「実務寄り」の進化

GPT-5.5の発表を見てまず感じたのは、AIが“話せる”段階から“仕事の進め方を変える”段階に入ってきたということです。

もちろん、ベンチマークの数字だけで現実の成果が保証されるわけではありません。そこは常に注意が必要です。
でも今回の発表は、単なる性能アピールというより、

実際に作業を進める力
複数ツールをまたいで動く力
長時間のタスクを継続する力
安全性を担保しながら広く使うための設計

この4つを同時に前に進めようとしているのが伝わってきます。

個人的には、GPT-5.5は「派手なデモ映え」より「毎日の仕事で効く」タイプの進化に見えます。
こういうモデルのほうが、使い始めるとじわじわ効いてくるので、後から評価が高くなる気がします。

まとめると

GPT-5.5は、OpenAIが「最も高性能」と位置づける新モデルで、特にコーディング、調査、データ分析、文書作成、コンピュータ操作のような実務に強いのが特徴です。
しかも、性能を上げながら速度も維持し、安全対策まで強化しているのがポイントです。

要するにこれは、**“AIに相談する”から“AIに任せる”への移行を後押しするモデル**だと言えるのではないでしょうか。

参考: GPT-5.5 が登場

同じ著者の記事

Gemini API File Searchがマルチモーダル対応に。RAGをもっと実用的にするGoogleの新アップデート

Googleが、Gemini APIのFile Searchツールを大きくアップデートしました。今回のポイントは、ざっくり言うと「テキストだけでなく画像もまとめて検索できるようになった」こと、そして「検索の根拠をページ単位で示しやすくなった」ことです。これ、地味に見えてかなり重要です。RAG（検索拡張生成）を実際にアプリへ入れようとすると、「欲しい情報がうまく見つからない」「どの資料のどこを根拠に答えたのか説明しにくい」といった壁にぶつかりがちなんですよね。Googleはそこを、かなり実務寄りに改善してきた印象です。 File Searchがmultimodal対応 テキストだけでなく、画像も一緒に扱えるようになった custom metadataに対応 ファイルに `department: Legal` のようなラベルを付けて、整理・絞り込みしやすくなる page-level citationsを追加 どのページを根拠に答えたかを示しやすくなり、透明性が上がる RAGをより「実用」寄りに改善 プロトタイプだけでなく、業務アプリ