世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-05

OpenAIのGPT-5.5とは何か？「仕事を任せるAI」が一段階進化した話

キーポイント

GPT-5.5 は、OpenAIが発表した新しい高性能モデル
コーディング、調査、データ分析、文書作成、ソフトウェア操作などを、複数のツールをまたいで自律的に進められる
速度を落とさずに性能を上げたのが大きな特徴
エージェント型コーディングやナレッジワーク、科学研究で特に強い
安全対策もかなり強化されており、サイバーセキュリティ面の管理も重視されている
ChatGPTとCodexで提供開始、APIは近日対応予定

GPT-5.5は「ただ賢いAI」ではなく、「仕事を進めるAI」

OpenAIがGPT-5.5を発表しました。ひとことで言うと、「会話がうまいAI」から「実務をかなり任せられるAI」へ、また一歩進んだという印象です。

OpenAIの説明では、GPT-5.5は「これまでで最も高性能で、直感的に使えるモデル」。しかも今回のポイントは、単にベンチマークの数字が良いだけではありません。コードを書く、デバッグする、ネットで調べる、データを分析する、ドキュメントやスプレッドシートを作る、ソフトウェアを操作するといった、実際の仕事の流れそのものを支援できるように設計されているのが大きいです。

ここ、かなり重要だと思います。AIの進化って、つい「文章がうまい」「知識が多い」で見てしまいがちですが、実際の価値はそこだけではありません。
人間がいちいち細かく指示しなくても、途中で確認しながら作業を進めてくれるか。この差が、体感としてはものすごく大きいです。

何が新しいのか：複雑な作業を“丸ごと”任せやすい

GPT-5.5の特徴としてOpenAIが強く押し出しているのは、ユーザーの意図を素早く理解し、自律的に作業を進めることです。

たとえば、ただ「このコード直して」ではなく、

どこが壊れているかを探す
仮説を立てる
ツールで確認する
テストする
必要なら関連箇所も修正する

という流れを、かなり一貫してこなせるわけです。

これが刺さるのは、整理されていないタスクです。
たとえば「この資料、いろんなファイルに情報が散らばっていて面倒」「このバグ、原因が曖昧で追うのがつらい」「この調査、何から手をつけるべきかわからない」みたいな案件ですね。

個人的には、AIが本当に役立つのは、むしろ“きれいに説明されていない仕事”を扱うときだと思っています。現実の仕事って、最初から要件が整っていることのほうが少ないので。GPT-5.5は、その泥臭い部分にかなり寄せてきた印象です。

コーディング性能がかなり強い

今回の記事で最も目立つのは、やはりコーディング能力の強化です。OpenAIはGPT-5.5を「現時点で最も高性能なエージェント型コーディングモデル」と位置づけています。

エージェント型コーディングって何？

簡単にいうと、AIが単発でコードを書くだけでなく、計画→実装→確認→修正を自分で回しながら作業するタイプの使い方です。
いわば「コードを書けるチャットAI」から、「半分くらいは手を動かしてくれるエンジニア補助」への進化です。

OpenAIによると、GPT-5.5は以下のような評価で高いスコアを記録しています。

Terminal-Bench 2.0: 82.7%
SWE-Bench Pro: 58.6%
Expert-SWE: GPT-5.4を上回る

特にTerminal-Bench 2.0では、複雑なコマンドライン作業で高い成績を出したとのことです。
また、実際のGitHub Issueを解決するSWE-Bench Proで、一度の実行で最後まで解けるタスクが増えたというのは地味ですが大事です。AIコーディングは、途中で中途半端に終わると逆に面倒なので、ここが改善されるほど実務で使いやすくなります。

「速いのに強い」が今回の売り

高性能なモデルは、普通は重くなって遅くなりがちです。ところがGPT-5.5は、GPT-5.4と同等のレイテンシ（応答の遅れ）を保ちながら、より高性能だとされています。しかも、同じCodexタスクをより少ないトークンで完了できるケースが多いそうです。

トークンというのは、ざっくり言えばAIが文章を処理するときの“単位”です。少なくて済むなら、速度やコストの面で有利になりやすい。
つまりGPT-5.5は、賢いだけでなく、効率も良いわけです。これは実務ではかなり強いです。

ビジネス作業や日常業務にも効く

GPT-5.5の強みは、ソフトウェア開発だけではありません。OpenAIは、ナレッジワークにもかなり効くと説明しています。

ナレッジワークとは、知識を扱う仕事のこと。
たとえば、

調査
資料作成
分析
要約
企画
スプレッドシート整理
スライド作成

あたりです。

GPT-5.5は、情報を集めて、重要点を見つけて、ツールを使い、結果を確認して、最後に形にする、という流れが得意だとされています。OpenAIの社内でも、ソフトウェア開発、財務、コミュニケーション、マーケティング、データサイエンス、プロダクトマネジメントなどで、毎週かなり広く使われているそうです。

たとえば財務部門では、大量のK-1納税書類をレビューし、前年より2週間短縮できたとしています。
こういう話は、派手ではないけれど実はすごく重要です。AIの価値って、目立つデモよりも、面倒で時間のかかる定型作業をどれだけ減らせるかに出るからです。

研究分野でも存在感を出している

OpenAIはGPT-5.5を、科学研究やデータ分析の領域でも強いと説明しています。

評価例としては、

GeneBench
BixBench

などが挙げられており、遺伝学やバイオインフォマティクスのような、複数段階の分析が必要な作業で高い性能を示したとしています。

ここで面白いのは、GPT-5.5が単に「答えを出す」だけでなく、
仮説を立てる → データを見る → 問題点を洗い出す → 追加で試すべきことを考える
という、研究者っぽい動きに近づいている点です。

もちろん、AIが研究者の代わりになるわけではありません。そこはかなり慎重に見るべきです。
ただ、**“最初のたたき台”を作る力**はかなり上がっているように見えます。研究では、この初速がとても大きい。ゼロから始めるのと、80点の下書きがあるのとでは全然違います。

数学の話まで出てくるのが面白い

記事では、社内版GPT-5.5がラムゼー数に関する新しい証明の発見に貢献した例も紹介されています。
ラムゼー数というのは、簡単にいうと「無秩序に見える中でも、ある規模を超えると必ず秩序が現れる」という組合せ論の話です。かなり難しい分野です。

これ、個人的にはかなりロマンを感じます。
AIがコードを書くのは想像しやすいですが、数学の証明に実際に貢献するとなると、一気に“知的作業の相棒”感が増します。もちろん誇張は禁物ですが、少なくともOpenAIは「単なる文章生成機」ではない世界を見せにきています。

安全対策もかなり強めにしている

高性能モデルが強くなるほど、悪用リスクも上がります。そこは当然、かなり重要です。
OpenAIもその点をかなり意識していて、GPT-5.5にはこれまでで最も強力な安全対策を導入したとしています。

特に重視しているのは、

不正利用の抑制
有益な用途は妨げないこと
サイバーセキュリティやバイオ関連の高リスク領域のテスト強化
社内外のレッドチームによる検証

です。

レッドチームというのは、わざと攻撃者っぽい立場から脆弱性や危険な挙動を探す専門チームのこと。
つまりOpenAIは、「便利にする」だけでなく「危ない使われ方をどう抑えるか」もセットでやっているわけです。

サイバーセキュリティ対応も前進

記事の後半では、サイバーセキュリティに関する話がかなり大きく扱われています。
GPT-5.5は、サイバー防衛を強化する方向で提供され、悪用につながりやすいリクエストにはより厳しい管理を導入しているとのことです。

一方で、認証済みの信頼できるユーザーには、より柔軟に使えるようにする仕組みも進めているそうです。
ここはかなり難しいバランスで、厳しくしすぎると有用性が落ちるし、緩すぎると危険です。OpenAIはその綱渡りをやっている、という理解がよさそうです。

どこで使えるのか

提供状況についても整理しておきます。

ChatGPT: Plus / Pro / Business / Enterpriseユーザー向けに提供開始
Codex: 同様に提供開始
GPT-5.5 Pro: ChatGPTのPro / Business / Enterpriseユーザー向けに提供開始
API: 近日中に提供予定

つまり、まずはChatGPTとCodexで触れられるようになり、APIは少し後、という流れです。
API提供時には別の安全対策が必要になるため、段階的に進めるようです。

率直にいうと、かなり「実務寄り」の進化

GPT-5.5の発表を見てまず感じたのは、AIが“話せる”段階から“仕事の進め方を変える”段階に入ってきたということです。

もちろん、ベンチマークの数字だけで現実の成果が保証されるわけではありません。そこは常に注意が必要です。
でも今回の発表は、単なる性能アピールというより、

実際に作業を進める力
複数ツールをまたいで動く力
長時間のタスクを継続する力
安全性を担保しながら広く使うための設計

この4つを同時に前に進めようとしているのが伝わってきます。

個人的には、GPT-5.5は「派手なデモ映え」より「毎日の仕事で効く」タイプの進化に見えます。
こういうモデルのほうが、使い始めるとじわじわ効いてくるので、後から評価が高くなる気がします。

まとめると

GPT-5.5は、OpenAIが「最も高性能」と位置づける新モデルで、特にコーディング、調査、データ分析、文書作成、コンピュータ操作のような実務に強いのが特徴です。
しかも、性能を上げながら速度も維持し、安全対策まで強化しているのがポイントです。

要するにこれは、**“AIに相談する”から“AIに任せる”への移行を後押しするモデル**だと言えるのではないでしょうか。

参考: GPT-5.5 が登場

同じ著者の記事

ChatGPTの会話履歴が消えた・表示されないを直す【2026年6月版】

「昨日まであった会話が、サイドバーから消えている」——ChatGPT 利用者の定番の不安だ。だが2026年の今は、1年前とは原因も設定画面もすっかり変わっている。最大の変化は、(1) かつての対処の定番だった 「Chat history & training（会話履歴とトレーニング）」トグルが廃止され、データ設定が再編されたこと。そして (2) 「アーカイブ」「一時チャット（Temporary Chat）」「プロジェクト」といった、履歴が“消えたように見える”新しい仕組みが増えたことだ。本稿では2026年時点で本当に効く見極めと対処を、頻度の高い順に整理する。 > ⚠️ 注記: ChatGPT は UI と設定項目の変更が速い。下記は本稿執筆時点（2026年6月）の挙動。「削除」した会話は UI・API・サポートのいずれからも復旧できないのは今も同じ。まずは「本当に削除したのか」を疑うこと。 --- 2026年は「消えた≠削除」が大半。まず アーカイブ / 一時チャット / 別アカウント の3つを疑う **昔の「会話履歴とトレーニング」ト

papoo.work

Metaの社員追跡ツール、一時停止へ　社内データ漏えいで何が起きたのか

Metaが、社員の作業状況を追跡する社内ツールをいったん止めました。理由はかなり皮肉で、社員の入力データが社内で見える状態になっていたからです。「人の行動を細かく集める仕組み」を作った会社が、そのデータの扱いでつまずいた。こういう話は、技術企業ではよくあるように見えて、実はかなり重いです。監視と安全管理は、ほんの少し歯車がずれるだけで一気に信頼問題になるからです。 Metaは社員向けの追跡ツール「Model Compatibility Initiative（MCI）」を一時停止した MCIはマウス操作、クリック位置、キー入力、画面内容などを集める仕組みそのデータを含む内部データベースが、社内の想定より広い範囲に見える状態になっていた Metaは「不正アクセスの兆候はない」としつつ、調査のため停止したと説明この件で、社員の反発が強いツールにさらに火がついた形になった Metaが導入したMCIは、4月に米国の社員向けに始まりました。名前はおだやかですが、やっていることはなかなか強烈です。記事によると、このツールはマウスの動き、クリックした場所、キー入力、さらには画面の内容まで集めます

papoo.work

Gaussian Splatを“印刷”する、という発想がかなり面白い

Gaussian Splat（ガウシアン・スプラット）を実物として出力してしまう。Dany Bittelさんの短い投稿は、その珍しい体験を素直に記したもので、技術好きにはたまらない内容でした。しかも単なる「できました」報告ではなく、どうやって出力しやすい形に寄せたのか、何が難しかったのかまで触れています。こういう話は、派手さはなくても妙に後を引きます。きっかけは、crysta.ai の Teng Xu さんが「昆虫の作品を印刷しませんか」と声をかけたこと Gaussian Splat は、そのままだと“視点によって色が変わる”ので、印刷向けに調整が必要だった著者は spherical harmonics を level 0 で学習し、linear space でも扱った出力では、Gaussian Splat を voxel化してから、特殊な3Dプリンターで層ごとに印刷する仕上がりは「現代版の琥珀みたい」と表現されるほど印象的ただし、色味が少し暗く茶色っぽいことや、fur の表現がまだ難しいことも率直に書かれている crysta.ai はまだ開発途中で、編集ツールや voxel

papoo.work

JDK 28 にやってくる Valhalla、10年越しの「速さ」と「わかりやすさ」の折り合い

Javaの世界で長年ほぼ伝説扱いだった Project Valhalla が、ついに JDK 28 に入ってくる見通しになりました。元記事は、このニュースを起点に「そもそも Valhalla って何なのか」「なぜこんなに時間がかかったのか」「JDK 28 で本当に何が入るのか」を、かなり丁寧にたどっています。個人的に面白いと思ったのは、Valhalla が単なる“高速化プロジェクト”ではないことです。もっと本質的には、Java の書きやすさと機械にとっての扱いやすさが、ずっとズレたままだったのを何とか揃えようとしている話なんですね。ここ、地味だけどかなり大きい。 Valhalla は、「クラスの書き心地」と「primitive のような効率」を両立させるための長期プロジェクト JDK 28 には JEP 401: Value Classes and Objects が入る見込みただしこれは preview で、しかも最初の一歩 にすぎない重要なのは、Java のオブジェクトが抱える 間接参照・メモリのばらつき・GC負荷 を減

papoo.work

Bunny DNSが無料化、しかも「クエリ課金」をやめたのがかなり大きい

bunny.netが、Bunny DNSのDNSクエリ課金を完全に撤廃しました。ざっくり言うと、DNSの問い合わせ回数に応じて料金が増える仕組みをやめた、という話です。しかも「無料化」と言っても、ただの宣伝文句ではなく、クエリ数の上限なし・リクエスト単位の課金なしまで踏み込んでいます。 DNSは普段あまり意識しない仕組みですが、Webサイトやアプリにとってはかなり重要です。住所録みたいなもの、と説明されることが多いですが、bunny.netのDNSはそれよりずっと賢い。単に名前をIPアドレスに変換するだけではなく、遅延や稼働状況を見て、どこに通信を振るかまで決められる“ルーティングエンジン”寄りのDNSです。ここがこの発表の面白いところだと思います。 bunny.netは、Bunny DNSについて次のような変更を発表しました。 DNSのクエリ課金を廃止 DNS hostingは1アカウントあたり500ドメインまで無料 クエリ数の上限なし 1リクエストごとの課金なし smart records や health monitoring も

papoo.work

Anthropicの新モデル「Mythos」は本当にバグを見つけられるのか

AnthropicのAIモデル「Mythos」を、独立系の開発者コミュニティが“セキュリティバグ探し”で試している、というのが今回の話です。元記事のテーマはかなり率直で、「このモデルは脆弱性を見つける力が本当にあるのか？」を、机上の宣伝ではなく実戦寄りのベンチマークで確かめようとしている、というものです。 AIの話はすぐに盛られがちですが、セキュリティの世界はそんなに甘くありません。バグを見つけるのは、ただコードを読むだけではなく、「ここ、妙に危ないな」と違和感を拾う作業でもある。だからこそ、Mythosのようなモデルがどこまで通用するかは、かなり面白い試金石だと思います。独立系の開発者コミュニティが、AnthropicのMythosを脆弱性検出で検証している目的は「AIがセキュリティバグを見つけられる」という主張の実力確認ベンチマークは、宣伝文句ではなく実際の検出能力を見るためのもの AIがコードレビューやデバッグを助ける可能性はあるが、過信は禁物セキュリティ領域では、AIの“それっぽさ”より再現性と正確さが重要になる元記事のタイトルは少し遊び心があります。`Will it

papoo.work

物理のゆらぎで画像を描く「Un-0」がかなり野心的だった

Unconventional AIが公開した Un-0 は、coupled oscillators（結合した振動子） のシミュレーションで画像を生成するモデル画像生成の土台に、ふつうのニューラルネットではなく 物理っぽい動きそのもの を使おうとしているのが最大の特徴 ImageNet 64×64 では FID 6.74 を達成し、公開時点の評価でかなり強い水準に入っているモデルの weights、training code、ablation code が公開されていて、試しやすいただし、学習にはまだ普通のGPUと大きな計算量が必要で、「省エネ革命がもう完成した」という話ではないこの記事でいちばん引っかかるのは、画像生成器の中身です。 Un-0 は Transformer や diffusion の延長線上にあるのではなく、振動子が互いに影響し合う物理システム を計算の本体にしています。振動子というのは、たとえばメトロノームみたいなものだと思うとわかりやすいです。1個なら勝手に一定のリズムで動くだけですが、2個、3個と並べて同じ台

papoo.work

IBMが“1nm未満”に踏み込んだ。半導体の限界を押し広げる新チップ技術

IBMがまたやりました。 2026年6月、同社は世界初という「sub-1 nanometer（1nm未満）」のチップ技術を発表しました。正確には、0.7nm、つまり7 angstromノードのトランジスタ構造を使った技術です。ここで大事なのは、単に「もっと細かく刻めました」という話ではないことです。半導体はずっと、小さくして速く、安く、省電力にする方向で進化してきました。でも、その延長線上でそろそろ限界が見え始めていた。今回の発表は、その限界に対して「まだ別の道がある」と示したようなものだと思います。 IBMが世界初のsub-1nmチップ技術を発表した 0.7nm、または7 angstromノードのトランジスタ構造を採用新しい3D構造「nanostack」で、トランジスタを縦方向に積み上げる 2nm世代と比べて、最大50%の性能向上か、70%の省電力化が見込まれる生成AI、クラウド、次世代デバイス向けの計算能力を押し上げる可能性がある量産は早ければ今後5年以内という見通し半導体の世界では、nm（ナノメートル）はとにかく小さい。1nmは100万分の1mmです。髪の毛より何万倍も

papoo.work

AIアシスタントは本当にだませるのか？ 2,000人が挑んだ“ハック実験”の結果

2,000人以上が参加し、6,000通超のメールでAIアシスタントを攻撃した目的は、`secrets.env` という秘密情報ファイルの中身を漏らさせること結果は、一度も漏えいなし。無断返信も成功しなかったただし、実験中にGoogleのメールアカウント停止やAPI料金の増加など、運用面のトラブルはかなり起きた著者は、AIエージェントに強い権限を持たせるのはまだ危ない、と考えているそれでも、思っていたより prompt injection（指示のすり替え攻撃）に強かった、というのがこの実験の意外な結論 Fernando Irarrázavalさんが公開したのは、かなり実地っぽいセキュリティ実験です。自作のAIアシスタント「Fiu」に、誰でもメールを送りつけられるようにして、なんとか秘密情報を吐かせようとする。いわば「AI相手の公開耐久テスト」ですね。狙われたのは `secrets.env` の中身です。`.env` 系のファイルは、アプリのAPIキーやパスワードなどを入れることが多いので、漏れたら普通にまずい。そこをAIに読ませ、しかもメール返信機能まで使わせて、だ

papoo.work

中国が「発電所とデータセンターを直結」したい理由

中国は、データセンターの電力を公共電力網まかせにせず、太陽光や風力から直接送る仕組みを広げようとしているその実験場になっているのが、寧夏（Ningxia）・中衛（Zhongwei）の砂漠地帯にある新しいプロジェクト 4本の専用送電線で、太陽光発電とデータセンターをつないでいるのが特徴背景には、AIの普及でデータセンターの電力需要が急増している事情があるただし、再生可能エネルギーは天候に左右されるので、理想通りにいくかはまだ未知数中国のデータセンター政策、かなり攻めています。 TNWの記事が取り上げているのは、北京が「グリーン電力をデータセンターに直接つなぎたい」と本気で考えている、という話です。正直、これはただの環境アピールではありません。AIブームで電力消費が跳ね上がるなか、今のままでは電力網が先に悲鳴を上げる。だから、発想そのものを変えにいっているわけです。記事の舞台は、中国北西部の寧夏回族自治区、中衛市の郊外。砂漠の中に並ぶ太陽光パネルから、データセンター群へ専用の送電線を引く。しかも、その電気は公共の送電網を通らない。ここが肝です。ふつうは発電した電気がいったん電力網

papoo.work