PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

OpenAIが進める「AI生成コンテンツの見分けやすさ」強化策をやさしく解説

OpenAIが、AIで作られた画像や音声の「出どころ」をもっと分かりやすく、もっと消えにくくする取り組みを発表しました。
一言でいうと、​​「この画像や音声はどこから来たの?」を見分ける仕組みを、1つではなく何重にも重ねて強くする話です。

最近は、AIで作った画像や音声が日常的に使われるようになってきました。これは本当に便利です。表現の幅が広がるし、仕事の効率も上がるし、アクセシビリティにも役立ちます。
でも、その一方で「これは本物? AI生成?」「誰が作ったの?」が分からないと、見る側は少し不安になりますよね。OpenAIはそこに真正面から向き合って、​content provenance(コンテンツの来歴・出どころの証明)​を強化すると言っています。


記事のキーポイント


そもそも「content provenance」って何?

難しそうな言葉ですが、要するに​「そのコンテンツがどこで、どう作られたかを示す手がかり」​です。
たとえば、

といった情報が分かると、見る側はだいぶ安心できます。

これはニュース、SNS、仕事の資料など、あらゆる場面で効いてきます。
個人的には、AI時代の「見た目の真実」よりも、「来歴の真実」を重視する流れはかなり重要だと思います。画像がそれっぽく見えるだけでは、もう信用できない時代ですからね。


1つ目の柱: C2PAに対応して、情報を他のサービスでも扱いやすくする

image_0001.svg

OpenAIは以前から、DALL·E 3やImageGen、Soraで Content Credentials を入れてきました。
Content Credentialsは、ざっくり言えば​「このコンテンツの身分証明書」​のようなものです。

今回さらに進んだのが、​C2PA conformant になったことです。
C2PAは、​content provenanceのための業界共通の技術標準です。いろいろな会社やサービスが同じルールで情報を扱えるようにする仕組み、と考えると分かりやすいです。

C2PAでは、​metadata(メタデータ)​cryptographic signatures(暗号署名)​ を使います。
メタデータは「データについてのデータ」、つまり画像そのものではなく「誰がどう作ったか」という付加情報です。
暗号署名は、その情報が改ざんされていないことを確認するための仕組みです。

OpenAIがC2PA conformantになったことで、他のプラットフォームでもOpenAIが付けた provenance情報を読み取り、保持し、次の場所へ引き継ぎやすくなるわけです。
ここがかなり大事で、provenanceは「最初の投稿時だけ見えればいい」ものではありません。SNSに再投稿されたり、保存されたり、転載されたりするうちに消えたら意味が薄れます。
OpenAIがそこを意識しているのは、かなり筋がいいと思います。


2つ目の柱: Google SynthIDで画像に見えない watermark を入れる

ただし、メタデータには弱点があります。
画像をアップロードし直したり、ダウンロードしたり、ファイル形式を変えたり、サイズを変えたり、スクリーンショットを撮ったりすると、​メタデータが消えたり壊れたりすることがあるのです。

そこでOpenAIは、​Google DeepMindのSynthID を取り入れます。対象はまず、​ChatGPT、Codex、OpenAI APIで生成された画像です。

SynthIDは、​見えない watermark を画像に埋め込む技術です。
watermarkは、画像の見た目を邪魔しない形で「この画像には識別信号がある」と示す仕組みです。
メタデータが“名札”だとしたら、watermarkは“本体に刻まれた目印”みたいなものです。

OpenAIは以前から、Soraでvisible watermarks(見える透かし)​を使ったり、Voice Engineでaudio watermark を試したりしてきました。
つまり今回、いきなり新しいことを始めたというより、​​「見える印」から「消えにくい印」へ、少しずつ実用性を高めてきた流れなんですね。

個人的にはここがかなり面白いです。
メタデータだけだと「消されやすい」。watermarkだけだと「情報量が少ない」。
だから両方を組み合わせる、というのはすごく現実的です。技術って、たいてい1枚岩ではなく、こういう補完関係で強くなるんですよね。


image_0003.png

3つ目の柱: 公開向けの verification tool を準備中

OpenAIは、​公開verification toolのプレビューも発表しました。
これは、アップロードされた画像がChatGPT、OpenAI API、Codexで生成されたかを確認するためのツールです。

何を見て判断するのかというと、

です。

つまり、「単一の手がかりだけで決める」のではなく、​複数の信号を組み合わせて確認するわけです。
これはかなり誠実な設計だと思います。AI由来かどうかを100%言い切れる魔法の検出器なんて、現実にはそう簡単に作れません。OpenAIもそこは認めています。

しかも、もしメタデータもwatermarkも見つからなかった場合でも、​**“OpenAI製ではない”とは断定しない**としています。
なぜなら、途中で情報が消えることがあるからです。
この「見つからない=違うとは言えない」という態度は、地味ですがかなり大事です。雑に断定しないのは、こういう安全性の文脈ではむしろ信頼につながると思います。


でも、万能ではない

OpenAI自身もはっきり書いていますが、​どの検出方法も完璧ではありません
これは重要です。

たとえば、

image_0004.png

という制約があります。

だからOpenAIは、​1つの技術に頼るのではなく、複数の層を重ねる multi-layered approach を採っています。
この考え方はかなり健全です。AI時代の信頼性って、たぶん「これさえあればOK」という単独技術では守れないんですよね。


何がうれしいのか、一般の人の目線で見ると

この発表の価値は、技術オタク向けの話だけではありません。むしろ、普通にSNSやニュースを見ている人にとってこそ意味があります。

1. 「これはAI生成っぽい」で終わらず、確認しやすくなる

見た目だけでは分からない時代に、確認の手がかりが増えるのはありがたいです。

2. 作った側の責任が見えやすくなる

AIで何でも作れるようになるほど、​誰がどう作ったかの透明性は大事になります。

3. プラットフォームをまたいでも情報が残りやすくなる

SNSで転送されたり、切り取られたりしても、来歴情報が生き残る可能性が高まります。

4. 業界全体の共通ルールに近づく

C2PAのような標準に寄せるのは、単独企業の囲い込みではなく、​横断的に使える仕組みを目指す動きです。ここはかなり良い方向だと思います。


ただし、過信は禁物

一方で、こういう仕組みが広まっても、​​「これがあるから全部安心」にはならないでしょう。
悪意のある人は回避策を考えるかもしれないし、古い画像や他社ツールの画像では情報がないこともあります。

image_0005.png

なので、これからは

という、少し面倒だけど現実的な使い方が必要になるはずです。

私はむしろ、その「面倒さ」こそが健全だと思います。
ネット上のコンテンツを一発で真偽判定できる、と言い切るほうが危ないですから。


まとめ

OpenAIの今回の発表は、AI生成コンテンツの透明性を高めるために、

を組み合わせる、かなり本気の取り組みです。

派手な新機能というより、​AIの信頼インフラを地味に、でも着実に整える話です。
こういう基盤づくりは地味に見えて、実はとても重要です。AIが当たり前になるほど、「どう作られたか」を示す仕組みがない世界はかなり怖い。だからこそ、OpenAIがここに力を入れるのは筋が通っていると思います。


参考: Advancing content provenance for a safer, more transparent AI ecosystem

同じ著者の記事