CNETの記事「Some Chatbots Revealed Personal Information More Easily Than Others」は、AIチャットボットが個人情報をどれくらい簡単に出してしまうのか、という話題を扱っている。
タイトルだけ見ると「どのAIが危ないの?」と身構えてしまうけれど、実際にはもっと大きなテーマがある。つまり、いったんネットに出た個人情報は、AIの世界でも消えにくいという問題だ。
これ、かなり現代っぽい話だと思う。昔は「検索すれば出てくる」ことが怖かった。でも今はそこにAIが加わって、検索結果をまとめるだけでなく、あちこちの情報を“それっぽく”つなぎ合わせてしまう。便利な反面、ちょっとゾッとする。
CNETの記事の説明文には、ある専門家の言葉として、
「ネットから個人情報を消し、さらにAIの学習データからも外そうとするのは、プールからおしっこを取り除こうとするようなもの」
という強い比喩が出てくる。
この表現がなかなか衝撃的だが、言いたいことはわかる。
一度広く拡散した情報は、完全に回収するのがとても難しい。しかもAIは、単に1か所のデータベースを見ているわけではなく、公開された大量の情報を元に学習していることが多い。だから、元データを消したつもりでも、どこかに残っていたり、別の形で再利用されたりする可能性がある。
個人的には、この「消したつもりでも消えていないかもしれない」という感覚が、AI時代のいちばん厄介なところではないかと思う。人は忘れるけれど、データは忘れにくい。ここが本当に怖い。
この記事のタイトルは、チャットボットごとに個人情報の出し方に差があることを示唆している。
つまり、同じ質問をしても、あるAIは慎重に答えるのに、別のAIはより簡単に情報を出してしまう可能性がある、ということだ。
ここで大事なのは、AIが「賢い」かどうかだけではなく、
AIって、つい「全部同じようにすごいもの」と見てしまいがちだけど、実際はかなり個性がある。いや、個性というより、守りの堅さが違うと言ったほうが正確かもしれない。
この話は、単に「AIが個人情報を言っちゃった」で終わる話ではない。むしろ本題はそこからだ。
名前、住所、電話番号、勤務先、過去の発言などは、単独では小さく見えても、組み合わさるとかなり強い個人特定情報になる。
AIはそうした断片をつなげて、思わぬ答えを出してしまうことがある。
ネット上にある情報は、本人が忘れていても、AIの側では残っているかもしれない。
「公開されているから大丈夫」という感覚は、AI時代では少し危うい。公開と安全は、もはや同義ではないと思う。
ネットから消した情報が、コピー、アーカイブ、スクレイピングされたデータ、学習済みモデルの中に残っている可能性がある。
ここがやっかいで、消すための努力と、残ってしまう現実の差が大きい。
ここで「じゃあもう何もネットに書けないの?」となりがちだが、そこまで極端になる必要はないと思う。
ただし、少なくとも次の感覚は持っておいたほうがいい。
これは地味だけど、かなり実用的な考え方だ。
特に、住所・電話番号・勤務先・顔写真・本名とSNSアカウントのつながりなどは、慎重に扱うべきだと思う。
正直、AIの記事って「最新モデルがすごい!」みたいな話に寄りがちだ。
でも今回のCNET記事は、そういうお祭り感よりも、AIが人のプライバシーにどう触れているのかという現実的な不安をちゃんと見ているのがいい。
しかも、「どのチャットボットがより簡単に個人情報を出すのか」という切り口は、かなり直感的でわかりやすい。
AIの安全性って抽象的になりやすいけれど、「情報をどれだけ漏らすのか」と言われると、一気に自分ごとになる。
個人的には、AIの性能競争が進むほど、この種の“地味だけど重要な安全性”がもっと注目されるべきだと思う。派手な画像生成や会話能力も大事だけど、日常で本当に困るのは、こういうプライバシーまわりの事故ではないだろうか。
参考: Some Chatbots Revealed Personal Information More Easily Than Others