PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

ChatGPTやAIチャットボットに“学習用データ”を渡しすぎない方がいい理由と、その止め方

キーポイント

AIチャットボットは、ただ答えるだけではない

最近のAIチャットボットって、本当に便利ですよね。
質問するとすぐ返ってくるし、文章も作れるし、ちょっとした相談相手にもなる。私もこういうツールの進化はかなり面白いと思っています。が、この記事が言っているのは、便利さの裏側にあるかなり大事な注意点です。

Fast Companyの記事によると、ChatGPTのようなAIチャットボットに入力した内容は、単にその場で回答を返すためだけでなく、​AIモデルの学習に使われることがあるそうです。
ここでいう「学習」は、AIが大量の情報を取り込んで、より自然に、より賢く見える返答をできるようにするプロセスのこと。人間でいうと「いろんな資料を読み込んで知識を増やす」みたいなものです。

問題は、その“資料”の中にあなたが打ち込んだ個人的な情報や仕事の情報が含まれうること。
つまり、雑談のつもりで入れた内容が、AIの“体の一部”みたいに取り込まれてしまう可能性がある、というわけです。これはちょっと怖い。便利な文房具だと思っていたら、実はメモ内容を向こうの本棚にコピーされていた、みたいな感覚に近いと思います。

なぜ気をつけるべきなのか

image_0002.svg

記事が特に警告しているのは、以下のような情報です。

こうした情報は、たとえAI会社が「匿名化しています」と言っても、​本当に大丈夫かは利用者側からは確認しにくいのが現実です。
記事では、将来どこかの悪意ある第三者が、複数のやりとりをつなぎ合わせて個人を特定する可能性も否定していません。ここはかなり現実的な懸念だと思います。匿名化という言葉は安心材料に見えますが、万能ではないんですよね。

さらに仕事で使う場合は、もっと面倒です。
もし顧客情報やクライアント情報をAIに入れてしまえば、​法的・規制上のリスクにつながる可能性があります。
しかも、本人は「ちょっと要約してもらっただけ」のつもりでも、会社の秘密やノウハウがそのまま漏れることがある。これは本当にうっかり起きやすいので、現場ではかなり注意が必要ではないでしょうか。

学習利用を止めるにはどうすればいい?

image_0003.svg

記事では、主要な4つのAIチャットボットについて、​データの学習利用をオフにする方法を紹介しています。

ChatGPT

  1. プロフィールを開く
  2. 設定から Data Controls を選ぶ
  3. “Improve the model for everyone” をオフにする

Gemini

  1. Gemini Apps Activity の設定ページへ行く
  2. “On” のボタンを選ぶ
  3. ポップアップで “Turn off” を選ぶ
  4. 確認画面で “Got it” を押す

Claude

  1. プロフィールを開く
  2. 設定の privacy メニューへ進む
  3. “Help improve Claude” をオフにする

Perplexity

  1. プロフィールを開く
  2. 設定の Preferences メニューへ進む
  3. “AI data retention” をオフにする

image_0005.jpg

こうして見ると、設定名はちょっと違っても、やることはかなりシンプルです。
要するに、​​「あなたの入力を改善学習に使っていいですか?」というスイッチを切るわけですね。

個人的には、こういう設定はもっと最初から目立つ場所に置いてほしいと思います。便利な機能は前面に出るのに、プライバシー設定は奥に隠れがち。これはかなり“サービス設計あるある”です。

でも、これで完全に安心というわけではない

ここがこの記事の大事なポイントです。
学習利用をオフにしても、​企業があなたの情報を完全に何も保持しないとは限りません。記事によると、法的・規制上の理由で、一定期間チャット内容などを保存する場合があるそうです。

つまり、

image_0006.svg

ということ。
この違い、地味ですがかなり重要です。
「AIに学習されないなら安心」と思いがちですが、実際はもう少し複雑なんですよね。ここは期待しすぎない方がいいと思います。

さらに記事は、企業が独立監査人にシステムを完全公開しているわけではないため、​**“ちゃんと止めてくれている”こと自体を、結局は会社の説明に頼るしかない**と指摘しています。
つまり、ユーザーから見るとブラックボックス感は残る。ここはAIサービスの弱点でもあり、同時に現在のインターネットサービス全般に共通する不信感でもあると思います。

いちばん安全なのは「入れないこと」

結局のところ、最も確実なのはシンプルです。
機密情報や個人情報を、最初からAIに入れないこと。​

image_0007.svg

特に次のような対策は有効です。

記事でも、アップロード前に敏感な情報をきちんと赤字化・削除することを勧めています。
ここは本当に大事です。AIの設定をオフにしたとしても、うっかり一度送った情報は取り返しがつかないことがあるからです。

もっとプライバシーを重視するなら

記事はさらに、ChatGPTやGeminiなどの“本家”に直接入れる以外の方法として、​プロキシ的なサービスを挙げています。

image_0008.svg

こうしたサービスは、AI大手に直接情報を渡す量を減らし、​デジタルな足跡を少し隠しやすくする可能性があるとのこと。
もちろん、これも万能ではありませんが、プライバシーを少しでも重視したいなら選択肢にはなるでしょう。

まとめ:便利さの代わりに、情報を差し出しすぎない

AIチャットボットは、使えば使うほど便利さを実感するツールです。
でもその反面、​入力した情報が将来どう扱われるかは、思った以上にシビアです。

この記事の主張をかなり雑に一言で言うと、

image_0009.svg

「AIに話しかけるときは、相手が“賢い道具”であると同時に、“データを集める存在”でもあることを忘れないで」

ということだと思います。

私自身も、AIはもう手放せないレベルで便利だと思っています。
ただし、便利だからこそ、​出していい情報とダメな情報を自分で線引きする力が必要になる。そこは本当にこれからの必須スキルではないでしょうか。


参考: ChatGPTや他のAIチャットボットにデータを学習させるのをやめるべき理由と方法

同じ著者の記事