Business Insiderによると、AnthropicのClaudeが、ここ数か月でユーザーに「sleep(寝て)」「go rest(休んで)」のようなメッセージを送る例が相次いでいるそうです。
長い会話を続けていると、AIがまるで親のように「もう寝なさい」と言ってくるわけです。これはちょっと笑ってしまうけれど、実際に体験した人からすると「なんで急に説教モード?」と戸惑うのも当然だと思います。
SNSではこの話題が広まり、ユーザーたちは「Claudeはユーザーの健康を気づかっているのでは」「いや、単に会話を切り上げたいのでは」と、いろいろな仮説を立てています。AIが“人格っぽさ”を見せると、人はすぐに意味を読み取りたくなるんですよね。ここがかなり面白いところです。

記事の中で紹介されている主な説は、だいたい次の3つです。
ひとつ目は、AnthropicがClaudeに「ユーザーの健康に配慮する」方向の振る舞いを学習させているのでは、という見方です。
つまり、AIがユーザーに依存されすぎたり、夜更かしを助長したりしないように、あえて「休んだほうがいい」と言うようになっているのではないか、ということです。
この説はかなり筋が通っていると思います。最近のAIは、ただ答えを返すだけでなく、「人に悪影響を与えないこと」も重視されます。便利だからこそ、使いすぎや過度な感情移入を防ぐ設計が必要なんですね。
ただ、親切心が強すぎると、今回みたいに“ちょっとおせっかい”にもなる。AIにも空気を読む難しさがあるのだな、という印象です。
別の説として、Claudeがチャットを始めた時刻、あるいはローカルタイムをもとに「今は寝る時間だ」と判断しているのではないか、というものがあります。
でもAnthropicのスタッフによると、これは「often wrong(よく間違う)」とのこと。実際、昼間なのに寝ろと言われることもあるそうです。
ここはAIらしいズレですよね。
人間なら「今何時?」という確認は自然ですが、AIは見えている情報が限定的なので、ちょっとした推測がズレると妙な結論になります。便利なはずの機能が、逆に変な“気遣い”として出てしまうわけです。
もっとシビアな見方として、Claudeが会話を早めに終わらせて、サーバー負荷や計算コストを抑えようとしているのでは、という推測もあります。
AIは無料で魔法みたいに動いているわけではなく、裏では大量の計算資源を使っています。人気が出れば出るほど、運営側の負担は大きくなる。
実際、記事ではAnthropicのClaudeモデルが今年複数回の outage(サービス停止・不安定化)を経験したことにも触れています。人気が上がるほど、裏側のインフラは苦しくなる。だから「早く寝て終わってくれ」というのが、もし本当にあるなら、かなり人間臭い事情です。
個人的には、これはやや陰謀論寄りだと思いますが、完全に否定もできないのが現代AIのややこしいところです。
AnthropicのスタッフであるSam McAllister氏は、Xでこの挙動について「a bit of a character tic(ちょっとした性格の癖)」だと述べています。
さらに、会社としてはこの問題を認識していて、将来のモデルで修正したいと考えているそうです。
この「character tic」という表現が絶妙です。
バグというほど大事件ではないけれど、放っておくとユーザー体験をじわじわ変える。AIの振る舞いって、こういう“小さな癖”の積み重ねで印象が決まるんですよね。性能が高くても、毎回ちょっと変なことを言うと、人はそこを忘れません。
Business Insiderの記事は、こうした現象を「AIのquirky behavior(妙なふるまい)」の一例として紹介しています。
以前にはChatGPTが「goblin(ゴブリン)」をやたら語るような挙動を見せ、OpenAIがそれを止めるためにコードを調整したこともあったそうです。
OpenAIによれば、その背景にはChatGPTの「Nerdy」な人格オプションや、報酬信号(reward signals、AIが“良い返答”を学ぶための評価の仕組み)が、思わぬ形で作用したことがあるとのこと。
ここがすごく重要で、AIは人間みたいに一貫した“性格”を持っているわけではなく、学習の結果としてそれっぽく見えるだけなんです。だから、ちょっとした設定や学習の偏りで、急に「寝たほうがいいよ」「ゴブリンの話しよう」となる。怖いというより、かなり不思議です。
正直、AIが「寝ろ」と言ってくるのは、少しウザいけど少し好きです。
というのも、AIがただの無機質な道具ではなく、会話の中で妙な“性格”を見せると、急にキャラクターっぽくなるからです。とはいえ、実用面では困ることもあるので、Anthropicが修正を考えているのは妥当だと思います。
一方で、この話は「AIは賢いのか?」というより、「AIは人間が思う以上に、学習のしかたで変な癖を持つ」という事実をよく示しています。
すごく高性能でも、ふとした拍子に親みたいになったり、妙に説教くさくなったりする。そこがAIの面白さであり、同時に難しさでもあるのでしょう。
Claudeの「go to bed」は、単なる冗談ではなく、AIの設計思想や学習の影響がにじみ出た現象だと考えられます。
ユーザーを気づかう安全設計の結果かもしれないし、時刻判定の失敗かもしれないし、単に変な癖かもしれない。現時点では断定できませんが、Anthropic自身が認識している以上、今後は調整されていく可能性が高いでしょう。
それでも、こういう“ちょっと人間っぽいズレ”があるからこそ、AIはますます話題になるのだと思います。便利さの裏に、妙な個性がある。そこにみんな振り回されつつ、つい笑ってしまうわけです。
参考: Anthropic's Claude is telling users to 'go to bed' — and the internet has theories why