Stanford Law Schoolが発表した研究が、かなり刺激的です。ざっくり言うと、法律のプロである教授たちが、同僚の教授よりもAIの回答を高く評価したという話です。しかも「なんとなくAIが健闘した」程度ではなく、かなりはっきりした差が出ています。
正直、これは面白いです。AIが得意なのは、もっともらしい文章を書くこと、要点を整理すること、説明を整えること――そういうイメージは以前からありました。でも法律のように、正解が1つに決まらない場面で、しかも専門家が評価して、なおAIのほうが好まれるというのは、なかなかインパクトがあります。
この研究のタイトルは “Law Professors Prefer AI Over Peer Answers”。Stanford Law SchoolのProfessor Julian Nyarko が率いる研究で、Yale、NYU、University of Chicagoなどの研究者も関わっています。
研究チームが見たかったのは、単純な暗記問題ではありません。
対象は契約法の授業で学生が授業後やオフィスアワーで質問しそうな内容です。
ここが大事で、法律って「この条文の答えはこれです」と一直線に答えられないことが多いんですよね。
むしろ、
みたいな、判断が問われます。研究者たちも、そこにAIが耐えられるのかを見たわけです。
結論からいうと、AIがかなり強かったです。

研究では、教授たちが40個の代表的な質問に対して回答を作成し、それを匿名で比較しました。比較対象は、他の教授が書いた回答とAIが生成した回答です。
その結果、教授たちはAIの回答を75%の対戦で選んだそうです。
この数字、かなり大きいです。
「AIが少し良かった」ではなく、3回に2回以上ではなく、4回中3回でAIが勝ったわけですから、教授側からするとかなり面目が立たない結果ではないでしょうか。
さらに印象的なのが、**AIの回答を“学生にとって誤解を招く・有害”と見なした割合が3.5%だったのに対し、人間の教授の回答は12%**だったことです。
ここは地味だけど重要です。
単に「読みやすい」だけでなく、教育上のリスクが低いと見られた点が大きいんですよね。法律教育では、変な断定や不正確な説明が学生の理解を歪める可能性があるので、この差は軽く見られません。
研究者の説明を読むと、AIは回答の長さや構成を人間の回答に合わせるなど、かなり丁寧に条件をそろえていたようです。つまり、AIが「だけ長文でそれっぽく見えた」みたいなズルはしにくい設計です。
それでもAIが好まれたのは、たぶん次のような点が効いたのではないかと思います。
もちろん、これは推測です。ただ、私自身、AIの文章を見ていて感じるのは、「結論までの道筋がきれい」なことが多いんですよね。人間の先生の回答は、深みがある反面、どうしても個性や癖が出ます。そこが魅力でもある一方で、学生から見ると「結局なにが言いたいの?」となることもある。今回の結果は、その差がかなり露骨に出たのではないかと思います。
この研究が面白いのは、「AIすごいね」で終わらないところです。
むしろ問いはそこからです。

法律教育では、単に答えを教えるだけではなく、
ことが求められます。だからAIが便利でも、頼りすぎると考える力が弱るのではという心配は当然あります。
研究チームもその点はかなり慎重で、「AIチューターを全面的に導入すべきだ」とは言っていません。
Nyarko教授も、「無条件の懐疑も、全面採用も、どちらも早すぎる」という立場です。ここはかなりバランス感覚がある発言だと思います。
個人的にも、これは健全だと思います。
AIは「先生の代わり」ではなく、うまく使えば補助輪とか家庭教師の一部くらいの役割がちょうどいいのではないでしょうか。少なくとも現時点では、「AIが賢いから人間は不要」と考えるのは雑すぎます。
一方で、少しゾッとする面もあります。
それは、法律のような分野でも、AIがかなり自然に良い回答を出せてしまうことです。
これって、使い方を間違えると危ないんですよね。
たとえば学生がAIの答えを鵜呑みにしてしまったり、微妙に外れた説明をそのまま覚えてしまったりする可能性はあります。研究でも、AIモデルには性能差があったようですし、文脈の限界によって答えの質が揺れることも示されています。
つまり、AIは万能ではありません。
ただ、雑に扱ってもそれなりに見えてしまうのが、むしろ厄介なんです。ここがAI時代の本当の怖さだと思います。間違いがあからさまなら気づけますが、よくできた半端な答えは見抜きにくいからです。
この研究から言えるのは、少なくとも次の2点です。

研究者たちが強調しているのもまさにそこです。
争点は「AIが正しいかどうか」だけではなく、どう使えば学生の学びを本当に良くできるのかに移っている、というわけです。
この視点はかなり重要だと思います。
AIの議論って、すぐに「使うか、使わないか」の二択になりがちですが、現実はもっと細かいはずです。
たとえば、
みたいに、場面ごとに分けて考えるほうが実務的です。
今回のStanfordの研究は、AIが「文章をうまく書ける」だけでなく、法律教育のような判断が必要な分野でも高く評価されたことを示しました。
これは、AIの進化を示す興味深い結果であると同時に、教育現場がどう向き合うべきかを考えさせる材料でもあります。
個人的には、これは「AIが先生を全部置き換える」という話ではなく、**“優秀な補助者”としてどこまで使えるかを真剣に考える段階に入った、というサインだと思います。
そして、AIを過信しないこと以上に、最初から拒絶しないこと**も大事になってきているのではないでしょうか。