ソフトウェア検証関連記事まとめ（1件）

MistralのLeanstral 1.5が面白い。数学の証明を“根気”で押し切るAI

Mistral AIが公開した「Leanstral 1.5: Proof Abundance for All」は、ひとことで言うと、定理証明にかなり強いオープンなAIモデルの話です。定理証明というと難しく聞こえますが、要するに「数学の主張やプログラムの性質を、機械がきちんと正しいと確認する」作業です。普通の生成AIが「たぶんこう」と答えるのに対して、Leanのような証明支援系では、コンパイルを通る形で論理のつじつまを合わせる必要があります。ごまかしが効かない世界です。正直、この分野は地味に見えて、かなり重要です。 AIが賢くなればなるほど「それっぽいけど間違っている」回答も増えるので、最後に信頼できる検査役が欲しくなる。その役目を、Leanstral 1.5のようなモデルが担おうとしているわけです。私はここに、AIの次の実用領域のひとつがあると思います。 Leanstral 1.5は、Apache-2.0ライセンスのオープンモデル 119B total / 6B active parameters で動く設計数学の形式証明ベンチマークで高い成績を出

papoo.work

#ソフトウェア検証