新しい分子を作るって、言葉にすると簡単そうですが、実際はかなりの難題です。
薬の候補分子でも、新素材でも、完成形までの道筋をちゃんと考えないといけません。
ここで重要なのがretrosynthesis(逆合成)です。
これは、完成したい分子をゴールにして、「そこにたどり着くには、どんな材料を、どんな順番で反応させればいいか」を逆向きに考える方法です。
たとえば、
みたいな判断が必要になります。
これ、文章で見ると単純そうですが、実際は経験と勘、そしてかなりの試行錯誤が要る世界です。化学者が何年もかけて腕を磨くのも納得です。
今回ScienceDailyが紹介しているのは、EPFLのPhilippe Schwaller氏らが開発したSynthegyという新しい枠組みです。
面白いのは、Synthegyが「AIが化学構造をいきなり生成する」タイプではないことです。
むしろ役割としては、AIを“判断する装置”として使う発想に近いと思います。
研究チームは、large language models(LLMs)を、化学の推論を支える道具として使いました。
LLMというのは、ChatGPTのような大規模言語モデルのことです。普通の文章を読んで、それに対して判断や要約、推論っぽいことをするのが得意です。
SynthegyではこのLLMが、候補を直接作るのではなく、既存の探索アルゴリズムが出した候補を評価する係になります。
つまり、
という流れです。
この設計、かなり賢いです。
AIに「全部やらせる」のではなく、得意分野を分担させる。こういう現実的なAI活用は、派手さは少なくても実用性が高いと思います。
従来の化学計算ツールは、条件の絞り込みやルール設定が面倒でした。
でもSynthegyでは、化学者が自然言語、つまり人間がふだん使う言葉で希望を伝えられます。
たとえば、
みたいな指示です。
Andres M Bran氏は、ツールのUI(使いやすさ)はとても重要で、以前のツールは煩雑だったとコメントしています。
Synthegyでは「化学者が話すだけでよい」ので、反復作業が速くなり、より複雑な発想を試しやすくなるというわけです。
これはかなり大きいです。
研究の現場って、アイデアそのものより「そのアイデアをツールに入力するのが面倒」で止まることがあるんですよね。そこを言葉で突破できるなら、研究者の発想はかなり自由になるはずです。
Synthegyは、完成させたい分子を入力すると、まず従来のツールでたくさんの合成経路を出させます。
そのうえで、それぞれの経路をLLMがチェックします。
チェック内容は、単なる「正しそう」「間違っていそう」ではありません。
化学者の指示にどれだけ合うかを見て、さらになぜその経路がよいのかを説明するのがポイントです。
この「説明する」という部分が、個人的にはとても重要だと思います。
AIがただ点数を付けるだけだと、研究者は「なぜその判断なの?」となります。
でも理由が返ってくるなら、人間が最終判断を下すときの材料としてかなり使いやすい。AIが黒箱のままではなくなるわけです。
Synthegyの面白いところは、逆合成だけでなくreaction mechanism(反応機構)にも使える点です。
反応機構とは、ざっくり言うと
「反応の途中で電子がどう動いて、どんな段階を経て生成物ができるか」
を追う考え方です。
これがわかると、
といったメリットがあります。
Synthegyは反応を基本的な電子の動きに分解し、ありうる経路を探します。そしてLLMが各ステップを評価して、化学的に筋が通る経路へと探索を導きます。
さらに、反応条件や専門家の仮説などもテキストとして与えられるので、より現実的なシナリオに寄せて検討できるのも利点です。
ここは「化学の知識を文章として足していける」という意味で、かなり柔軟だと感じます。
研究では、synthesis planningにおいてSynthegyは、複雑な戦略指示に合う経路を見つけることができたとされています。
さらにdouble-blind study(評価者も対象も、誰がどの結果かわからない形の試験)で、36人の化学者が368件の有効な評価を行いました。
その結果、人間の評価とシステムの評価は平均71.2%一致したそうです。
この数字、私はなかなか印象的だと思いました。
もちろん「100%一致」ではありません。ですが、化学のように文脈依存で判断が難しい分野で、しかも戦略や好みが絡むことを考えると、71.2%はかなり健闘している印象です。
また、研究では
といったこともできたとされています。
加えて、LLMが分子の機能基レベルから合成ルート全体まで、複数のレベルで働けることも示されたようです。
ただし、小さいモデルは能力が限定的で、大きいモデルの方が良かったとのこと。
ここはAIらしい現実で、「とりあえず小型で十分」とはまだ言い切れない感じです。
この研究の本質は、AIが化学者を置き換えることではないと思います。
むしろ、化学者の考え方をAIに翻訳させ、探索を賢く絞ることにあります。
つまりSynthegyは、化学者の代わりに決めるのではなく、
という、かなり「補助役」に徹した設計です。
私はこの方向性、かなり好印象です。
AIに全部やらせると便利そうに見えますが、実際は責任の所在が曖昧になりがちです。
でも補助役として使うなら、人間の専門性を活かしたままスピードを上げられる。現場に入りやすいのは、たぶんこっちです。
この研究が重要なのは、synthesis planning と reaction mechanism の間を、自然言語インターフェースでつないだことです。
研究者のコメントにもある通り、機構を理解することは新しい反応の発見につながり、その反応が新しい分子合成を可能にします。
Synthegyは、その“機構→反応→合成”の流れを、計算機上でまたいで扱えるようにしようとしているわけです。
これは、薬の開発や材料研究にとってかなり大きい。
新しい分子を作るのは、単に「候補を出す」だけでは足りません。
どのルートが合理的か、どの反応が本当に起こりそうかまで見ないと、実験の現場では役に立ちにくいからです。
個人的には、今回の研究は「AIがすごい」よりも、AIの使い方がうまいところに価値があると思いました。
化学はルールだけで割り切れない領域なので、LLMのような言語モデルを“判断の補助”に回すのは筋がいいです。
もちろん、まだ万能ではないでしょう。
LLMはもっともらしい間違いもしますし、化学の厳密さには限界があるはずです。
でも、それでもなお、人間の専門知識と計算探索を自然言語でつなぐという発想はかなり魅力的です。
今後もし精度がさらに上がれば、化学者は「面倒な検索」より「何を作りたいか」の発想により集中できるかもしれません。
それって、研究の進め方そのものを少し変える力があると思います。
参考: AI lets chemists design molecules by simply describing them