PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

食材をベクトル空間で旅する:Epicureが描く「レシピと言語」と「化学」のあいだ

キーポイント

そもそも何の話?

この論文は、食材を「単語のように」扱って、似た食材どうしが近くに並ぶような表現を学習する研究です。
こういう表現は embeddings(埋め込み)​ と呼ばれます。ざっくり言うと、食材を1本の座標に変換して、距離や方向で関係を見られるようにする技術です。

たとえば、料理の世界では「バジルとトマトは相性がいい」とか、「しょうゆとみりんはよく一緒に出る」といった関係がありますよね。
一方で化学の世界では、「この食材にはこの香り成分が含まれる」といったつながりがあります。
Epicureは、その両方をうまく見比べようとしている、というわけです。ここがまず面白いと思います。料理の相性を“感覚”ではなく“地図”として見ようとしている感じがあるんですよね。

Epicureの何が新しいのか

論文の要点は、​食材埋め込みをゼロから再学習し直したことです。しかもデータ量がかなり大きい。
使っているのは 4.14 million recipes。しかも単一言語ではなく、英語、中国語、ロシア語、ベトナム語、スペイン語、トルコ語、インド英語、ドイツ語、インドネシア語まで含むマルチリンガルなレシピコーパスです。

ここはかなり重要で、料理の知識って国や言語をまたいで意外と共通点があります。
たとえばスパイスの使い方や、発酵食品の組み合わせ、香味野菜の役割などは、文化が違っても似たパターンが見えたりします。
だから、複数言語のレシピをまとめて学習することで、「この食材は世界中のどんな文脈で一緒に使われるのか」が見えやすくなるのではないか、と思います。

データ作りがかなり大変そう

この研究では、集めた食材表記をそのまま使うのではなく、​LLM-augmented pipeline で正規化しています。
正規化というのは、表記ゆれをまとめる作業です。たとえば

みたいなものを、同じ概念として扱えるように揃えるイメージです。

論文では、こうした処理の結果、​1,790個のcanonical entries に整理したとあります。
料理データって実際かなり汚いので、ここを丁寧にやらないと後段の分析がぐちゃぐちゃになります。個人的には、この「地味だけど一番効く仕事」をちゃんとやっているのが好印象です。AI研究は派手なモデル名より、こういう前処理の強さで勝負が決まることも多いですしね。

image_0002.svg

3つのモデル:Cooc、Chem、Core

Epicureには、兄弟モデルのような3つのバリエーションがあります。
いずれも Metapath2Vec 系で、アーキテクチャとハイパーパラメータは同じ。違うのは random-walk schema、つまりグラフの上をどう歩くかだけです。

1. Cooc

Cooc は、食材の共起グラフだけを使います。
共起は「一緒に出てくること」です。レシピの中で同じ食材が一緒に現れるほど、関係が強いと考えるわけです。

これは料理っぽさが強いモデルですね。
化学的な知識がなくても、実際のレシピの使われ方から学ぶので、「現場感」があるタイプだと思います。

2. Chem

Chem は、FlavorDB のような化学的なつながりだけを使います。
論文では、​typed FlavorDB ingredient-compound graph を使い、​2,247個のtyped compound nodes15カテゴリ にわたって扱っているとあります。

ここでの typed は「種類付き」という意味です。
つまり、ただ成分があるだけでなく、「この化合物はこういうカテゴリに属する」という情報も入れています。

要するに、Chem は「味や香りの化学的な近さ」を重視するモデルです。
レシピの人気や頻出度とは別に、「分子レベルで似ているから相性がよいのでは」という視点に寄っています。

3. Core

Core は、その中間を狙うモデルです。
食材同士の共起と、化学的な関係の両方を混ぜています。論文では、ingredient-ingredient walks を controlled mixing で注入すると説明されています。

この発想がかなり好きです。
料理って、たしかに「よく一緒に使われる」だけでもなく、「化学的に相性がいい」だけでもないんですよね。
実際の料理では、文化・習慣・季節・価格・保存性みたいな要素も絡むので、Core のように両面を見るのは自然です。
個人的には、いちばん実用的な方向はこの Core ではないかと思います。

image_0003.svg

どんなグラフを使っているの?

この研究は、食材どうしの関係を graph(グラフ)​ として表しています。
グラフというのは、点と線でつながりを表す図のことです。

論文には2つのグラフが出てきます。

NPMI は、ざっくり言うと「一緒に出る頻度が、たまたま以上に強いか」を測る指標です。
つまり、ただ頻出なだけでなく、「本当にセットになりやすいか」を見る感じです。

こういうグラフを使うと、単語の埋め込みに近い発想で、食材同士の“距離感”を学べます。
たとえば、似た文脈で使われる食材や、化学的に似た香り成分を持つ食材が、近い場所に配置されるわけです。
この「空間として食材を眺める」という考え方が、タイトルの emergent geometry につながっています。なんだか少し詩的ですが、やっていることはかなり実務的です。

この研究の狙いは何か

この論文の狙いは、食材の埋め込みが

を比べることだと読めます。

image_0004.svg

つまり、​料理の知識は「経験」から来るのか、「化学」から来るのか、あるいはその両方なのか、という問いです。
これはなかなか本質的です。人間は「おいしい組み合わせ」を経験則で覚えるけれど、後から見ると化学的な理由があることも多い。逆に、化学的には近くても、文化的に一緒に使わない食材もあります。
そのズレをモデルでどう扱うかは、かなりおもしろい研究テーマだと思います。

どこが面白いのか

個人的に一番面白いのは、​料理を多言語・大規模・化学的に同時に扱っているところです。
レシピって、見た目はただの料理手順ですが、実は文化情報のかたまりです。さらに、食材名の背後には化学情報もあります。
それをひとつの埋め込み空間に押し込んで、食材の「近さ」を測ろうとしているのは、かなり野心的です。

しかも、3つのモデルを「アーキテクチャは同じ、歩き方だけ違う」に揃えているので、比較がしやすい。
この設計はフェアで、研究としてきれいだなと思います。
「あれもこれも変えたので、何が効いたのかわからない」というありがちな事故を避けているのが良いですね。

まだ気になるところ

一方で、概要を見る限りでは、これはあくまで 埋め込みの表現学習 が中心です。
つまり、「それで実際にどんなレシピ推薦がどれだけ良くなるのか」までは、ここからは断定しにくいです。
ただ、論文に付属ファイルとして linear_probeweatcross_modal などの評価っぽいCSVがあるので、何らかの分析はかなりやっていそうです。

とはいえ、元情報だけでは詳細なベンチマーク結果までは読み切れません。
なのでここは慎重に言うと、​基盤となる食材表現を整える研究として価値が高そう、というのが妥当な受け止め方だと思います。

ひとことで言うと

Epicureは、食材を「レシピ上の共起」と「化学的なつながり」の両方から学習し、料理の世界をベクトル空間に写し取ろうとする研究です。
料理のセンスを数式にする、というと少し大げさですが、方向性としてはかなりわくわくします。
食の研究って、意外と人間くさいのに、こうしてAIで地図化すると急に学問っぽくなる。そのギャップがいいんですよね。


参考: Epicure: Navigating the Emergent Geometry of Food Ingredient Embeddings

同じ著者の記事