物理のゆらぎで画像を描く「Un-0」がかなり野心的だった
Unconventional AIが公開した Un-0 は、coupled oscillators(結合した振動子) のシミュレーションで画像を生成するモデル 画像生成の土台に、ふつうのニューラルネットではなく 物理っぽい動きそのもの を使おうとしているのが最大の特徴 ImageNet 64×64 では FID 6.74 を達成し、公開時点の評価でかなり強い水準に入っている モデルの weights、training code、ablation code が公開されていて、試しやすい ただし、学習にはまだ普通のGPUと大きな計算量が必要で、「省エネ革命がもう完成した」という話ではない この記事でいちばん引っかかるのは、画像生成器の中身です。 Un-0 は Transformer や diffusion の延長線上にあるのではなく、振動子が互いに影響し合う物理システム を計算の本体にしています。 振動子というのは、たとえばメトロノームみたいなものだと思うとわかりやすいです。1個なら勝手に一定のリズムで動くだけですが、2個、3個と並べて同じ台
papoo.work