0.22Bで10B級を狙う画像修復モデル「Moebius」が面白い
画像の一部を自然に埋める「image inpainting」は、地味に見えて実はかなり難しいタスクです。消したい物体の跡を消すだけでなく、周囲の文脈を読んで「そこに本来何があったか」をそれっぽく再現しないといけないからです。木の枝、壁の模様、人の顔。どれも適当に塗れば終わりではありません。 そんな中で登場したのが Moebius です。名前は数学っぽいですが、中身はかなり実務寄り。ポイントは、0.22B(2億2600万)パラメータという小ささで、11.9B級の巨大モデルに迫る、あるいは一部で上回ることを狙っている点です。論文の主張どおりなら、これはかなり痛快です。大きければ勝ち、という空気に「ほんとにそれだけ?」と突っ込んでくるモデルだからです。 Moebiusは、画像の欠けた部分を自然に補う image inpainting 専用の軽量モデル パラメータ数は 0.22B で、比較対象の FLUX.1-Fill-Dev(11.9B) の 2%未満 1ステップあたりの推論時間は 26.01ms とされ、全体で15倍超の高速化
papoo.work