Gemini Omniとは何か?「動画を会話で編集する」Google DeepMindの新しい生成AI
Gemini Omni は、Google DeepMindが紹介している新しいAIモデルで、入力をまたいで何かを作れるのが特徴 いちばん目立つのは、動画を自然な会話で編集できること 画像、テキスト、動画、音声などの複数の素材を組み合わせて一つの出力にまとめることをうたっている 物理法則や世界知識を踏まえた、より一貫性のある映像生成を目指している 「Nano Bananaが画像なら、Gemini Omniは動画版」と言えるような、かなり攻めたコンセプトだと思う Google DeepMindの「Gemini Omni」は、ざっくり言うと“なんでも材料にして、ひとつの作品に仕上げるための生成AI”です。 元記事の見せ方を見る限り、単なる動画生成モデルというより、会話しながら編集を積み重ねていく創作エンジンに近い印象があります。 特に強調されているのが、動画編集を自然言語で行えること。 たとえば「この人が鏡に触れたら、鏡が水みたいに波打つようにして」「人物をクレイアニメ風に変えて」「カメラを肩越しの構図に変えて」といった指示を、
papoo.work