Appleはまだ空間コンピューティングをあきらめていない?LLMの空間理解と手話注釈研究から見える次の一手
Appleの最新研究を眺めると、「Vision Proはもう終わった」と切り捨てるには早すぎる、という空気がはっきり見えてきます。 今回のAppleInsiderの記事では、AppleのMachine Learning Blogに公開された3本の研究を中心に、LLM(大規模言語モデル)を空間認識や手話処理にどう活かすかが紹介されています。 正直、かなり面白いです。というのも、ここでAppleがやっているのは単なる「AIチャットを賢くする」話ではなく、現実の空間を理解し、目の前の物をどう扱うかまで考えるAIを育てようとしているからです。これはVision Proのような空間コンピューティング製品と相性がよすぎる。むしろ、ここを狙わずしてAppleのAI戦略は語れないのではないか、と思います。 Appleは空間コンピューティング関連の研究を継続している LLM/MLLM(画像や動画も扱うマルチモーダルLLM)の空間理解だけでなく、物の用途や使い方まで評価するベンチマークを作った 手話動画に対して、AIで注釈作業を半自動化する研究も進めている 3D h
papoo.work