#spatialcomputing

Appleはまだ空間コンピューティングをあきらめていない？LLMの空間理解と手話注釈研究から見える次の一手

Appleの最新研究を眺めると、「Vision Proはもう終わった」と切り捨てるには早すぎる、という空気がはっきり見えてきます。今回のAppleInsiderの記事では、AppleのMachine Learning Blogに公開された3本の研究を中心に、LLM（大規模言語モデル）を空間認識や手話処理にどう活かすかが紹介されています。正直、かなり面白いです。というのも、ここでAppleがやっているのは単なる「AIチャットを賢くする」話ではなく、現実の空間を理解し、目の前の物をどう扱うかまで考えるAIを育てようとしているからです。これはVision Proのような空間コンピューティング製品と相性がよすぎる。むしろ、ここを狙わずしてAppleのAI戦略は語れないのではないか、と思います。 Appleは空間コンピューティング関連の研究を継続している LLM/MLLM（画像や動画も扱うマルチモーダルLLM）の空間理解だけでなく、物の用途や使い方まで評価するベンチマークを作った手話動画に対して、AIで注釈作業を半自動化する研究も進めている 3D h

papoo.work