▎美國國家工程院院士李飛飛認為,實現AGI的關鍵一環是“空間智能”,而非二維智能。只有通過空間智能,才能看到世界、感知世界、理解世界並讓機器人做事,從而形成良性閉環。
鈦媒體App 8月2日消息,日前斯坦福大學舉辦的Asian American Scholar Forum論壇的一場閉門會上,有著“AI教母”之稱的斯坦福大學教授李飛飛對鈦媒體App獨家表示,儘管美國OpenAI公司的Sora模型可以文生視訊,但就本質而言,它仍屬平面二維模型,沒有三維立體理解能力,只有“空間智能”才是AGI未來方向。
李飛飛是在針對鈦媒體創始人趙何娟提出的關於“空間智能”模型和大語言模型關係的問題討論時,做出上述回應。她進一步解釋稱,現在的多數模型如GPT4o和Gemini 1.5,都依然還是語言類模型,即輸入語言,輸出語言,雖然也有多模態模型,但仍侷限於語言,即便有視訊,也是基於二維的平面圖像。但未來要實現AGI的關鍵一環是“空間智能“,需要三維視覺模型。
她以Sora展示的“日本女性走過霓虹閃爍東京街頭”的 AI 視訊做例子。