#VideoPrism
2024/02/25
•
GoogleAI影片再出王炸!全能通用視覺編碼器VideoPrism,效能刷新30項SOTA
【新智元導讀】 Google團隊推出「通用視覺編碼器」VideoPrism,在3600萬高品質視訊字幕對和5.82億個視訊剪輯的資料集上完成了訓練,效能刷新30項SOTA。 AI視訊模型Sora爆紅之後,Meta、Google等大廠紛紛下場做研究,追趕OpenAI的步伐。 最近,來自Google團隊的研究人員提出了一種通用視訊編碼器——VideoPrism。 它能夠透過單一凍結模型,處理各種視訊理解任務。