在本周的年度开发者大会上,Alphabet旗下谷歌发布了Veo 3,这是谷歌DeepMind开发的AI视频生成工具的最新升级版。

  新模型不仅能产生高分辨率的电影般的视觉效果,还包括逼真的音频,比如环境声、效果,甚至是语音对话,这让它在竞争工具中脱颖而出。

  谷歌的新模型与OpenAI的Sora、Meta的MovieGen或Runway的Gen-4不同,这些产品目前都不提供音频支持,而Veo 3将视觉效果与同步声音融合在一起,这引发了社交媒体上一波病毒式传播的视频,许多在线用户评论说难以分辨自己看到的是AI还是现实。

  谷歌DeepMind的联合创始人兼CEO戴米斯·哈萨比斯(Demis Hassabis)周五表示:“Veo 3在直观物理建模方面的出色表现令人惊叹。”他补充说,这一进展可能为了解宇宙的计算复杂性提供重要见解。

  特斯拉CEO埃隆·马斯克回应称:“太棒了。不错的工作。”马斯克去年也曾对谷歌的Veo 2表示钦佩。

马斯克称赞谷歌新一代AI视频生成模型Veo 3  第1张

  虽然马斯克一直在称赞谷歌的视频模型,但他此前曾对谷歌的Gemini表示担忧,指责该模型存在偏见。

  与此同时,本周早些时候有报道称,马斯克的人工智能公司xAI正在准备进行一项重大投资,计划在孟菲斯附近部署100万个GPU,这可能会让英伟达受益匪浅。