iWeekly
在美国谷歌旗下的“深层思维”公司(DeepMind)推出Veo人工智能视频生成器仅仅7个月后,公司宣布于当地时间12月16日推出新一代人工智能视频生成模型Veo 2。这款新工具可以生成分辨率高达4K的视频,而第一代Veo只能处理分辨率达1080p的视频。谷歌声称,升级后的Veo视频生成器在模拟真实世界物理规律方面和实现不同的镜头与电影效果方面有所改进。Veo 2在打击例如“多出来的手指”等“幻觉”细节方面也取得了重大进展,展示了“对现实世界物理、人类运动和表情的细微差别的更好理解”。
Veo 2向4K迈进表明,“深层思维”公司在视频生成方面领先于其他人工智能实验室。日前,OpenAI公司宣布了旗下视频生成模型Sora正式面向大众推出,但新版本Sora Turbo的输出仍然限制在1080p的最大分辨率。而备受欢迎的Runway人工智能视频生成器也只能以更模糊的720p分辨率格式输出。谷歌在针对Veo 2的一次演示中表示:“低分辨率视频对移动设备来说很棒,但创作者也希望看到他们的作品在大屏幕上大放异彩。”据悉,Veo 2的4K视频默认为8秒,但可以延长到2分钟以上。
点击顶图观看完整视频
为应对深度伪造的风险,Veo 2生成出来的视频带有隐形SynthID水印,有助于用户识别一段影片是否为人工智能生成的。“深层思维”公司声称,在比较Veo 2和Sora Turbo时,59%的人类评分者更喜欢谷歌的服务,只有27%的人选择Sora Turbo。当天,“深层思维”公司还发布了Imagen 3文本到图像模型的更新版本。Imagen 3模型于今年8月首次推出。新版本能够生成出“构图更平衡”、更具艺术风格的图像。
iWeekly周末画报独家稿件,未经许可,请勿转载