标签:
导读 谷歌进入人工智能视频领域只是时间问题——那一天已经到来。 谷歌研究项目Imagen Video(在新标签中打开)是一个文本到视频的生成器,类似
谷歌进入人工智能视频领域只是时间问题——那一天已经到来。 谷歌研究项目Imagen Video(在新标签中打开)是一个文本到视频的生成器,类似于 Meta 最近发布的Make-A-Video(在新标签中打开)系统。当用户提示时,该工具能够构建循环视频剪辑,其结果令人印象深刻,也很奇怪。
但是,渴望试用该工具的用户将不得不等待。与 Meta 的产品(包括注册选项)不同,谷歌研究团队暂时拒绝公开访问,理由是安全问题。
这不是谷歌在人工智能驱动的创意领域的第一个牛仔竞技表演。2022 年 5 月,该团队推出了 Imagen,这是一款 DALL-E 风格的 AI 生成器,能够根据书面提示生成逼真的静止图像。
新的基于 AI 的视频工具的工作方式相同。具有谷歌所谓的“高度可控性和世界知识”,它可以生成跨越不同审美风格的各种高保真视频,并具有对3D 模型的深刻理解。创建高清 24fps 视频也更快。
“在渐进式蒸馏的帮助下,Imagen Video 可以在每个子模型中仅使用八个扩散步骤生成高质量视频。这大大加快了视频生成时间,提高了约 18 倍,”该研究论文的一位作者 Jonathan Ho ,发推文(在新标签中打开).
但在内容营销团队和社交媒体创作者对轻松创建视频的前景过于兴奋之前,值得注意的是,Imagen Video 绝对还没有为公众消费做好准备。
尽管过滤了“不受欢迎的内容”,但该团队承认“Imagen 存在编码有害刻板印象和表示的风险”。因此,在人工智能及其用户可以信任之前,谷歌拒绝在没有额外保护措施的情况下发布 Imagen Video。
然而,尽管围绕数字艺术中的人工智能一直存在争议,但仅这一披露就表明了公司对这项技术的重视程度。