不能输的战争:谷歌的Veo能否成功阻击OpenAI的Sora?|TodayAI

在2024年谷歌I/O大会上,谷歌宣布推出Veo,这是一款能够根据文本、图像或视频提示生成高清视频的AI视频合成模型。Veo具有生成1080p分辨率、时长超过一分钟的视频的能力,并能根据书面指令编辑视频,但目前尚未向公众广泛发布。

据介绍,Veo能够使用文本命令编辑现有视频,并在视频帧间保持视觉一致性。此外,该模型能够根据单个提示或一系列构成叙事的提示,生成长达60秒及以上的视频序列。公司表示,Veo能够生成详细的场景,并应用多种电影效果,如时间推移、空中镜头等。

自从OpenAI在2022年推出图像生成工具DALL-E 2以来,谷歌和其他科技巨头陆续推出了多种图像和视频合成模型,旨在让用户能够仅通过输入文字描述来创建图像或视频。这些技术虽然尚在不断完善中,但其生成能力已显著提升。

OpenAI的视频生成器Sora在今年2月首次亮相,当时其表现令行业内多数观察者印象深刻,甚至促使电影制作人Tyler Perry搁置其工作室的扩建计划。尽管如此,OpenAI至今尚未向广泛用户开放Sora的使用,仅限于少数测试者。

而谷歌的Veo似乎有望达到与Sora相媲美的视频生成效果。尽管公众尚未亲自体验Veo,但可以从谷歌提供的演示视频中窥见一斑,包括牛仔骑马、快速移动的郊区街道镜头、烧烤肉串和向日葵绽放等场景。

Google Veo:cowboy sun

值得注意的是,Veo在生成人物视频时尚未展示详细描述,这一直是AI视频模型面临的难题,因为生成的人物往往容易出现变形。

Veo在技术上建立在谷歌此前的视频生成模型基础之上,包括生成查询网络(GQN)、DVD-GAN、Imagen-Video等。为了提高生成质量和效率,Veo的训练数据包括了更详细的视频描述,并采用了压缩的“潜在”视频表示形式。

Google Veo:elephant

谷歌表示,Veo特别支持电影制作指令。例如,用户可以命令Veo在一个海岸线的空中镜头中添加皮划艇,Veo能够根据这些命令生成新的、经过编辑的视频。

虽然演示看起来一眼就令人印象深刻(特别是与Will Smith吃意大利面相比),谷歌承认AI视频生成是困难的。“在视频生成模型中保持视觉一致性可能是一个挑战,”公司写道。“角色、对象甚至整个场景都可能在帧之间闪烁、跳跃或意外变形,这会破坏观看体验。”

Google Veo:sunflower

谷歌已经尝试通过“尖端潜在扩散变换器”来减轻这些缺点,这基本上是没有具体细节的营销话术。但公司对这个模型足够自信,正在与演员Donald Glover及其工作室Gilga合作,制作一部即将首映的AI生成演示电影。

接下来,Veo将通过Google的AI Test Kitchen网站上的一个新实验工具VideoFX向选定的创作者开放。创作者可以加入VideoFX的等待列表,有可能在未来几周内获得使用Veo功能的权限。谷歌计划将Veo的一些功能整合到YouTube Shorts和其他产品中。

谷歌尚未透露Veo的训练数据来源,但表示正在对Veo采取“负责任”的方法。所有通过Veo创建的视频都将使用谷歌的先进水印和识别工具SynthID进行标记,并通过安全过滤器和记忆检查过程,以减少隐私、版权和偏见方面的风险。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/707410.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

QT项目实战:贪吃蛇小游戏

目录 内容介绍 一.添加头文件 二.初始化蛇与奖品 三.设置背景图,蛇与奖品 1.设置背景图 2.画蛇 3.画奖品 四.小蛇移动 1.控制方向 2.向上移动 3.向下移动 4.向右移动 5.向左移动 五.随机生成奖品位置 六.是否吃到奖品 七.删除操作 八.游戏结束 九…

Android:基于Gradle 7.0+(8.2、8.6)发布aar到maven仓库,使用maven-publish插件

maven插件与maven-publish插件的区别 maven插件适用于gradle1.0-6.2版本,6.2版本后该插件就被废弃了,推荐使用maven-publish插件。 maven-publis插件是在gradle 1.3 版本后开始支持的,使配置更加简洁。 maven-publis插件的使用 砍柴不误磨…

数据结构:二叉树的序列化和反序列化(序列和二叉树结构一一对应)

文章目录 一、基础知识1.1 序列化和反序列基础知识1.2 string与int转化STL函数 二、详解说明2.1 基于前序遍历的序列化和反序列化2.2 基于后序遍历的序列化和反序列化2.3 基于层序遍历的序列化和反序列化 三、例题——652. 寻找重复的子树 三个相同题目: 297. 二叉树…

Pencils Protocol Season 2 收官在即,Season 3 携系列重磅权益来袭

此前Scroll生态LaunchPad &聚合收益平台Pencils Protocol(原Penpad),推出了首个资产即其生态代币PDD的Launch,Season 2活动主要是用户通过质押ETH代币、组件战队等方式,来获得Point奖励,并以该Point为依…

C++那些事之Mixin惯用法

C那些事之Mixin惯用法 大家好,我是光城,今天给大家分享C那些事里面的一个惯用法:mixin 混合(Mixins)是Lisp中的一个概念。混合是类的一部分,意味着它旨在与其他类或混合组合在一起。常规独立类(…

C++学习~~string类

1.STL简单介绍 (1)标准模版库,是C里面的标准库的一部分,C标准库里面还有其他的东西,但是我们不经常使用,我们经常使用的还是STL这个标准库部分。 (2)六大件:仿函数&…

内网安全工具之ADExplorer的使用

ADExplorer是域内一款信息查询工具,它是独立的可执行文件,无需安装。它能够列出域组织架构、用户账号、计算机账号登,可以帮助寻找特权用户和数据库服务器等敏感目标。 下载地址:http://live.sysinternals.com/ 连接 下载了ADE…

SSM宠物管理系统-计算机毕业设计源码56932

摘 要 信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对宠物管理系统等问题,对宠物管理…

使用Docker在阿里云ECS上部署Gitlab,提供代码托管、CICD 和 docker镜像服务

文章目录 使用Docker在阿里云ECS上部署Gitlab1.购买一个数据,挂载到/data用于存储gitlab相关数据2. 部署docker引擎3. 调整ssh的默认端口,将22端口留给gitlab4. 部署gitlab5. 进入docker容器获取gitlab的默认密码6. 登录gitlab,完成gitlab-ru…

Spring Boot代码案例(计算器、登录、留言板)

文章目录 一、计算器二、登录2.1 判断账号密码是否正确2.2 根据不同的用户作出不同反应 三、留言板3.1 提交数据3.2 展示所有数据 四、Lombok 工具包4.1 场景介绍4.2 如何使用 五、Edit Starters插件六、项目如何Debug七、项目命名规范 一、计算器 导入前端文件后端代码&#…

Risk Of Rain 雨中冒险2服务器开服联机教程

1、购买后登录服务器(百度莱卡云) 1.1、第一次购买服务器会安装游戏端,大约5分钟左右,如果长时间处于安装状态请联系客服 2、设置游戏端口 由于雨中冒险2的设置需要两个端口,它们用于游戏端口,查询端口&am…

理解 Python 中的 `super()` 与 `__init__()` 方法

在 Python 的面向对象编程中,super() 函数和 __init__() 方法是两个非常重要的概念。它们在类的继承和初始化过程中扮演着关键的角色。本文将深入探讨这两个概念的工作原理,并通过示例代码来展示它们的使用。 基本原理 __init__() 方法 __init__() 是…