OpenAI 重大人事变动,联创加入死敌;阿里视频框架 Tora 操控物体运动轨迹丨 RTE 开发者日报

news/2024/11/20 22:30:00/文章来源:https://www.cnblogs.com/Agora/p/18345773

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@JLT,@鲍勃

01有话题的新闻

1、阿里团队推出视频 AI 生成框架 Tora:画圈操控物体运动轨迹

 

 

阿里团队最新推出了 AI 视频生成框架 Tora,同时集成了文本、视觉和轨迹条件用于生成视频,是基于轨迹导向的扩散变换器(DiT)技术。

 

Tora 由一个轨迹提取器(TE)、一个时空 DiT 和一个运动引导融合器(MGF)组成:

 

TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。

 

MGF 将运动贴片集成到 DiT 模块中,以生成遵循轨迹的连贯视频。

 

Tora 无缝契合 DiT 设计,支持制作最长 204 帧、720P 分辨率的视频,可以精确控制不同持续时间、宽高比和分辨率的视频内容。大量实验证明,Tora 在实现高运动保真度方面表现出色,同时还能细致模拟物理世界的运动。

 

其独特设计理念融合文本、视觉和轨迹条件,精准控制视频内容,模拟物理世界运动规律,为电影特效制作、虚拟现实领域带来无限可能。(@IT 之家)

 

2、OpenAI 正在研发 ChatGPT 文本水印

 

据《华尔街日报》报道,OpenAI 已经开发了一种工具,可以用来检测用户是否使用 ChatGPT 撰写文章。报道指出,这项检测技术实际上使用到了一种文本水印。用户无法通过肉眼察觉,但可以借助 OpenAI 的检测工具来进行识别。

 

在《华尔街日报》的这篇报道发出后,OpenAI 还更新了 5 月份的一篇博客文章,更新内容主要为检测 AI 生成内容进行的研究。更新内容中指出,文本水印已被证明「非常准确,甚至对局部篡改也有效」。不过在检测全局篡改方面的能力较弱,比如使用翻译系统,用另一个生成模型改写,或者要求模型在每个单词之间插入一个特殊字符,然后删除该字符等操作。(@爱范儿)

 

3、OpenAI 又动荡,Greg Brockman 长期休假,另一联创加入死敌

 

OpenAI 经历重大人事变动,联合创始人 Greg Brockman 长期休假,John Schulman 转投竞争对手 Anthropic,产品负责人 Peter Deng 离职。Brockman 对 AI 模型和产品如 ChatGPT 转化有关键贡献,Schulman 负责改进大型语言模型和领导安全团队。

 

变动发生在公司业务发展强劲但面临潜在重大损失的时期。联合创始人 Ilya Sutskever 和 Andrej Karpathy 分别离职创办新公司。OpenAI 可能从非营利组织转变为利益公司,正在训练下一代旗舰 AI 模型,推出搜索引擎,开发 AI 代理自动执行计算机任务。Schulman 跳槽希望更深入从事 AI 对齐工作。(@硅星人Pro)

 

4、Not Diamond:自动推荐最佳的 LLM,实时学习提升体验

 

 

智能聊天机器人 Not Diamond 不仅仅是一款聊天机器人,它能自动选择最佳的人工智能模型来应对您的每一个问题,并根据您的反馈不断学习和改进。

 

【自动 AI 模型路由】:Not Diamond 会根据您的消息内容自动选择最适合的人工智能模型。

 

【实时学习】:Not Diamond 会在您使用的过程中实时学习,以确保每次交互都能带来更好的体验。

 

【竞技模式】:开启竞技模式可以比较不同模型的表现,为您提供更加个性化的建议。

 

【API 访问】:Not Diamond 还提供了 API 接口,让您可以在自己的应用中集成自动 AI 模型路由功能。

 

(@AI 产品大观)

 

5、智谱 AI 「清影」视频模型开源

 

今天凌晨,THUKEG (智谱 AI 官方账号)在 Github 上将 CogVideoX 开源。值得注意的是,该模型为前两周很火的智谱的第二世代 AI 视频清影的基模型。

 

7 月 26 日,智谱 AI 曾在官方公众号发文,宣布清影大模型上线。该模型可以让用户通过几个字到几百个文字的表述,在等待 30 秒之后,就可以获得一段 1440 x 960 清晰度的高精度视频。(@爱范儿)

 

6、马斯克重启对 OpenAI 及其 CEO 的诉讼

 

据纽约时报报道,马斯克重新启动了针对 OpenAI 的诉讼,这一举措加剧了 OpenAI 的权利斗争。在周一向法院提交的新起诉书中指出,OpenAI 及其两位创始人 Sam Altman 和 Greg Brockman 将商业利益置于公共利益之上,违反了公司的创始合同。

 

诉讼书中还提到,在 2015 年与马斯克一起创建 OpenAI ,并承诺为人类的利益谨慎开发人工智能后,Sam Altman 和 Greg Brockman 放弃了这一使命,并与 Microsoft 建立了数十亿美元的合作伙伴关系。(@爱范儿)

02有态度的观点

1、周鸿祎:大模型成本还将进一步降低

 

昨日,周鸿祎在社交平台发布视频。他认为,大模型的成本还将进一步地降低,使得科技平权,可以真正普惠给每一个人和结构,真正实现大模型的工业革命。此外,他还谈及了自己预计的大模型四大发展:

 

  • 开源模型与闭源模型并驾齐驱

  • 多个专业模型的组合工作,其能力可以超过规模更大的大模型

  • 模型并不是越大越好,要把模型的成本降下来,才能让人们更广泛地接触 AI

  • 端侧大模型将持续发力

 

(@爱范儿)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/778864.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

以“小”见“大” 打开“折叠”的世界

「 玩出个性,玩出潮流。」他来了!它来了! 昨晚,在年轻人的聚集地——B站,易烊千玺携手nova Flip亮相新生之夜。 带着“新一代”和“潮流”两个标签,这一款小折叠,为华为的折叠屏手机带来更多的可能性,也将激活整个折叠屏手机市场。 待激活的小折叠 经过几年的低迷期之后…

传奇单机版:复古三职业+无需虚拟机一键安装

今天给大家带来一款单机游戏的架设:传奇单机版。沉默版本 三职业 数值不变态 ,没有花里胡哨的东西(比如切割,生肖,时装等功能),客户端为16周年客户端 。另外:本人承接各种游戏架设(单机+联网) 本人为了学习和研究软件内含的设计思想和原理,带了单机架设教程,不适用…

被怼了:acks=all消息也会丢失?

消息队列是面试中一定会被问到的技术模块,虽然它在面试题占比不及并发编程和数据库,但也属于面试中的关键性问题。所以今天我们就来看一道,MQ 中高频,但可能会打破你以往认知的一道面试题。所谓的关键问题指的是这道面试题会影响你整体面试结果。我们在面试消息队列(Messa…

GaussDB安装

环境准备 1、关闭防火墙 systemctl stop firewalld 2、关闭selinux 临时禁用:setenforce 0 永久关闭: vi /etc/selinux/configSELINUX=disabled reboot 3、修改系统环境字符集 echo $LANG export LANG=en_US.UTF-8 永久修改 vi /etc/profile 添加 export LANG=en_US.UTF-8 so…

lambda 中 map 和 flatMap 的区别

lambda 中 map 和 flatMap 的区别https://blog.csdn.net/weixin_52772307/article/details/128944511总结: 当我们需要将具有层级结构的数据展平时,也就是将多层数据转换为单层数据操作时,我们可以使用 flatMap 方法。如果我们只是简单的对流中的数据计算或者转换时,可以使…

python 音频处理(2)——提取PPG特征之whisper库的使用(2.1)

PPG特征 提取PPG特征 whisper库使用提取PPG特征之——whisper库的使用(2.1) 1 安装对应的包方法一(自用): 直接pip即可: pip install openai-whisper 成功后如下图所示方法二: 当时用了他这个方法环境直接崩了,已老实conda install -c conda-forge ffmpeg conda insta…

数字量输入模块:远程组态说明

XD系列插片式远程 I/O模块是兴达易控技术研发的分布式扩展模块。XD系列成套系统主要由耦合器、各种功能I/O模块、电源辅助模块以及终端模块组成。有多种通讯协议总线的耦合器,例如 PROFINET、EtherCAT、Ethernet/IP、Cclink IE以及modbus/TCP等。I/O 模块可分为多通道数字量输…

Rust_learn_1

变量与可变性 变量 声明变量使用let关键字,在默认情况下,变量是不可变的(Immutable)。为此解决该问题,声明变量时在前面加上 mut,就可以使变量可变常量 常量(constant),在绑定值之后也是不可变的,但是与不可变的变量有很多区别:不可以使用mut,常量永远是不变的声明常…

【python海龟画图】代码整理

春联点击查看代码 import turtle t = turtle t.showturtle() t.penup() t.goto(-150,150) t.pendown()t.color(black, red) t.begin_fill() for i in range(2):t.forward(50)t.right(90)t.forward(400)t.right(90) t.end_fill()t.penup() t.goto(100, 150) t.pendown()t.begin…

【验证码逆向专栏】某安登录流程详解与验证码逆向分析与识别

声明 本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术…

Excel 根据单元格值设置行颜色

开始》条件格式》管理规则》新建格式规则》使用公式确定要设置格式的单元格 只为满足以下条件的单元格设置格式:=SEARCH("进行中",$E5)>0 ;(注释:此处筛选的是包含进行中的数据) 格式:选择满足条件的单元格设置什么格式 对某个单元格设置后【此示例使用的是…