开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@SSN,@鲍勃
01 有话题的新闻
1、OpenAI CTO Mira Murati 离职,高层动荡继续
OpenAI 又迎来「地震级」高层人员变动。
今日凌晨三点半,OpenAI CTO Mira Murati 在 X 上发帖表示,在 OpenAI 工作了六年多后,她将离开公司进行自己的探索。
Mira 曾在去年 Sam Altman 被罢免之后短暂担任临时 CEO 的职位,同时在他返回 OpenAI 时发挥了重要作用。
如今 Mira 也离开了,加上正在休长假的 Greg Brockman 以及离职的首席科学家 Ilya Sutskever,曾经的 OpenAI「四大天王」,只剩 Sam Altman 一个人。(@机器之心)
2、国内首个视频大模型 Vidu 宣布开放 API
9 月 25 日,生数科技旗下视频大模型 Vidu 宣布正式开放 API,并同步接入百度智能云千帆大模型平台,成为平台接入的首个视频大模型。
作为国内首个纯自研的视频大模型,Vidu 在高动态性、多风格化、极致推理等方面具备领先优势,并上线全球首个「主体参照」功能,突破视频模型一致性生成难题。
通过 API 开放,Vidu 的视频生成能力可以快速融入各行业和应用场景,落地企业个性化的解决方案,满足企业对规模化、低成本的视频内容生产需求,以及高度自由的创作需求。
另外,在技术研发方面,Vidu 在模型训练环节选择了百度百舸·AI 异构计算平台。Vidu 借助百舸的算力集群和高效的资源调度系统,训练效率得到大幅提升,模型优化也得到强有力的支持。(@APPSO)
3、Meta Connect 2024:Meta 首款全息眼镜 Orion 发布
今天凌晨,Meta Connect 2024 正式举办。此次大会正值发布会十周年的重要节点,扎克·伯格也带来了多款新品:
- Meta Orion 智能眼镜: 由眼镜本体、手势追踪腕带、遥控器大小的「计算模块」三部分组成;机身采用了镁材料打造,Orion眼镜本体重量仅 98 克;据 The Verge 的测试,眼镜视场角高达 70 度;交互层面, Meta Orion支持眼动追踪、手势操控和 AI 语音操作,佩戴配套的腕带能够实现更精细的手势操作。
- Meta Quest 3S 头显 MR 眼镜: 搭载 Snapdragon XR2 Gen 2 处理器;新增 Hyperscale功能,通过手机扫描房间的轮廓细节后,就能在 Quest 3S 重新构建出一个接近 1:1 的复原场景;推出沉浸式社交的增强功能。MetaQuest 3S 共提供 128GB/256GB 两个版本,售价分别为 299.99 元/399.99 美元。
- Meta 首个开源大模型 Llama 3.2 : 包括两个视觉模型(11B 和 90B)和两个轻量级的纯文本模型(1B 和3B),可同时处理文本和图像。
- Meta Ray-Ban 迎来 AI 新功能: 借助 Llama 3.2 的能力, Ray-Ban现在可进行实时翻译、个性穿搭建议等功能。(@APPSO)
4、「稚晖君」创业项目,智元自主研发的机器人中间件 AimRT 开源
9 月 25 日,智元自主研发的机器人中间件 AimRT 开源上线。官方表示,AimRT 是一个更现代、轻量易用,且高效稳定的通信开发框架,具备机器人开发流程所必备的许多实用特性,并解决了主流开源中间件的一些痛点:
- 在软件开发效率方面 ,AimRT 基于现代 C++新标准开发,轻量易部署,将现代化设计模式应用在资源管控、异步编程、部署配置等方面,使得机器人应用的开发更加快捷和高效。
- 在工具链与调测效率方面 ,AimRT提供了完善的调试、性能分析工具,以及良好的可观测性支持,有助于快速发现并解决系统中的问题,相比较传统的通信框架能够更加有力的保证机器人系统的稳定运行。
- 在生态兼容方面 ,AimRT 能够兼容 ROS2、Http、Grpc等传统机器人生态或云服务生态,开发者可以根据需要选择合适的通信后端,并支持渐进式升级存量系统,可广泛应用于机器人端侧、边缘端、云端等多种部署场合,与最新的AI 技术更亲和。
- 在扩展性方面 ,AimRT 提供了全面的插件开发接口,还提供了十余种官方插件,同时也支持开发者们进行二次开发以适配更多场景。
以「天才少年」身份加入华为的稚晖君于 2022 年底宣布离职,创业智元机器人。今年 9 月 3 日,智元机器人完成 A++++++ 轮融资,估值已超过 70 亿元,得到了包括北汽、上汽、比亚迪在内的国内汽车巨头支持。(@IT 之家)
5、MIMO:给定一个参考图像 、视频 几分钟即可生成一个可以控制动作和场景的动画人物
MIMO 是一个生成虚拟角色动画的工具。它能够让用户通过一张图片和简单的动作信息(如图片、动作序列或视频),生成一个可以控制动作和场景的动画人物,而且这个人物可以与场景中的物体进行互动。
即给定一个参考图像,MIMO 能够通过几分钟的推理生成可动画的虚拟形象。
该模型突破了传统 3D 角色视频生成方法的局限,不需要多视角拍摄或针对每个角色单独训练。通过结合 2D 视频信息和 3D 空间建模,MIMO 可以高效地生成角色动画,并支持在真实世界的复杂场景中与物体进行交互。
MIMO 的核心优势在于它可以根据用户的需求自由控制动画中的角色、动作和场景,适应不同的应用场景,如虚拟人动画、电影特效、游戏角色等。(@小互 AI)
02 有态度的观点
1、百度李彦宏:智能体是我最看好的 AI 应用方向
在昨日 2024 百度云智能大会上,百度创始人李彦宏发表颁奖致辞时指出,智能体是他最看好的 AI 原生应用发展方向。李彦宏表示,「越来越多的人靠自然语言提示词,就可以做出很有用的智能体」,相当于 PC 时代的网站和自媒体时代的账号。
李彦宏表示,智能体最明显的特点是门槛足够低,谁都能上手,但同时天花板又足够高,可以做出非常复杂,非常强大的应用,未来将会有数以百万量级的智能体出现,形成庞大的智能体生态。在今年文心杯创业大赛中,有超过 60% 参赛团队聚焦智能体的应用,超过 30% 参赛团队没有专业程序员。
「面对新的技术周期,坚持长期主义的创业者必将脱颖而出。」现场,李彦宏重申坚持举办「文心杯」创业大赛的初衷。他说,大模型热潮已经持续两年,当度过最初的兴奋,回归现实和落地时,许多创业者可能会感到失落、迷茫,甚至怀疑未来,「因为人们总是高估技术的短期价值,却低估技术的长期价值。」在他看来,大模型是一次颠覆式的技术革命,长期前景非常乐观,「悲观者永远正确,而未来却是由乐观者创造的」。
李彦宏表示,「百度希望能与所有的创业领域企业共建一个繁荣的 AI 产业应用和智能生态,帮助创业者更早的找到 PMF,做出超级应用。」(@有新 Newin)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻