Meta SAM 2:实时分割图片和视频中对象;Apple Intelligence 首个开发者测试版发布丨 RTE 开发者日报

news/2024/9/23 1:29:21/文章来源:https://www.cnblogs.com/Agora/p/18332577

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@JLT,@鲍勃

01有话题的新闻

1、Meta SAM 2 登场:首个能在图片和视频中实时分割对象的统一开源 AI 模型

 

Meta AI 宣布推出新一代的 Segment Anything Model (SAM) 2,能够在视频和图像中实现实时的可提示对象分割。

 

SAM 2 可以快速、精确地在任何视频或图像中选择对象。它不仅能在图像中分割对象,还能在视频中追踪对象,即使这些对象在训练时从未见过。该模型支持实时互动,非常适合各种实际应用,比如视频编辑和互动式媒体内容制作。

 

对象分割:它可以在图像或视频中识别出一个特定对象,并将该对象的像素与背景区分开来。例如,在一张包含多个物体的图片中,模型可以准确地找出并标记出某一个物体的轮廓。

 

实时性:模型能够在视频播放的过程中快速处理每一帧,立即识别并分割、跟踪出特定对象。这样可以实现如视频编辑、特效制作等需要快速反馈的应用。

 

可提示:是模型可以根据用户提供的提示(如点击某个物体、框选某个区域等)来进行分割。这种交互方式使得用户可以更精确地控制哪些对象需要被分割。(@小互 AI)

 

2、英伟达「AI 盒子」升级发布软件和服务,黄仁勋打造物理世界的数字副本

 

快科技 7 月 30 日消息,在顶尖计算机图形大会 SIGGRAPH 2024 上,NVIDIA 展示了其在渲染、仿真和生成式 AI 领域的最新进展,其中最引人注目的是 NVIDIA NIM 的全新升级。通过这一平台,用户可以在几分钟内构建 AI 应用,大大简化了 AI 模型的开发和部署过程。

 

黄仁勋将 NIM 形容为「AI-in-a-Box」,即盒子里的人工智能,这次升级通过标准化 AI 模型的复杂部署,进一步优化了性能,使得英伟达在 AI 领域的领导地位更加稳固。

 

英伟达还宣布,Hugging Face 推理即服务平台现在由 Nvidia NIM 提供支持,在云端运行,进一步扩展了 NIM 的应用范围。

 

此外,NVIDIA NIM 微服务通过增强 OpenUSD(通用场景描述)语言的理解,使得各行各业都能够构建基于物理的虚拟世界和数字孪生。(@快科技)

 

3、波形智能发布私人语言模型「Weaver 2.0」,聚焦个性化与自适应技术

 

人工智能初创公司波形智能近日正式发布了新一代多模态无限式长内容生成的个性化自适应私人语言模型「Weaver 2.0」。

 

据介绍,「Weaver 2.0」在技术上实现了多项优化升级,包括千人千面的个性专属、数据为核的自适应/自进化,以及端云结合的高效部署。这些特性使得该模型能够根据用户的个性化需求和使用习惯进行动态调整,从而提供更加精准、高质量的内容生成服务。

 

为了实现模型的持续进化和自我优化,波形智能自研了以数据为核心的可「自主进化」的智能体框架——AIWaves Self-Evolving Agents。这一框架不仅集成了 1.0 版本的可控性能力,还采用 Symbolic Learning 方式,让 Agent 可以在不断更新的数据环境中解析自身的性能表现,并根据用户习惯和反馈定期或主动进行调整。

 

此外,在隐私保护方面,「Weaver 2.0」采用端云结合的高效部署方案,可以根据需求在不同环境下打造「本地私钥」,以确保用户数据的安全性和隐私性。(@环球网科技)

 

4、苹果发布 iPhone AI 首个预览版:暂时向开发者开放

 

据外媒报道,苹果周一发布了 Apple Intelligence 的第一个版本,这是一套人工智能功能,可以改进 Siri、自动生成电子邮件和图像并对通知进行排序。这款名为 Apple Intelligence 的新软件在 iOS 18.1 的开发者测试版中发布。iPad 和 Mac 也有类似的版本。目前,它只对注册的 Apple 开发者开放。

 

此外,用户更新后必须在 Apple 的设置应用中注册候补名单才能访问该服务,这涉及 ping Apple 服务器以处理更复杂的请求。今年晚些时候,它将向公众发布,但 18.1 版本号表明 Apple Intelligence 不会与新 iPhone 硬件一起发布,预计新 iPhone 硬件将于秋季推出运行 iOS 18 的版本。

 

Apple Intelligence 是苹果的一项重要举措。投资者希望人工智能与苹果操作系统的紧密结合能够在未来几年引发一波大规模升级,尤其是考虑到该系统仅适用于 iPhone 15 Pro、iPhone 15 Pro Max 及更新版本。(@鞭牛士)

 

5、OpenAI 旗下 AI 搜索引擎 SearchGPT 官方演示被曝翻车

 

近期,OpenAI 宣布旗下 AI 搜索引擎 SearchGPT 开放内测,但该公司上演了谷歌 Bard 出糗的一幕,SearchGPT 的官方演示被曝出低级错误。据外媒,在回答「8 月在北卡罗来纳 Boone 举办的音乐节」的相关问题时,SearchGPT 出现了幻觉。

 

报道称 OpenAI 发言人已承认了这个错误,但表示「这仅是初始的原型,我们将不断改进。」此外,有参与内测的科技外媒还揭开了 SearchGPT 的搜索机制,与当前 ChatGPT 提供的通用 Bing 搜索功能不同,SearchGPT 更擅长提供实时信息。(@每日经济新闻)

02有态度的观点

1、多名院士专家谈人工智能:中国发展 AI 不能靠「堆芯片」

 

多名院士专家在 2024 中国算力发展专家研讨会上讨论了中国人工智能发展问题。他们认为,中国 AI 发展不能简单模仿美国「堆芯片」模式,而应结合国情,发展具有自主知识产权的「主权级大模型」。专家们提出,智能计算应参考人类智能,从基础理论突破,实现低能耗高智能的计算模式。同时,应重视大模型的算力需求,利用中国在超算领域的技术积累,研发专用超算,克服算力瓶颈。(@环球网)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/774088.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 环境配置(一)Python、Anaconda、Pycharm的安装

Python 环境配置(一)Python、Anaconda、Pycharm的安装本人之前已安装一次,此次为卸载之后的重新安装。。。一、Python 1、下载 下载官网: 下载链接:Download Python | Python.org勾选 添加到路径 (环境变量)next如图所示之后点close关闭2、验证 win+R cmd: python退出 …

C++ - VS2019配置pthread线程库

1. 说明 在VS里用MS编译器不能直接调用pthread库,需要先自行下载该库:http://sourceware.org/pub/pthreads-win32/pthreads-w32-2-9-1-release.zip 解压后用得到的只有Pre-built.2文件夹下的文件。2. 配置 如下图分别配置三大项:包含目录-->...pthreads-w32-2-9-1-releas…

Windows安全策略

Windows 安全策略是系统管理的一部分,用于设置和管理计算机或网络的安全配置。保护系统免受未经授权的访问和其他安全威胁。常见 Windows 安全策略分类: 1. 账户策略 (Account Policies) 账户策略管理用户账户的行为和属性,主要包括: • 密码策略: • 密码历史记录:限制用…

lca总结+树上差分

lca lca简称最近公共祖先——简介在此,不过多赘述 这里主要写的是倍增算法,oi-wiki上用的是vector,由于本人不会,只会用链表,所以这里就放链表的代码了例题加一个数组按倍增数组的方式存距离即可题解——点击查看代码 #include<bits/stdc++.h> #define int long lon…

基于OM6626/NRF528210系列的ESL电子价签应用

在竞争激烈的零售行业,效率和顾客体验至关重要。传统的纸质价签在更新频率、准确性和管理成本上存在诸多不足。而电子价签(ESL,Electronic Shelf Label)作为一种智能化解决方案,正在逐渐取代传统价签,帮助零售商提高运营效率和顾客满意度。01电子价签的优势 电子价签通过…

模拟退火

模拟退火 必须要单独开一个专题来讲模拟退火了。 看到身边很多同学写的模退都是不标准的,步长没有随温度的降低而减小,只能叫随机爬山。 系统的学习模退是跟着 Acwing 的 yxc,他写的模退给人一看就有一种豁然开朗,神清气爽的感觉,让你惊叹天下竟然还有如此精妙的算法。 是…

成为Apache SeaTunnel贡献者的N种方式

如何参与开源贡献参与开源贡献的常见方法有多种:1)参与解答 在社区中, 帮助使用过程中遇到困难的人,帮他们解释框架的用法也算是一种贡献。 2)文档贡献 帮助框架来完善文档,比如说将英文文档翻译为中文,纠正文档里面的错误单词,这 是很多人参与开源贡献的第一步。 3)代…

构建个性化财务数据看板,免费可视化工具来助力

财务月度数据,作为企业经营的晴雨表,其重要性不言而喻。然而,面对海量、复杂的数据,如何快速提炼关键信息,形成直观易懂的洞察报告,成为了众多企业面临的挑战。随着技术的不断进步,可视化工具正逐步成为财务数据分析领域的得力助手,帮助企业轻松构建财务月度数据看板,…

企业级Scrum敏捷开发培训:推动团队高效运作

“企业级Scrum敏捷开发培训:推动团队高效运作”​ 在当今快速变化的商业环境中,企业必须不断创新和快速响应市场需求,以保持竞争优势。Scrum敏捷开发方法作为一种高效的项目管理框架,已被全球众多企业采用,用于提高团队协作和交付速度。为了帮助企业更好地理解和应用Scrum…

关于VMware workstation添加本地物理磁盘时候提示“未能为设备XX加载分区,权限不足,无法访问文件”的解决办法

前言:玩虚拟机这么久了,原先一直是直接初始化虚拟机的时候按照流程新建虚拟机硬盘,但是正常情况下虚拟机硬盘与物理机硬盘是隔离开的,无法直接相互访问 正常情况下 是安装vm tools来进行相互间文件传输,或者将物理磁盘上的文件拷贝到U盘,当插上U盘的时候选择连接到对应的…

记一个kvm虚拟器迁移后无法启动故障

参考 https://www.cnblogs.com/joshua317/p/18061002故障现象 kvm虚拟机从一台主机迁移至另外一台主机后启动失败 报错信息如下# Type "journalctl" to view system logs.使用命令查看错误信息 # Failed to mount /sysroot原因分析 CentOS系统启动时出现Failed to mo…