Chrome 或引入 Gemini AI 功能「Glic」,需访问麦克风;理想同学 App 即将上线支持语音交流、识物

news/2024/12/28 0:09:43/文章来源:https://www.cnblogs.com/Agora/p/18634004

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@SSN,@鲍勃

01 有话题的新闻

1、Deepseek V3 开源!多语言编程能力飙升,力压 Claude3.5 Sonnet V2

 

 

备受期待的 Deepseek V3 终于开源!这款全新的 AI 模型在多语言编程能力上取得了重大突破,其在 aider 多语言编程测评中的表现,甚至超越了 Claude3.5 Sonnet V2 等竞争对手,引发了业界广泛关注。

 

据了解,Deepseek V3 相比之前的版本,在性能上实现了质的飞跃。Deepseek V2.5 在 aider 测评中的成功率仅为 17%,而 V3 则暴增至 48%,这充分展现了其强大的进步。

 

Deepseek V3 采用了高达 6850 亿参数的混合专家(MoE)架构。该架构包含 256 个专家,并使用 sigmoid 路由方式,每次选取前 8 个专家(topk=8)参与计算,这种设计使得模型能够更加高效地处理复杂任务,并提高了性能。(@AIbase 基地)

 

2、ChatGPT 搜索功能面临潜在风险:或被恶意操控输出不可信内容

 

近期,英国《卫报》的一项调查揭露了 OpenAI 的 ChatGPT 搜索工具可能存在的安全隐患。调查发现,ChatGPT 在处理包含隐藏内容的网页摘要时,可能会受到操控,甚至返回恶意代码。这些隐藏内容可能包括第三方指令,旨在干扰 ChatGPT 的回应,或是大量隐藏的文字,推销某个产品或服务。

 

测试中,ChatGPT 被提供了一个伪造的相机产品页面链接,并被要求判断该相机是否值得购买。在普通页面上,ChatGPT 能够平衡地指出产品的优缺点。然而,当页面中隐藏的文本包含要求正面评价的指令时,ChatGPT 的回答变得完全积极,即使页面上存在负面评论。此外,即使没有明确的指令,简单的隐藏文本也能影响 ChatGPT 的总结结果,使其倾向于给出积极评价。

 

CyberCX 的网络安全专家 Jacob Larsen 警告称,如果 ChatGPT 的搜索系统按现有状态全面发布,可能会面临「高风险」,有人可能会专门设计网站来欺骗用户。不过,他也指出,OpenAI 拥有一支强大的 AI 安全团队,预计在功能对所有用户开放时,他们将已经严格测试并修复了这些问题。

 

搜索引擎如谷歌曾对使用隐藏文本的网站进行惩罚,导致这些网站排名下降,甚至被完全移除。SR Labs 的首席科学家 Karsten Nohl 指出,对于任何搜索引擎来说,SEO 中毒都是一个挑战,ChatGPT 也不例外。尽管如此,这并非大语言模型本身的问题,而是作为搜索领域新入局者所面临的挑战。(@AIbase 基地)

 

3、AI 首次自主发现人工生命,Sakana AI 推出全新算法

 

 

近日,由 Transformer 八子创立的 Sakana AI,联合来自 MIT、OpenAI、瑞士 AI 实验室 IDSIA 等机构的研究人员,提出了「自动搜索人工生命」的新算法。

 

据介绍,这次研究者们提出的算法,可以使用视觉-语言基础模型自动发现人工生命。只需要描述要搜索的模拟空间,ASAL 就可以自动发现最有趣、具有开放式的人造生命体。

 

由于基础模型的广泛通用性,ASAL 可以在各种经典的人工生命模拟中发现新的生命形式,包括 Boids、Particle Life、生命游戏(Game of Life)、Lenia 和神经元胞自动机(Neural Cellular Automata)。

 

甚至,ASAL 还发现了一些全新的元胞自动机规则,比原始的康威生命游戏更具开放式和表现力。

 

研究者相信,这种全新的范式能够克服手动设计模拟的瓶颈,重新激发人工生命研究的热情,从而突破人类创造力的极限,让这一领域再上一层楼。

 

据了解,ALife,即「人工生命」,旨在通过模拟生命的行为、特性和演化过程来理解生命的本质,通常结合了计算科学、生物学、复杂系统科学以及物理学等领域。

 

值得一提的是,世界上首个「AI 科学家」便是由 Sakana AI 提出的。据了解,「AI 科学家」可以独立搞科研,完全不需要人类插手,从提出研究想法、实验、写代码,再到 GPU 上执行实验,收集结果,AI 承包了整个机器学习研究的全过程。(@APPSO)

 

4、字节 TikTok 算法负责人或于近期离职

 

近日,据蓝鲸新闻报道,字节跳动 TikTok 算法负责人陈志杰或于近期离职,并已经开启 AI 领域创业。

 

据知情人士透露,陈志杰创业的方向为 AI Coding 方向,目前已经在陆续接触投资人。

 

据资料显示,陈志杰于 2022 年 4 月正式加入字节跳动并担任技术高级总监,负责 TikTok 的推荐算法团队和数据科学团队。此前,他曾在 2010 年 7 月到 2019 年 5 月期间在百度担任首席技术架构师。

 

此外,本次陈志杰选择的 AI Coding 方向是当下大模型的热门赛道之一, 据预测,到 2032 年,全球 AI 编码(AI Coding)工具市场规模可能超过 295 亿美元。同时,在海外市场 AI Coding 赛道已经出现多家独角兽公司。(@APPSO)

02 有亮点的产品

1、谷歌为 Chrome 浏览器引入「Glic」AI 功能

 

 

谷歌正在为 Chrome 浏览器引入名为「Glic」 (Gemini Live in Chrome)的 AI 功能,基于 Gemini Live 大模型打造。Glic AI 将以后台运行的形式随时待命,并拥有独立的设置页面,需要获取用户设备的麦克风和位置权限。

 

用户可以通过浏览器浮动面板或侧边界面呼出 AI,以便于获取对网页的见解、查询更多资讯等。(@AI 洞察局)

 

2、理想同学 App 明日上线,支持语音交流、识物等功能

 

据理想汽车官方消息,理想同学 App 将于明日(12 月 27 日)上线。在理想 AI Talk 第三场直播开启(20:00)后,可以通过应用商店(苹果用户)和官网下载(安卓用户)。

 

根据官方公布的演示视频,理想同学 App 点击后将进入视频拍摄画面(后置相机录制),页面提供麦克风开关、拍摄按钮、历史记录、切换、关闭等功能按钮。用户提出问题后,理想同学将实时解答,例如可向其询问当前所拍摄画面里的物品信息(即识物功能)。

 

该款应用还支持语音交互能力,在回答用户问题时,会提供语音解说。从视频展示的效果来看,理想同学支持自然语音对话。(@IT 之家)

03 有态度的观点

1、红杉美国最新洞察:2025 年将是 Agent 元年!AI 智能体进入「群体协作」时代

 

红杉合伙人 Konstantine Buhler 在近期接受了 Bloomberg 独家采访,Buhler 强调,AI 的当前热点是「智能体」,即能够完成具体任务的 AI 系统。

 

他预测,2025 年及以后,AI 智能体将从单一智能体发展到「群体协作」的模式,即多个代理组成网络,彼此协作甚至对抗,完成更复杂的任务。

 

此外,他还指出医疗和教育等关键领域将成为 AI 技术的下一个重要战场,有潜力降低成本、提高效率,从而推动社会进步。(@有新 Newin)

 

 

更多 Voice Agent 学习笔记:

 

对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点

 

这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势

 

语音即入口:AI 语音交互如何重塑下一代智能应用

 

Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……

 

帮助用户与 AI 实时练习口语,Speak 为何能估值 10 亿美元?丨Voice Agent 学习笔记

 

市场规模超 60 亿美元,语音如何改变对话式 AI?

 

2024 语音模型前沿研究整理,Voice Agent 开发者必读

 

从开发者工具转型 AI 呼叫中心,这家 Voice Agent 公司已服务 100+客户

 

WebRTC 创建者刚加入了 OpenAI,他是如何思考语音 AI 的未来?

 

人类级别语音 AI 路线图丨 Voice Agent 学习笔记

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/859393.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

洛谷题单指南-线段树的进阶用法-P3834 【模板】可持久化线段树 2

原题链接:https://www.luogu.com.cn/problem/P3834 题意解读:静态区间第k小问题,可持久化线段树(也称为主席树)模版题。 解题思路: 一、朴素想法:如何求完整区间[1,n]第k小 1、权值线段树 设n个数构成序列a,b数组代表a中元素出现的次数,即b数组的构建方式为对每一个a[…

FTP一键安装脚本(linux版)

简述:linux版权限可能会不容易理解,可参考windwos做为基础。一、FTP(linux版) 1. ftp详解 简介: vsftpd 是“very secure FTP daemon”的缩写,安全性是它的一个最大的特点。 vsftpd 是一个 UNIX 类操作系统上运行的服务器的名字,它可以运行在诸如 Linux、BSD、Solaris、…

React—01—基本学习,如何在html中直接使用react;

一、react的特点:<script>标签这里要加一个“text/babel”,babel才知道这个<script>标签里要解析js代码,否则babel不会启动。 React 组件是返回标签的 JavaScript 函数:哪个组件是通过改变 state 实现可响应的,或者哪个组件拥有 这个 state。 然后我们需要确定…

记录python+pyside+qml+qtcharts 使用,防踩坑

使用QML-qtquick 进行开发时,有个使用chart图表的需求,看了一大圈,网上都是qmake或是cmake来构建QTchart,用python开发也只搜到QtWidgets模块进行图表绘制。然而我对qtwidgets不是很了解,想要的是QML开发,在使用ChartView{}时一直闪退,没有效果。经历了苦苦搜寻,终于在 h…

制作了一款 pdf 转换图片的工具( csharp 版 )

在 Windsurf 的帮助下,制作了一款 windows 下的 pdf 转换图片(png/jpg/tif)工具。支持递归查找 pdf,一些配置给写死了,适合简单使用。 PDF 批量转图片工具 这是一个功能强大且易用的 PDF 转图片工具,专为批量处理 PDF 文件设计。它能够将 PDF 文件的每一页转换为高质量的…

C# WPF PrintDialog 打印(1)

参考“WPF 打印实例”的文章:https://www.cnblogs.com/gnielee/archive/2010/07/02/wpf-print-sample.html 测试程序: 首先打印Canvas效果:看起来似乎没问题,但是调整窗体尺寸遮挡部分元素:再打印Canvas效果:可以发现PrintVisual方法只打印了可见部分的元素,测试打印Dat…

CentOS8安装

安装方法跟Centos7无差异。 一、下载安装包镜像地址:https://mirrors.aliyun.com/centos-vault/centos/8.2.2004/isos/x86_64/?spm=a2c6h.25603864.0.0.1f647af6cvFFgO 二、安装操作系统 安装界面如下, 三、后续工作a、配置ip地址 [root@localhost ~]# cat /etc/sysconfi…

某视频tv app 签名算法分析

一、基本信息 分析工具:objection、frida 二、加解密分析 通过抓包发现请求体里有签名校验 sign ,并且响应体里返回的数据是密文,所以本次的目标就是破解签名 sign 以及响应包加密算法。2.1 请求签名 sign 从 sign 的数值长度上判断可能是 MD5,先使用 objection hook java.…

Metal RT压缩

iOS设备的屏幕分辨率越来越高,渲染时需要的RT的分辨率和内存的开销都更高了。苹果官方在2021年发布的A15 Bonic芯片中支持了RT的lossy压缩,可以减少50%的内存footprint。 MetalRT压缩是什么? Apple在2018年就已经提供了RT的lossless压缩方案,可以节省带宽,从而降低功耗。在…

百度地图轨迹绘制以及轨迹回放以及鼠标滑过自定义样式

用百度地图的绘制轨迹以及相关的轨迹回放,鼠标滑过展示与否的自定义弹窗的整理 图片展示组件代码:<!--* @Author: menxiaojin* @Date: 2023-07-12 14:03:03* @LastEditors: menxiaojin* @LastEditTime: 2023-07-20 19:41:02 --> <!--首页地图组件--> <templat…