Claude 大更新,AI 可模仿人类访问电脑;月之暗面招募微软亚研院谭旭,研发类 GPT- 4o 的端到端语音模型

news/2024/10/23 18:01:04/文章来源:https://www.cnblogs.com/Agora/p/18497949

 

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@SSN,@鲍勃

01有话题的新闻

1、开源文生图 AI 重磅选手上新:Stable Diffusion 3.5 全家桶登场、消费级硬件上「开箱即用」

 

 

 

Stability AI 公司昨日(10 月 22 日)发布博文,宣布推出 Stable Diffusion 3.5,这标志着开源 AI 文生图模型的重大进步。

 

Stable Diffusion 3.5 共有 Medium、Large 和 Large Turbo 三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求,相关介绍如下:

 

Stable Diffusion 3.5 Large:共有 80 亿个参数,具有卓越的质量和快速响应,是 Stable Diffusion 家族中最强大的模型,非常适合 100 万像素分辨率的专业应用场景。Stable Diffusion 3.5 Large Turbo:是 Large 的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。Stable Diffusion 3.5 Medium(将于 10 月 29 日发布):该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,旨在能够在消费级硬件上「开箱即用」,平衡质量和易于定制,能够生成分辨率在 25 万到 200 万像素之间的照片。

 

Stability AI 为此次发布实施了一项相当宽松的社区许可,这些模型可供非商业用途免费使用,并且对年收入低于 100 万美元的企业开放,超过此门槛的企业必须获得单独的许可安排。(@IT 之家)

 

2、Anthropic 发布 Claude 3.5 Haiku 以及一项革命性新功能, AI 可以模仿人类访问电脑

 

Anthropic 宣布推出改进版的 Claude 3.5 Sonnet、全新的 Claude 3.5 Haiku,以及一项名为「computer use 模拟计算机使用」的新功能。

 

也就是 Claude 能够模仿人类的方式使用电脑,它可以自主查看屏幕、移动光标、点击按钮、输入文本等。还能够自动化执行多个步骤的复杂任务,如填写在线表格、搜索数据、提交报告等,从而大幅减少人工操作时间。

 

Claude 3.5 能够在计算机界面上导航,通过切换窗口、打开菜单、选择选项等操作,完成多步骤的任务。

 

开发者可以利用这项功能自动化重复任务、开发和测试软件、进行开放式任务(如研究),甚至在复杂的应用场景中进行交互。

 

Claude 3.5 Sonnet 改进

 

该版本在多项行业基准测试中表现优异,尤其在编程和工具使用任务上有显著提升。在编程测试(SWE-bench Verified)中表现提高到 49%,在零售领域的工具使用测试(TAU-bench)中提升至 69.2%,航空领域则达到了 46%。

 

新版 Sonnet 与其前代版本保持相同的价格和速度,并在多步开发过程中提高了推理和编程能力。

 

Claude 3.5 Haiku 发布

 

Claude 3.5 Haiku 是速度最快的新一代模型,在多项测试中超越了上一代的 Claude 3 Opus。在编程测试(SWE-bench Verified)中,Claude 3.5 Haiku 的得分为 40.6%,超过许多其他先进模型(如原版 Claude 3.5 Sonnet 和 GPT-4o)。

 

该模型在低延迟、跟随指令的准确性以及工具使用的精确度方面都有显著提升。特别适用于用户界面任务、个性化体验生成和大规模数据处理(如购买记录、定价或库存记录)。(@小互 AI)

 

3、消息称 OPPO 将收购大模型创业公司波形智能,纳入后者 CEO 姜昱辰

 

界面新闻昨日(10 月 22 日)援引波形智能内部人士消息称,该公司将被手机厂商 OPPO 收购,CEO 姜昱辰将入职 OPPO。OPPO 方面向界面新闻表示:「目前暂无更多信息。」

 

「我们只是被收购,产品仍在正常运营,不是网传的关张。」上述波形智能内部人士表示。

 

公开资料显示,姜昱辰生于 1998 年,本科毕业于浙江大学竺可桢学院工高班,博士毕业于苏黎世联邦理工大学,师从 Prof。Ryan Cotterell ,主攻自然语言生成。

 

波形智能旗下拥有自研的中文创作垂直领域大模型「Weaver」,以及由其驱动的面向用户写作类 Agent 产品「蛙蛙写作 2.0」。其主要盈利方式为订阅会员和单次服务计费,用户定位是一款帮助专业小说作者、自媒体运营者等内容生产者提升写作速度的效率工具。但是,用户的付费意愿、能力以及市场空间等都有待验证。

 

另据《科创板日报》,姜昱辰曾表示,Weaver 大模型专为创作而生,最大特点是 50B tokens 高质量中文内容进行预训练,再加上工程师不断调整,使得该大模型的写作内容更有「人味」。(@IT 之家)

 

4、微软亚研院前首席研究经理加入月之暗面

 

据晚点 Auto 独家报道,微软亚研院前首席研究经理谭旭,已经于 8 月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。

 

谭旭在离开微软研究院前担任首席研究经理,方向是生成式 AI、语音 / 音频 / 视频内容生成,论文引用量达上万次,他也曾担任 NeurIPS 等学术会议期刊的审稿人;其多项语言、语音、音乐、视频生成成果已应用在 Azure、Bing 等微软的产品与服务中。

 

报道指出,月之暗面的整个多模态研究在 2023 年 10 月就开始了。在受市场关注的视频生成大模型上,有接近月之暗面的人士称,月之暗面目前有十人左右的团队在研发视频模型,为确保产品更具差异性,对外发布计划仍在推迟。

 

谭旭加入月之暗面后,主要目标之一可能是帮月之暗面打造类似 GPT-4o 的语音体验。( @APPSO)

 

5、华为原生鸿蒙操作系统正式发布

 

 

 

我国首个国产移动操作系统——华为原生鸿蒙操作系统正式发布,这也是继苹果 iOS 和安卓系统后,全球第三大移动操作系统。

 

据介绍,此前已经发布过的鸿蒙系统,由于系统底座仍使用了部分 AOSP 开放源代码,而不得不兼容部分安卓应用软件。而此次发布的原生鸿蒙,实现了系统底座的全部自研,系统的流畅度、性能、安全特性等提升显著,也实现了国产操作系统的自主可控。(@腾讯科技)

02有态度的观点

1、AI 教父 Hinton:我很担心 AI 从人类手中夺过控制权;AI 智能终将超越人类

 

Hinton 在一次访谈中提到了自己对 AI 发展的担忧。「我一如既往对 AI 的发展表示担忧,但我很高兴看到世界开始认真对待这个问题...AI 会变得比人类更聪明。我们必须担心它们会想从我们手中夺取控制权,这是我们应该认真思考的问题。」Hinton 认为 AI 的智慧可能超越大多数人类,只是时间问题。有的专家认为掌控 AI 不是问题——我们设定目标,它们会服从我们,按我们说的做。也有其他专家认为它们绝对会夺取控制权。但 Hinton 认为谨慎一些是明智的。他个人认为 AI 有可能会夺取控制权,而且这个可能性比 1%大很多。

 

Hinton 提出,军事领域的 AI 应用应该受到国际共识制约。「使用 AI 制造自动化致命武器的风险并不取决于 AI 是否比我们聪明,这与 AI 本身可能失控并试图接管的风险是完全不同的。我对这两种情况都很担心...自动化武器显然会出现,至于人工智能是否会失控并试图接管它,我们可能能够控制也可能无法控制,我们对此一无所知。因此在它比我们更有掌控力之前,我们应该投入大量资源来研究我们是否能够控制它。」(@Z potentials)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

 

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/820760.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI网关对企业的意义及如何构建 AI 网关

随着大模型的发展,越来越多企业将生成性AI应用投入生产和业务当中,因而企业组织的系统应用也将面临前所未有的多重挑战,包括:如何遵循AI安全政策、如何理解用户行为,以及确保应用的可靠性和性能。AI网关旨在帮助企业应对AI调用的挑战及更多问题。AI网关充当组织内AI的中心…

API门户:API经济持续发展的增长引擎

在如今这个数字化迅速发展的时代,API门户正扮演着不可或缺的角色,成为推动API经济持续增长的重要引擎。随着API数量的急剧增加,企业能够更加方便地实现内部和外部系统之间的调用。以往企业需要从零开始开发每一个API,现在,API 门户为企业提供了一个集中化开放共享平台,企…

第一个Java spring boot demo运行

一、环境准备 1,下载JavaJDK需要安装两个 JDK 版本:1.8 / 17 安装 Zulu JDK(不能使用 Oracle JDK) JDK17:https://www.azul.com/downloads/?version=java-17-lts&os=macos&package=jdk#zuluJDK8:https://www.azul.com/downloads/?version=java-8-lts&os=ma…

Camera摄像头在 Windows 中不工作的解决方案

相机在 Windows 中不工作的解决方案1.安装摄像头驱动2.检查设备上的相机开关或按钮 某些笔记本电脑和便携设备具有可打开或关闭相机的物理开关或按钮。 关闭后,设备可能无法识别已安装相机,或可能导致相机显示带有斜杠的相机图像。 如果笔记本电脑具有开关或按钮,请确保其处…

64MHz - STM32WB06CCV6 STM32WB06CCV7 STM32WB06KCV6 STM32WB06KCV7无线MCU支持蓝牙 LE、Zigbee和Thread连接

STM32WB06 MCU基于运行频率为64MHz的Arm Cortex -M0+内核,具有高达256 Kb的闪存和32 Kb的RAM。STM32WB0x蓝牙 低功耗5.4 32位MCU采用紧凑、节能的设计,可实现可靠的无线性能。STM32WB06 MCU基于运行频率为64MHz的Arm Cortex -M0+内核,具有高达256 Kb的闪存和32 Kb的RAM。STM…

代码随想录算法训练营第22天|补第9天的KMP算法,28. 找出字符串中第一个匹配项的下标|459.重复的子字符串

前置知识文章链接:https://programmercarl.com/0028.实现strStr.html#思路KMP的经典思想就是:当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。 前缀表:next数组就是一个前缀表(prefix table)。前缀表是用来回退的,它记录了…

代码训练营第22天|补第9天的KMP算法,28. 找出字符串中第一个匹配项的下标|459.重复的子字符串

前置知识文章链接:https://programmercarl.com/0028.实现strStr.html#思路KMP的经典思想就是:当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。 前缀表:next数组就是一个前缀表(prefix table)。前缀表是用来回退的,它记录了…

中国大学mooc慕课视频课件课程下载工具,如何在电脑端下载中国大学mooc慕课视频课程课件资料到本地?

一. 安装中国大学mooc慕课课程下载器 1.获取学无止下载器 https://www.xuewuzhi.cn/icourse163_downloader 2.下载安装后,然后点击桌面快捷方式运行即可。 注意:杀毒软件可能会阻止外部exe文件运行,并将其当做成病毒,直接添加信任即可,本软件绝对没有木马病毒。 二. 使用…

【网课下载教程】网课视频下载攻略:让学习更高效

在当今互联网时代,在线学习已成为越来越多人的选择。有时,我们希望离线观看网课视频,以避免网络不稳定等问题。本文将为您提供一篇详细的网课视频下载教程,助您更高效地学习。 一、为什么下载网课视频?无需依赖网络:下载后的视频可以在没有网络的情况下观看,便于在交通工…

Mesh Renderer

网格渲染器 (Mesh Renderer) 网格渲染器从网格过滤器 (Mesh Filter) 获取几何体,然后在游戏对象的变换组件所定义的位置渲染该几何体。Materials Materials 部分列出了 Mesh Renderer 当前使用的所有材质。从3D建模软件导入的网格可以使用多种材质,而每个子网格使用列表中的一…

CIM+全场景应用,铸就智慧城市发展新篇

在数字化浪潮的推动下,智慧城市建设正成为全球城市发展的新趋势。而CIM(城市信息模型)作为智慧城市建设的核心,正以其强大的数据集成和分析能力,引领着城市发展的新篇章。今天,让我们一起探讨CIM+全场景应用如何助力智慧城市的建设。1. CIM的定义与重要性CIM是一种集成了…

【故障公告】数据库服务器 CPU 100% 造成全站故障

非常抱歉,今天下午 16:03~16:33 期间,我们使用的阿里云 RDS 实例(SQL Server2016 标准版,16核32G)出现 CPU 100% 问题,造成全站无法正常访问,由此给您带来很大的麻烦,请您谅解。 发现故障后,我们通过阿里云 RDS 控制台进行了主备切换,由于 CPU 被占太满,主备切换失败…