做好“关键基础设施提供商”角色,亚马逊云科技加快生成式AI落地

一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式AI每年可能为全球经济增加2.6万亿到4.4万亿美元的价值。在几天前的亚马逊云科技纽约峰会中,「生成式AI」同样是全场提及频率最高的关键词。

「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」

一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式AI每年可能为全球经济增加2.6万亿到4.4万亿美元的价值。在几天前的亚马逊云科技纽约峰会中,「生成式AI」同样是全场提及频率最高的关键词。

「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」

206ccfb5938647bd9266dbfd7fe1c3b1.png

 

凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的AI能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式AI新功能。

 

最强的生成式AI大模型,在这里轻松调用

今年4月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。

 

从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。Amazon Bedrock的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的AI算力和工具,再结合自己的数据开始构建生成式AI应用。

在最新扩展后的Amazon Bedrock中,汇聚了来自一批顶级大模型供应商的最新成果:

 

目前,Amazon Bedrock提供了Anthropic最新语言模型Claude 2、AI21的JURASSIC-2、亚马逊自研的Amazon Titan系列模型的访问。Stability AI也在Amazon Bedrock中首发了最新版的文生图模型套件Stable Diffusion XL 1.0。此外,Cohere成为了最新加入Amazon Bedrock的基础模型供应商,并带来了文本生成模型Command和文本理解模型EMBED。

相比于其他的一站式的大模型服务平台,Amazon Bedrock的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在Amazon S3对象存储服务中的数据,并能够从亚马逊云科技访问控制和治理策略中受益。

生成式AI让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同Amazon Bedrock这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式AI,撬动了一个全新的蓝海市场。

 

推动生成式AI走完落地的「最后一公里」

在今天,即使生成式AI模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。这恰恰是「生成式AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决:模型通常可以附加API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如ChatGPT此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。为了简化这一环节所需的工作,亚马逊云科技正式推出了Amazon Bedrock Agents。

 

Amazon Bedrock Agents可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的Agents:

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式AI应用程序,推动解决生成式AI落地的「最后一公里」问题。比如,企业可以使用Amazon Bedrock Agents创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。

如果做个比喻的话,Amazon Bedrock Agents就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。

 

生成式AI时代的搜索技术变革

在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式AI时代正在发生的变革。

首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。

其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。

 

对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括Amazon Aurora PostgreSQL兼容版关系型数据库,兼容PostgreSQL的Amazon RDS(Amazon Relational Database Service)关系型数据库等。

在这一次的峰会上,亚马逊云科技又推出了适用于Amazon OpenSearch Serverless的向量引擎。该向量引擎支持简单的API调用,可用于存储和查询数十亿个Embeddings。

 

该引擎由Amazon OpenSearch项目中的k最近邻(kNN)搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。

 

让生成式AI落地多重加速

在这些重磅发布之外,为了加速生成式AI的训练和应用,亚马逊云科技已推出了一系列服务和工具。

最新动态是,两项关键服务已正式可用:其中一项服务是关于计算基础设施,基于英伟达H100 Tensor Core GPU的Amazon EC2 P5实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。

 

很多业界知名的生成式AI模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式AI落地速度的因素之一。

与上一代基于GPU的实例相比,Amazon EC2 P5实例使得训练最高提速6倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达40%的训练成本。

另外一项服务是有关于开发工具。去年,亚马逊云科技推出了AI编程助手Amazon CodeWhisperer预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快57%。现在,Amazon CodeWhisperer已经正式可用,并且实现了与Amazon Glue的集成。

从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhispere会直接在Amazon Glue Notebooks中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。

 

 

写在最后

技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。

在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去20年在人工智能技术上的深厚积累,在于对于超过10万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式AI落地的征程,帮助到每一位开发者或创业团队。

凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的AI能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式AI新功能。

 

最强的生成式AI大模型,在这里轻松调用

今年4月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。

 

从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。Amazon Bedrock的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的AI算力和工具,再结合自己的数据开始构建生成式AI应用。

在最新扩展后的Amazon Bedrock中,汇聚了来自一批顶级大模型供应商的最新成果:

 

目前,Amazon Bedrock提供了Anthropic最新语言模型Claude 2、AI21的JURASSIC-2、亚马逊自研的Amazon Titan系列模型的访问。Stability AI也在Amazon Bedrock中首发了最新版的文生图模型套件Stable Diffusion XL 1.0。此外,Cohere成为了最新加入Amazon Bedrock的基础模型供应商,并带来了文本生成模型Command和文本理解模型EMBED。

相比于其他的一站式的大模型服务平台,Amazon Bedrock的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在Amazon S3对象存储服务中的数据,并能够从亚马逊云科技访问控制和治理策略中受益。

生成式AI让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同Amazon Bedrock这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式AI,撬动了一个全新的蓝海市场。

 

推动生成式AI走完落地的「最后一公里」

在今天,即使生成式AI模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。这恰恰是「生成式AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决:模型通常可以附加API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如ChatGPT此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。为了简化这一环节所需的工作,亚马逊云科技正式推出了Amazon Bedrock Agents。

 

Amazon Bedrock Agents可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的Agents:

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式AI应用程序,推动解决生成式AI落地的「最后一公里」问题。比如,企业可以使用Amazon Bedrock Agents创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。

如果做个比喻的话,Amazon Bedrock Agents就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。

 

生成式AI时代的搜索技术变革

在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式AI时代正在发生的变革。

首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。

其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。

 

对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括Amazon Aurora PostgreSQL兼容版关系型数据库,兼容PostgreSQL的Amazon RDS(Amazon Relational Database Service)关系型数据库等。

在这一次的峰会上,亚马逊云科技又推出了适用于Amazon OpenSearch Serverless的向量引擎。该向量引擎支持简单的API调用,可用于存储和查询数十亿个Embeddings。

 

该引擎由Amazon OpenSearch项目中的k最近邻(kNN)搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。

 

让生成式AI落地多重加速

在这些重磅发布之外,为了加速生成式AI的训练和应用,亚马逊云科技已推出了一系列服务和工具。

最新动态是,两项关键服务已正式可用:其中一项服务是关于计算基础设施,基于英伟达H100 Tensor Core GPU的Amazon EC2 P5实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。

 

很多业界知名的生成式AI模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式AI落地速度的因素之一。

与上一代基于GPU的实例相比,Amazon EC2 P5实例使得训练最高提速6倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达40%的训练成本。

另外一项服务是有关于开发工具。去年,亚马逊云科技推出了AI编程助手Amazon CodeWhisperer预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快57%。现在,Amazon CodeWhisperer已经正式可用,并且实现了与Amazon Glue的集成。

从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhispere会直接在Amazon Glue Notebooks中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。

 

 

写在最后

技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。

在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去20年在人工智能技术上的深厚积累,在于对于超过10万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式AI落地的征程,帮助到每一位开发者或创业团队。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/61974.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SQL SERVER ip地址改别名

SQL server在使用链接服务器时必须使用别名,使用ip地址就会把192.188.0.2这种点也解析出来 解决方案: 1、物理机ip 192.168.0.66 虚拟机ip 192.168.0.115 2、在虚拟机上找到 C:\Windows\System32\drivers\etc 下的 (我选中的文件&a…

2023年京东按摩仪行业数据分析(京东销售数据分析)

近年来,小家电行业凭借功能与颜值,取代黑电和白电,成为家电市场的主要增长点。在这一市场背景下,颜值更高、功能更丰富、品种更齐全的各类按摩仪,借助新消费和电子商务的风潮,陆续被推上市场。今年&#xf…

技术干货 | 图文结合带你了解电商API

电商API是什么? 电子商务(E-commerce)API是一种应用程序接口(Application Programming Interface),用于不同电商平台之间的数据交互和通信。通过电商API,开发者可以利用已有的电商平台功能和数…

TCP和UDP

目录 TCP和UDP是什么? TCP和UDP有什么区别? 三次握手和四次挥手 解决大量TIME_WAIT问题的核心方法 TCP维护可靠的通信方式 TCP协议的长连接和短连接 长连接的保活机制 Syn泛洪攻击 拥塞控制 滑动窗口的原理 什么是粘包以及粘包的原因 粘包的处理方式 …

【看表情包学Linux】初识文件描述符 | 虚拟文件系统 (VFS) 初探 | 系统传递标记位 | O_TRUNC | O_APPEND

爆笑教程《看表情包学Linux》👈 猛戳订阅!​​​​​ 💭 写在前面:通过上一章节的讲解,想必大家已对文件系统基本的接口有一个简单的了解,本章我们将继续深入讲解,继续学习系统传递标志位&…

MySQL之 show profile 相关总结

MySQL之 show profile 相关总结 MySQL官网show profile介绍:https://dev.mysql.com/doc/refman/8.0/en/show-profile.html 1. 简介 show profile 和 show profiles 命令用于展示SQL语句的资源使用情况,包括CPU的使用,CPU上下文切换&#xf…

【STM32RT-Thread零基础入门】 2. 新建RT-Thread项目

硬件:STM32F103ZET6、ST-LINK、usb转串口工具 文章目录 前言一、新建RT-Thread项目二、项目结构三、构建项目四、下载程序(调试器下载)五、终端交互总结 前言 RT-Thread的全称是Real Time Thread,顾名思义,它是一个嵌…

HCIP STP(生成树)

目录 一、STP概述 二、生成树协议原理 三、802.1D生成树 四、STP的配置BPDU 1、配置BPDU的报文格式 2、配置BPDU的工作过程 3、TCN BPDU 4、TCN BPDU的工作过程 五、STP角色选举 1、根网桥选举 2、根端口选举 3、指定端口选举 4、非指定端口选举 六、STP的接口状…

【学习FreeRTOS】第2章——FreeRTOS基础知识

1.任务调度 1.1.任务调度简介 调度器就是使用相关的调度算法来决定当前需要执行的哪个任务FreeRTOS 一共支持三种任务调度方式: 抢占式调度:针对优先级不同的任务,每个任务都有一个优先级,优先级高的任务可以抢占优先级低的任务…

vue3 table动态合并,自定义参数合并单元格

<template><div><el-table :data"tableData" :span-method"objectSpanMethod" border:header-cell-style"{ textAlign: center}"><el-table-column prop"area" label"区域" align"center"&g…

Python AI 绘画

Python AI 绘画 本文我们将为大家介绍如何基于一些开源的库来搭建一套自己的 AI 作图工具。 需要使用的开源库为 Stable Diffusion web UI&#xff0c;它是基于 Gradio 库的 Stable Diffusion 浏览器界面 Stable Diffusion web UI GitHub 地址&#xff1a;GitHub - AUTOMATI…

阿里云轻量应用服务器_2核2G3M_108元/年_性能测评

阿里云轻量应用服务器2核2G3M带宽108元一年&#xff0c;系统盘为50GB高效云盘&#xff1b;轻量服务器2核4G4M带宽&#xff0c;60GB高效云盘297.98元12个月。目前轻量应用服务器只有2核2G和2核4G有活动&#xff0c;阿里云百科分享阿里云轻量应用服务器入口&#xff1a; 目录 阿…