大模型如何为我所用?
这是当下B端众多企业都在深入思考的一个问题。今年以来,大模型在办公、对话、搜索等领域所展现出的强大能力,让越来越多B端企业意识到大模型对于业务的巨大价值。
因此,领域认知智能迅速成为B端企业关注的焦点,甚至各个大厂纷纷为之推出各种垂直领域的大模型。但大模型本身尚处于发展的早期阶段,在垂直行业的落地依然面临不小挑战,首当其冲的就是领域数据与大模型如何有效融合、训练等挑战。
“领域认知智能是 AGI 时代面向特定技术或行业领域,基于领域数据对大模型进行预训练或调优,并利用知识工程将私域数据加工成领域知识网络,通过两种技术融合实现机器对特定领域的理解、推理、归纳等认知能力。”爱数总裁贺鸿富直言道。
归根结底,领域认知智能的发展与落地将决定着人工智能未来普及的广度和深度。
走向领域深度,用户准备好了吗
对于金融、教育、医疗、制造等B端企业而言,关心的不是大模型如何写诗作画,而是业务场景带来生产力的提升。
B端企业通常具有丰富的场景、领域数据量巨大,有利于大模型能力的发挥;与此同时,又对降本增效需求强烈,且极为看重领域数据的安全性。因此,领域认知智能的建设与面向C端的大模型应用有着本质区别。
在爱数产品副总裁李基亮看来,大模型走向垂直领域是大势所趋,领域认知智能的落地主要面临着两大挑战:一是大模型在面向特定领域落地时面临的生成内容幻觉、不及时和不可解释性等问题;另一个则是大模型在垂直领域带来的安全性以及成本等方面的担忧。
领域认知智能需要解决的首要问题就是数据问题。众所周知,数据决定人工智能发展的天花板,在领域认知智能尤甚。OpenAI CEO Sam Altman今年指出,大规模、高质量的数据,以及数据高效处理、调优的工程化是大模型能力得以展现和提升的关键。
例如,在领域任务中,大模型需要遵循特定领域的规范、制度、流程和知识进行回答。如果不进行适当的调优,大模型往往会抛开给定的文档或信息,倾向于利用已习得的通用知识进行自由发挥。
另一个不容忽视的显示情况就是,B端企业自身积累了大量的领域数据,对安全极其敏感且价值巨大,这就决定着B端企业在领域认知智能的建设中倾向于本地化部署模式。
不过,本地化部署也不可避免会带来成本、复杂性等挑战。例如,垂直类大模型普遍具有多领域数据(多技术、主业与关联行业的多行业)、多场景分析(运营管理、市场营销、产品技术、服务支持等)等特点,场景推理分析复杂、应用整合复杂,且开发整合成本高。
针对领域认知智能落地面临的各种挑战,爱数的思路是将大模型与数据治理、内容管理、数据资产化等技术进行高效结合,降低大模型在实际垂直领域的落地门槛,最终实现帮助B端企业构建起领域认知智能。这其中,爱数认知智能框架AnyDATA Framworks 3又是关键一环。
如何才能高效用好大模型
在中国人工智能市场,最不缺的就是各种大模型。
相关数据显示,中国市场的大模型数量已经突破200个,各类大模型琳琅满目、鱼龙混杂,一定程度也给B端企业造成选择困难,加上部署、训练、开发的复杂性和成本挑战,B端企业对于大模型的心态往往是“想用却不敢用”。
爱数认知智能框架AnyDATA Framework 3的出现,恰到好处地打消了B端企业对于大模型的种种顾虑。
作为一个中立的认知智能框架平台,AnyDATA Framework 3做到大模型的中立,给予B端企业的选择权;同时,屏蔽了大模型接入、知识网络构建与应用开发的复杂性,且兼容目前市场上各类主流大模型,降低大模型的使用门槛,为B端企业提供各类大模型的认知应用开发能力。
“AnyDATA Framework 3是采用私域部署的一站式认知智能框架平台,实现大模型在各种垂直领域的增强与优化,B端企业利用模型工厂、知识网络工作台、认知应用工作台可以快速、高效、合规地实现认知应用的开发。”李基亮介绍道。
例如,针对大模型通过简单类比得出错误答案的“幻觉”问题,AnyDATA Framework 3关键技术检索增强生成模式(RAG模式)在大模型推理生成时,使用私域数据/领域知识库进行检索召回,解决大模型“幻觉”问题,实现生成内容的可解释性,且无需额外训练,不同大模型均可使用,可以充分发挥大模型的推理能力和创造能力。
就像人才培养,首先从通识教育的基础能力培养开始,之后再侧重专业知识的高等教育。B端企业的领域认知智能落地过程也是类似,大模型在AGI时代提供了强大的基础能力,进入到垂直领域必然需要领域数据、知识做支撑,而爱数AnyDATA Framework 3则犹如架起一座桥梁,帮助大模型在B端企业实现从基础到专业的进阶。
事实上,除了AnyDATA Framework 3,爱数近年来持续探索的大数据基础设施战略,开始在AGI时代绽放出巨大的价值。
Data+AI,大数据基础设施开新局
今年起,B端企业在领域认知智能的探索与实践中,愈发意识到基础设施层所起到的关键作用与核心价值。
作为一直深耕在大数据基础设施领域的厂商,爱数也紧跟时代步伐,持续投入领域认知智能的创新,与时俱进的提出了“Data+AI”战略,基于“Data+AI”对各大产品进行全面智能化升级。
之所以会如此,是因为像爱数这种聚焦大数据基础设施创新的企业,在常年与各类数据打交道过程中,深刻洞察到数据要素对于B端企业的巨大价值,以及B端企业对于释放数据生产力的迫切性;另外,数据基础设施领域又是大模型最有希望率先实现落地的领域之一,爱数积极拥抱领域认知智能、大模型,对各大产品全面智能化升级,有利于为B端企业在AGI时代的数据管理、数据消费、使用交互等方面将带来深远影响。
首先,爱数已形成AnyBackup、AnyShare、AnyRobot、AnyDATA和AnyFabric五大产品线,可以帮助B端企业构建起全域数据能力,实现全域数据资产管理和运营创新,满足在云端、本地等多种环境下任何数据类型的各种数据服务需求。例如,爱数今年正式推出的AnyBackup Family 8、AnyShare 领域大模型一体机、AnyShare认知助手等一系列新品。
其次,爱数的五大产品并不是简单的产品堆砌,而是深度集成与融合。凭借ONE架构,爱数五大产品的技术堆栈实现统一,各大产品之间深度集成,可以带来全域数据的自由流动,以及为全域数据能力实现一致的用户体验和融合管理。
以AnyDATA为例,它除了帮助B端将大模型更安全、更经济地落地行业应用场景,还与AnyBackup、AnyShare、AnyRobot、AnyFabric等产品紧密集成,利用领域认知智能和大模型提升AnyBackup等产品的智能化水平。像基于领域认知智能的AnyShare认知助手,提供创新的智能搜索、智能问答、辅助创作、辅助阅读等认知能力,真正帮助B端企业实现内容管理“智能化”,进一步释放数据内容的价值。
另外,爱数深知领域认知智能的落地是一条长期之路,仅仅依靠爱数一家公司的产品与能力是远远不够的。为此,爱数推出“数字伙伴计划”,该计划旨在将客户的业务场景、行业知识与爱数五大产品结合,形成面向行业的数据服务解决方案,实现以数据驱动业务、增强数字化韧性,共创数据驱动型组织。
“爱数的愿景是希望以数据重塑生产力,共创智能世界。”爱数总裁贺鸿富最后表示道。