通用与垂直大模型之战:大模型驱动的商业智能变革之路

科技云报道原创。

是做通用大模型还是垂直大模型,这一个争论在“百模大战”的下讨论愈发热烈。

目前,以微软、谷歌、百度、阿里等为代表的发力于通用大模型的科技大厂,也都开始推动大模型在垂直领域的商业化落地。

比如说,微软和谷歌已将大模型技术融入操作系统、文档、搜索和邮件等产品中,展现了强大的实用价值。

垂直大模型则更为直接的深入特定行业和应用场景,如金融、医疗或零售等,相比于通用大模型,垂直大模型能够更精准地满足行业特定的需求。

说到底,无论是通用还是垂直大模型,其核心点还是落地场景和商业化。大模型重新定义了人工智能的边界和可能性,但更需要的是,在具体的商业环境中找到了新的生存空间和增长点。
在这里插入图片描述

在众多垂直领域中,大模型在智能商业BI领域落地尤为引人注目。作为商业决策的关键支撑工具,传统的BI在大数据时代已显得力不从心。

垂直大模型的加入,对话式BI的实现,则为BI带来了前所未有的可能性。

数据分析不再是特定专业人员的保留节目,通过对话式BI,企业每一位员工都可以通过自然语言与系统互动,得到更直观、更个性化的洞察。

从传统BI到对话式BI

第一个需要弄清楚的问题是,商业智能(BI)是什么?

商业智能(Business Intelligence,简称BI)是一套解决方案,通过分析、挖掘、整合和展示企业内外的大量非结构化数据,为决策者提供指导和支持。

具体来说,BI是一套完整的由数据仓库、查询报表、数据分析等组成的数据类技术解决方案,能够实现业务流程和业务数据的规范化、流程化、标准化,打通ERP、OA、CRM等不同业务信息系统,整合归纳企业数据。

BI可以帮助企业深入了解自身运营状况,监测业务流程,掌握市场动态,并基于数据分析来制定战略和战术。

比如BI可以制作满足不同部门、不同层级员工的数据可视化报表,可以帮助一线业务人员实现业务的追踪、预测、复盘等操作;也可以帮助企业高层管理人员,通过商业智能BI的管理驾驶舱、核心KPI指标、集团看板等.

然而,传统的BI系统常常复杂且难以使用,需要通过专业人员来操作和解读。这其中的时间延迟和技能门槛成为了效率和普及的障碍。

另外,数字化时代,无论产品研发、市场营销、财务管理还是客户服务,在经营各环节使用数据支撑决策已成为企业的日常,企业数据分析需求量大幅度上升。

同样,企业的管理者还是普通财务甚至是业务人员都需要利用BI来进行更高效的数据分析和决策。

对话式BI的出现,正是为了解决这些问题和需求。

与传统BI系统相比,对话式BI采用自然语言处理技术,允许用户通过自然语言询问,就像与人类分析师对话一样,从而获取所需信息。这一交互方式大大降低了使用门槛,提高了效率。

**普及性与便利性:**对话式BI不需要专业的技能和培训,让更多人员可以直接访问和利用企业的数据资源。

**实时性与灵活性:**对话式查询允许用户实时获取信息,快速响应临时或紧急需求,增强了企业的灵活性和响应能力。

**个性化与智能化:**通过智能大模型,对话式BI能够理解复杂的查询,并根据个人的需求和背景提供定制化的解答。

**集成与扩展能力:**对话式BI可以更容易地与其他系统集成,为企业提供更广泛的应用场景和扩展可能性。

对话式BI的崛起并不是偶然的现象,而是商业智能发展的必然趋势。它体现了现代企业对数据分析的迫切需求,以及对便捷、智能和高效工具的追求。

随着这一领域的不断创新和发展,对话式BI将成为未来企业决策支持的重要方向。

可信度挑战

虽然对话式BI提高了效率,但基于通用大模型的对话式BI,其答案的可信度却成了问题。

类ChatGPT产品并不能带来完全准确的回答,主要原因在于两点:首先,类ChatGPT产品更擅长处理自然语言文本数据相关任务,并非专门为数据分析而设计;其次,通用大模型可能存在捏造事实,也即“AI幻觉”。

一些产品可能存在所谓的“AI幻觉”。在BI领域可能是捏造字段,这在数据分析中可能成为致命问题。

为了解决这一问题,一些公司正在积极寻找解决方案。例如,网易数帆最近发布的有数ChatBI产品,就强调在需求理解、过程验证、用户干预和产品运营四个方面确保数据的可信。

网易数帆大数据产品线总经理余利华认为,AI幻觉的产生是由于训练数据不足、文本与表示之间的编解码错误等因素,可怕的是AI并不知道这是幻觉,单靠Prompt(提示)来纠正极为困难。

对此,网易数帆打造可信的有数ChatBI的核心点在于:需求可理解,过程可验证,用户可干预,产品可运营。
在这里插入图片描述

**需求可理解,**是指网易数帆为弥补用户认知和复杂工具之间的门槛,提升准确率,借助大模型的语言理解能力,先进行需求分析,这样即使是完全不懂BI的使用者也能通过需求分析内容判断系统的取数步骤是否正确。

**过程可验证,**即借助基于大模型的NL2SQL能力实现复核。为了提升NL2SQL能力,网易数帆有针对性地定制生成和优化了超过30万不同类型的问法和SQL。

余利华介绍,网易数帆调优出的NL2SQL领域模型,效果已达到GPT-3.5的水平。

**用户可干预,**即将数据模型和查询条件结构化,用户可干预可调整,切换数据模型或者查询条件。

**产品可运营,**即网易数帆为有数ChatBI产品构建了独特的运营反馈机制,用户可以反馈数据的准确性,管理员可运营知识库、标记及优化badcase,从而提升数据可靠性。

仅仅依靠分析领域具备GPT-3.5实力的NL2SQL模型,并不能保证对话式BI返回100%正确的结果,产品的设计对于落地显得尤为重要。

余利华表示,有数ChatBI实现可信的关键,是让用户在结果错误的时候能够认识到那是错的,并通过人工干预得到正确的结果。

在实际应用中,以大型连锁超市的销售部门场景为例,产品人员输入“我想看今年上半年华北地区每个月的利润”,有数ChatBI可给出相应结果,并用自然语言描述了查询的逻辑与步骤。

掌握SQL的专业人员可以点击“更多”按钮查看对应的SQL。如果逻辑有误,例如用户想看“订单日期”在上半年的数据,但是AI筛选的是“发货日期”,用户可点击“修改查询条件”进行对校正。

据网易数帆透露,目前,有数ChatBI在网易公司的应用,已经覆盖产品、运营、市场、财务等非技术人员。

寻找通用与垂直大模型的平衡点

回到开头通用和垂直大模型的讨论上。

这一次,有记者在网易数帆城市行媒体沟通环节将这个问题抛给了网易。

网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源对此表示:网易目前的实际情况是既做通用的大模型,也做垂直的大模型,这两者之间是支撑的关系,最终的出口是做垂类的模型,从企业服务市场的角度,应用在软件开发和数据分析这两个最关注的领域。

为了实现这一目标,网易团队构建了一个“公共底座”——网易“玉言”大模型。该模型由网易伏羲实验室和杭研的人工智能团队共同推动,后期还将加入更多业务团队共同打造网易集团的大模型底座。

这一次在BI产品上的探索同样做到了在通用和垂直大模型上寻找平衡点。结合通用和垂直模型将有助于提升对话式BI的准确性和适用性,打破了传统商业智能的局限,开启了新的可能。

在大模型掀起的新时代里,许多企业都站在了一个十字路口,开始寻找通用大模型与垂直行业大模型之间的平衡。

通用模型以其强大的语言理解能力为人们提供了广泛的应用前景,而针对特定行业或需求的垂直模型则能更精准地满足实际要求。

实际上,通用和垂直大模型并不是孤立的存在,它们之间的协同作用可能正是推动商业智能向更高层次发展的关键。

通过精准地结合两者的优势,企业不仅能满足现实需求,还能为未来创新铺设坚实的基础。

未来,这一平衡的探索将更多地体现在产品设计和技术创新中。

通用模型可能会继续拓展其在各个领域的应用,同时垂直模型将更加聚焦于某些关键行业,如金融、医疗和教育等。这两者的结合将为实现更智能、更人性化的交互和服务打开新的大门。

从长远看,通用与垂直大模型的协同可能将推动人工智能技术的下一个里程碑。

是否可以在维持通用性的同时,达到针对特定需求的最优解?这不仅是一个技术问题,也涉及到产业战略、商业模式和伦理考量。

随着更多企业和研究机构的共同努力,寻找通用和垂直大模型的平衡点将成为推动商业智能持续创新和高质量发展的关键。

这一过程将揭示人工智能如何真正融入我们的日常生活和工作,为人类带来前所未有的便利和机遇。

结语

对话式商业智能代表了BI领域的一个新方向,其自然的交互方式和快速的响应时间正在改变企业的数据分析方式。然而,随之而来的可信度挑战需要整个行业共同努力解决。

未来,通过更多的研发投入、跨企业合作以及对通用和垂直模型的深入研究,我们有望见到更加精确、可信和高效的对话式商业智能产品,推动整个商业分析领域向前发展。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/69898.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【TI-CCS笔记】工程编译配置 bin文件的编译和生成 各种架构的Post-build配置汇总

【TI-CCS笔记】工程编译配置 bin文件的编译和生成 各种架构的Post-build配置汇总 TI编译器分类 在CCS按照目录下 有个名为${CG_TOOL_ROOT}的目录 其下就是当前工程的编译器 存放目录为: C:\ti\ccs1240\ccs\tools\compiler按类型分为五种: ti-cgt-arm…

软件测试常用工具总结(测试管理、单元测试、接口测试、自动化测试、性能测试、负载测试等)

前言 在软件测试的过程中,多多少少都是会接触到一些测试工具,作为辅助测试用的,以提高测试工作的效率,使用好了测试工具,能对测试起到一个很好的作用,同时,有些公司,也会要求掌握一…

在Orangepi5开发板3588s使用opencv获取摄像头画面

先感谢香橙派群的管理员耐心指导,经过不断的调试修改最后成功通过opencv调用mipi摄像头获取画面 就记录分享一下大概步骤希望大家少踩点坑!!!!!! 我用的固件系统是ubuntu2022.0.4 固件是&#x…

实战项目:基于主从Reactor模型实现高并发服务器

项目完整代码仿mudou库one thread one loop式并发服务器实现: 仿muduo库One Thread One Loop式主从Reactor模型实现⾼并发服务器:通过模拟实现的⾼并发服务器组件,可以简洁快速的完成⼀个⾼性能的服务器搭建。并且,通过组件内提供的不同应⽤层…

生活随笔,记录我的日常点点滴滴.

前言 😘个人主页:曲终酣兴晚^R的小书屋🥱 😕作者介绍:一个莽莽撞撞的🐻 💖专栏介绍:日常生活&往事回忆 😶‍🌫️每日金句:被人暖一下就高热&…

Mariadb高可用MHA (四十二)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 目录 前言 一、概述 1.1 概念 1.2 组成 1.3 特点 1.4 工作原理 二、构建MHA 2.1 ssh免密登录 2.2 主从复制 2.3 MHA安装 2.3.1所有节点安装perl环境 2.3..2 node 2.3.…

Linux:shell脚本 正则表达式与AWK

一、正则表达式 由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符字面意义,而表示控制或通配的功能,类似于增强版的通配符功能,但与通配符不同,通配符功能是用来处理文件…

React+Typescript清理项目环境

上文 创建一个 ReactTypescript 项目 我们创建出了一个 React配合Ts开发的项目环境 那么 本文 我们先将环境清理感觉 方便后续开发 我们先来聊一下React的一个目录结构 跟我们之前开发的React项目还是有一些区别 public 主要是存放一些静态资源文件 例如 html 图片 icon之类的 …

Spark第二课RDD的详解

1.前言 RDD JAVA中的IO 1.小知识点穿插 1. 装饰者设计模式 装饰者设计模式:本身功能不变,扩展功能. 举例: 数据流的读取 一层一层的包装,进而将功能进行进一步的扩展 2.sleep和wait的区别 本质区别是字体不一样,sleep斜体,wait正常 斜体是静态方法…

【网络架构】华为hw交换机网络高可用网络架构拓扑图以及配置

一、网络拓扑 1.网络架构 核心层:接入网络----路由器 汇聚层:vlan间通信 创建vlan ---什么是vlan:虚拟局域网,在大型平面网络中,为了实现广播控制引入了vlan,可以根据功能或者部门等创建vlan,再把相关的端口加入到vlan.为了实现不用交换机上的相同vlan通信,需要配置中继,为了…

Vue中拖动排序功能,引入SortableJs,前端拖动排序。

背景: 作为一名前端开发人员,在工作中难免会遇到拖拽功能,分享一个github上一个不错的拖拽js库,能满足我们在项目开发中的需要,支持Vue和React,下面是我在vue后台项目中中使用SortableJS的使用详细流程&am…

小数据 vs 大数据:为AI另辟蹊径的可操作数据

在人工智能背景下,您可能已听说过“大数据”这一流行语,那“小数据”这一词呢,您有听说过吗?无论您听过与否,小数据都无处不在:线上购物体验、航空公司推荐、天气预报等均依托小数据。小数据即一种采用可访…