AI 业务应用经验:以零一万物的万知 AI 创作为例

作者:明明如月学长, CSDN 博客专家,大厂高级 Java 工程师,《性能优化方法论》作者、《解锁大厂思维:剖析《阿里巴巴Java开发手册》》、《再学经典:《Effective Java》独家解析》专栏作者。

热门文章推荐

  • (1)《为什么很多人工作 3 年 却只有 1 年经验?》
  • (2)《一文掌握大模型提示词技巧:从战略到战术巧》
  • (3)《AI 时代,程序员的出路在何方?》
  • (4)《如何写出高质量的文章:从战略到战术》
  • (5)《我的技术学习方法论》
  • (6)《我的性能方法论》
  • (7)《AI 时代的学习方式: 和文档对话》

概括:
在这里插入图片描述

一、背景

最近很长一段时间,工作中在探索如何将大模型更好地运用在业务上。

在这里插入图片描述

最近看到了零一万物的“万知” 这款产品,发现和目前自己对 AI 应用到业务上的一些想法比较类似。
所以打算以万知为例,简单谈谈自己的理解,希望对大家在日常大模型落地能够带来一点启发。

二、一些浅显的看法

现在新闻上 AI 被吹的神乎其神,几乎无所不能,程序员马上要被取代。然而,实践中受限于模型能力和自然语言的局限性,当前 AI 落地问题众多。
在这里插入图片描述

2.1 模型能力问题

(1) 问题复杂度和模型能力之间的矛盾

相对简单的任务可以做的挺好,但是复杂的任务就会有各种问题。
在实践中我们通常需要将任务拆分成目前 AI 可以相对完成得很好的粒度,然后通过工程化方式串联起来。

(2)上下文长度、幻觉和用户体验之间的矛盾

我们需要给 AI 充分的上下文它才能做的更符合你的意图,才能将任务做的更好。然而,现在模型的上下文长度是有限制的,当提示词过长时,模型的注意力机制会导致中间的部分信息被“忽略”,模型也可能出现幻觉,导致效果并不理想。

比如我们想通过 AI 来生成代码,如果我们只给 AI 当前的类的代码,代码生成效果也一般,如果能够给出该类中引入的所有相关类,甚至整个仓库的代码信息,那么代码补全效果通常会更好。
比如我们想通过 AI 来生成 SQL ,我们如果直接通过用户描述生成 SQL 效果往往不太理想,我们可以将用户描述转为知识,知识中包括业务含义和表信息,用户对知识进行确认,然后再生成 SQL 效果会好很多。

实践中,可能会使用 RAG 技术,处理之前只将最相关的信息传给模型(需要对信息进行筛选,甚至重新排序等)或者对输入信息进行概括总结,降低上下文的长度。

大模型应用中可能会出现幻觉,现在的生成还是根据 “概率” 来的,有可能会出现“发挥失常”的情况。通常可以提供更充分的信息,提供重试甚至同时提供多个候选版本等方式降低模型发挥失常的影响。

2.2 自然语言之殇

虽然现在我们可以像和其他人沟通一样,通过自然语言和大模型进行沟通。但是,自然语言也具有局限。

自然语言的准确性:每个人的表达能力不同。有些人表达能力不好,容易提出误导大模型的一些描述。很多人在说话的时候可能自己也根本没想清楚。很多时候用户也许根本不知道自己想要什么,只有看到了效果,才知道这不是自己想要的。
自然语言的完整性: 实际生活中有些人会表述不完整,甚至自以为表述完整但缺乏隐含的知识**。 比如有个人自己创了一个概念,叫 XX 指标,如果不能够将这个概念解释给大模型,大模型只能靠猜测,很难给出准确的答案。比如不同公司的输入 “请帮我写一段公司缓存框架的示例代码”同样的提示词,想要的内容是不一样的。
自然语言的局限性: 自然语言很难精准描述复杂的事件。比如某人想要用大模型从心理学角度去分析相亲对象的行为。此时,她可能需要提供从见面开始,相亲对象的每一句话和每个表情变化,语气的变化,单纯使用自然语言来描述是非常困难的。

三、万知 AI 创作分析

基于模型的能力限制(如无法通过单轮对话解决复杂问题,上下文长度有限制,多轮对话容易丢失上下文等)和自然语言的局限性(如用户可能没想清楚,可能提供的信息不全,可能很难精准描述复杂的事情等),目前在工程落地中可以采用: 步骤拆解 + 工程编排 + 模型生成相结合的方式。
在这里插入图片描述

为了避免生成的内容不符合用户预期,万知将任务拆分成多个步骤:
第一步:基本信息填写,包括页数、字数、受众、场景、图片来源、参考文档和幻灯片主题
第二步:幻灯片大纲的生成
第三步:幻灯片的生成

在主要任务执行之前让知识显性化,而且尽可能详尽,让用户在模型执行主要任务之前进行确认、调整(删减、补充等)。

Xnip2024-04-14_23-07-13.png
如万知通过了通过自然语言创建演示文档的功能,此时将关键的信息然用户做选择而不是输入,并将最常见的情况默认选项,避免用户输入时没有考虑到页数、字数、受众、场景等关键信息。

Xnip2024-04-14_23-07-37.png

为了确保信息尽可能完整,万知也提供通过附件的方式上传相关文档
Xnip2024-04-14_23-10-35.png
AI 可能会误解用户的意图,此时需要人工来调整。比如这篇文章的开头有我的主要作品介绍,其中提到 “性能优化方法论”,AI 会将性能优化作为这个 PPT 的主题,显然不对,此时需要手动进行修改。
Xnip2024-04-14_23-11-15.png
AI 生成大大纲也可能有问题,万知也允许我们对大纲内容进行修改和确认,如果对大纲不满意可以生成大纲。
大纲确认无误后,可以生成幻灯片,当然幻灯片不满意也可以重新生成和下载二次修改。
image.png

通过步骤拆解,一方面让用户输入更完整和准确,一方面降低交给大模型任务的难度。为了应对 AI 发挥失常的情况,也提供了重试功能。

虽然,我对 AI 生成的 PPT 并不满意,但是万知的 AI 创作理念确实值得学习。

四、总结

当前在 AI 落地时,可以借鉴万知 AI 创作 PPT 的设计理念。如将复杂任务拆分成多个步骤,让用户的输入成本降低,输入的准确性和全面性更好,让用户可以及时对中间过程进行干预避免产出不符合预期的结果。任务的拆解降低了AI 的难度,同时通过用户的纠正和确认,让 AI 更好地理解用户意图,同时通过通过重试机制降低AI “发挥失误” 带来的影响。

大家在实践中可以将更多先进的设计理念融合进来,进一步优化,让 AI 不只是“噱头”,而是真正能够服务好业务发展的“发动机”。

相信随着模型能力的不断增强,更多 Agent 设计模式得到应用,上面的很多问题将会得到解决。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/623755.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis集群机制及一个Redis架构演进实例

Replication(主从复制) Redis的replication机制允许slave从master那里通过网络传输拷贝到完整的数据备份,从而达到主从机制。为了实现主从复制,我们准备三个redis服务,依次命名为master,slave1&#xff0c…

win10 64位装三菱PLC软件出现oleaut32.dll拒绝访问

win10 64位装 三菱PLC软件GX works2出现以下情况:以下文件没有自注册或撤消注册 c:/Windows/SysWOW64/oleaut32.dll拒绝访问 经过百度说是兼容问题 解决方案:在安装包启动图标上右键-兼容性疑难解答-尝试建议的设置-测试程序。 点击测试程序后setup正常…

国产高性能DSP音频处理芯片 AI算法智能消原音 PTN1118方案

PTN1118植入帕特纳微AI(SVS),实现将任意音源中人声部分消除,并在极大程度上保留伴奏,配合PTN 卡拉OK系列芯片,使传统音频设备更富娱乐性。 支持模拟与数字输入输出,数字接口支持从模式 人声消除…

视频太大怎么压缩变小?8种方法随时压缩视频大小

视频太大怎么压缩变小?视频压缩方式分为两种,有损压缩和无损压缩,什么是有损什么是无损压缩,什么时候视频用无损压缩更好?什么时候用有损压缩更好?如何调整视频参数实现基本无损压缩? 今天就借助…

市面上加密混淆软件的比较和推荐

引言 市面上有许多加密混淆软件可供开发者使用,但哪些软件是最好用的?哪些软件受到开发者的喜爱?本文将根据一次在CSDN上的投票结果,为大家介绍几款在程序员中普及度较高的加密软件。以下是投票结果,希望能对大家的选择…

中东跨境电商平台Noon注册开店步骤详解

中东地区,素以“满地富豪”闻名,同时拥有发达的电子商务环境与较高的居民消费水平,吸引了大量跨境电商从业者前来寻求商机。其中,Noon作为中东地区颇具人气的电商平台,自然而然成为了众多卖家开拓中东市场的首选平台。…

【k8s】:深入理解 Kubernetes 中的污点(Taints)与容忍度(Tolerations)

【k8s】:深入理解 Kubernetes 中的污点(Taints)与容忍度(Tolerations) 1、污点(Taints)2、容忍度(Tolerations)3、示例演示-测试污点的具体应用场景3.1 给节点打污点&…

《剑指 Offer》专项突破版 - 面试题 107 : 矩阵中的距离(C++ 实现)

题目链接:矩阵中的距离 题目: 输入一个由 0、1 组成的矩阵 M,请输出一个大小相同的矩阵 D,矩阵 D 中的每个格子是矩阵 M 中对应格子离最近的 0 的距离。水平或竖直方向相邻的两个格子的距离为 1。假设矩阵 M 中至少有一个 0。 …

Redis-缓存击穿-逻辑过期

Redis-缓存击穿-逻辑过期实现 缓存击穿:也称热点key问题,大量访问一个key,而这个key恰巧到期了,导致大量的请求访问数据库。增大数据库的负担。为了解决这个问题可以采用互斥锁或逻辑过期的方式解决。本章采用逻辑过期的方式解决…

React 组件生命周期对比:Class vs. 函数式

在 React 中,Class 组件和函数式组件的生命周期存在一些差异。通过对 React 中 Class 组件和函数式组件的生命周期进行对比,详细探讨了它们在设计哲学、生命周期管理和开发技巧上的异同。全面了解 React 中两种组件类型的生命周期特点,以及如…

比肩世界一流的车企,长安汽车的这些做法也太超前了!

2023年12月,法大大发布了中国首部《汽车行业合同数智化白皮书》(点击阅读及下载:中国首部!《汽车行业合同数智化白皮书》重磅发布 | 附下载)。该白皮书基于法大大自身参与汽车行业合同数智化建设的实践和思考&#xff…

量子飞跃:从根本上改变复杂问题的解决方式

内容来源:量子前哨(ID:Qforepost) 编辑丨王珩 编译/排版丨沛贤 深度好文:1000字丨5分钟阅读 利用多功能量子比特的量子计算机已处于解决复杂优化问题的最前沿,例如旅行商问题,这是一个典型的…