【解决复杂链式任务,打造全能助手】LangChain 大模型 打造 钢铁侠的全能助理 Jarvis

LangChain 大模型 结合 做 AutoGPT、ChatPDF

    • 思维链 CoT
    • LangChain
      • 模型IO:和大模型交互、提示词模版
      • 数据连接:从数据的接入、分割,到向量的构建、存储、搜索
      • 链:串联和组织,多个语言模型、组件
      • 记忆:灵魂伴侣,最熟悉你的机器
      • 代理:软件不会用怎么办?退下,我来!!
      • 回调:语义表达清,调试更精准
    • LangChain 大模型结合 打造 钢铁侠的全能助理 Jarvis
      • 打造AutoGPT:突破文本限制,从语言理解到任务执行,AI分析、AI执行、AI调整、AI验证,去招聘网站招揽、,照顾饮食起居订餐订飞机票、寻找新的挣钱机会,以六千万分之一秒的速度分析信息
      • 打造ChatPDF:回归学习本质,跳过所有的繁文缛节、场面话,根据你的理解提问,给你提供最直接的反馈,你听不懂还可以要求举例子、可视化、按流程顺序拆解

 


思维链 CoT

最初的语言模型都是基于经验的,只能根据词汇之间的相关性输出答案,根本没有思考能力……

但是从使用思维链后,大模型已经是有思考能力的。能进行一定的推理。

2021年,OpenAI在训练神经网络过程中有一个意外发现。

神经网络他可以很好地模仿现有的数据,很少犯错误。

可是如果你给他出个没练过的题目,他还是说不好。于是你就让他继续练。

继续训练好像没什么意义,因为现在只要是模仿他就都能说得很好,只要是真的即兴发挥他就不会。

但你不为所动,还是让他练。


1 0 2 10^2 102 1 0 5 10^5 105 训练完全没有成果。

就这样练啊练,惊奇地发现,他会即兴演讲了!给他一个什么题目,他都能现编现讲,发挥得很好!

  • 一千步乃至一万步,模型对训练题的表现已经非常好了,但是对生成性题目几乎没有能力
  • 练到10万步,模型做训练题的成绩已经很完美,对生成性题也开始有表现了
  • 练到100万步,模型对生成性题目居然达到了接近100%的精确度

这就是量变产生质变。研究者把这个现象称为「开悟(Grokking)」。

2022年8月,谷歌大脑研究者发布一篇论文,专门讲了大型语言模型的一些涌现能力,包括少样本学习、突然学会做加减法、突然之间能做大规模、多任务的语言理解、学会分类等等……

而这些能力只有当模型参数超过1000亿才会出现 —— 涌现新能力的关键机制,叫 思维链

思维链就是当模型听到一个东西之后,它会嘟嘟囔囔自说自话地,把它知道的有关这个东西的各种事情一个个说出来。

思维链是如何让语言模型有了思考能力的呢?

比如你让模型描写一下“夏天”,它会说:“夏天是个阳光明媚的季节,人们可以去海滩游泳,可以在户外野餐……”等等。

只要思考过程可以用语言描写,语言模型就有这个思考能力。

怎么用思维链呢?

思维链的主要思想是通过向大语言模型展示一些少量的样例,在样例中解释推理过程。

那大语言模型在回答提示时也会显示推理过程,这种推理的解释往往会引导出更准确的结果。

既然如此,只要我们设置好让模型每次都先思考一番再回答问题,ta就能自动使用思维链,ta就有了思考能力。

CoT(链式思考)已被证实能够改善大型AI模型在算术、常识和符号推理等任务上的表现。

用户发现,当他们在问题中添加“让我们一步步来思考”时,模型仿佛被施了魔法,之前答错的数学题突然能够正确解答,原本无理的论述变得有条有理。

不过,CoT对模型性能的提升与模型的大小成正比关系,模型参数至少达到100亿才有效果,达到1000亿效果才明显。

 


LangChain

如果直接用大模型的API去做产品,会遇到很多限制:

  • 输入限制 — 最大token 可能只能输入 3000 字
  • 私有化 — 数据是公司机密,必须私有化
  • 大模型只有微调的知识 — 不能联网获取最新知识,专业领域就不准确
  • 没办法查询数据库 — 只能手工
  • 输出结果不稳定 — 一会说可以,一会说不可以,你到底想说什么
  • 无法操作外部工具 — 复杂的任务不只是文本,要突破文本的限制

LangChain 就是让大模型突破这些限制:

  • 无输入限制,能批量读取所有pdf
  • 查询数据库
  • 实现联网功能
  • 能调用所有开源大模型,不用自己一个一个方法去学习
  • 能把各种工具 和 大模型 串起来,突破文本限制

 
LangChain 编程是一种新的编程方式,改变了传统的编程思维。

在这种方式中,你不是直接编写代码来解决问题,而是定义一系列的工具和流程,然后让大型人工智能模型(比如ChatGPT)去执行这些流程,提供逻辑判断和流程组合。

这种编程方式的挑战在于它需要一种不同的思维方式:你需要更多地考虑如何设计流程和使用工具,而不是直接编写代码。调试也更加复杂,因为你需要以一种更加语义化的方式来编程,这意味着要非常清楚地表达你的意图,才能得到确切的答案或预期的结果。

LangChain 编程是一种利用人工智能来辅助编程的方法,它要求编程者以一种新的方式思考问题和解决问题。

更多的思考聚焦于是如何确保模型的稳定性,而不是传统意义上的业务逻辑编程。

LangChain API 文档:https://python.langchain.com.cn/docs/get_started/introduction

  • LangChain 更新很快,前段时间写的代码,现在就不能用了
  • 有时候更新太快,API文档也是错的
  • 那可去 LangChain 的 GitHub 开一个 Issue,很快就可以得到解答

一时间我也不知道该怎么写,昨日编程行万里,今朝更新又重启。

这里会把重点放在框架上,心中有框架可以快速适应新变化:

LangChain 六大组件:

  • 模型IO:选择某个大模型、输入提示词、输出解析器
  • 数据连接:文档加载器(能从不同来源加载文档)、文档转换器(把文档转问答对)、文本嵌入模型(文本转小数)、向量存储(存储嵌入数据)、检索器(查询数据)
  • Chains链:把每个组件串起来
  • Memory:记忆上下文
  • Agents代理:能使用多种工具(数学题调计算器、上网调谷歌搜索)
  • 回调:对各个阶段做日志记录、监控、流处理等

模型IO:和大模型交互、提示词模版

数据连接:从数据的接入、分割,到向量的构建、存储、搜索

链:串联和组织,多个语言模型、组件

记忆:灵魂伴侣,最熟悉你的机器

代理:软件不会用怎么办?退下,我来!!

回调:语义表达清,调试更精准

 


LangChain 大模型结合 打造 钢铁侠的全能助理 Jarvis

 


打造AutoGPT:突破文本限制,从语言理解到任务执行,AI分析、AI执行、AI调整、AI验证,去招聘网站招揽、,照顾饮食起居订餐订飞机票、寻找新的挣钱机会,以六千万分之一秒的速度分析信息

 


打造ChatPDF:回归学习本质,跳过所有的繁文缛节、场面话,根据你的理解提问,给你提供最直接的反馈,你听不懂还可以要求举例子、可视化、按流程顺序拆解

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/321764.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Day7 vitest 之 vitest配置第三版

项目目录 runner Type: VitestRunnerConstructor Default: node, 当运行test的时候 benchmark,当运行bench测试的时候 功能 自定义测试运行程序的路径。 要求 应与自定义库运行程序一起使用。 如果您只是运行测试,则可能不需要这个。它主要由library作者使用 …

斯坦福和 Meta学者发现Gemini在常识推理任务中有较强潜力;初学者GPT:Ai和LLM资源

🦉 AI新闻 🚀 斯坦福和 Meta学者发现Gemini在常识推理任务中有较强潜力 摘要:斯坦福和Meta的学者发表论文为Gemini正名,他们发现之前对Gemini的评估并不能完全捕捉到其真正的常识推理潜力。他们设计了需要跨模态整合常识知识的任…

VSCode编辑器下载与安装

1、下载 官网下载地址: 打开下载地址,如下图,根据自己的平台选择相应版本下载(本文只针对Windows系统的安装,所以下载Windows版的)。 点击会自动下载,下载完成文件如下图: 2、安装…

【C#】知识点实践序列之UrlEncode在线URL网址编码、解码

欢迎来到《小5讲堂》,大家好,我是全栈小5。 这是2024年第8篇文章,此篇文章是C#知识点实践序列文章, 博主能力有限,理解水平有限,若有不对之处望指正! 地址编码大家应该比较经常遇到和使用到&…

2023 年最先进认证方式上线,Authing 推出 Passkey 无密码认证

密码并非是当前数字世界才有的安全手段。古今中外诸如故事中的《阿里巴巴与四十大盗》的“芝麻开门”口诀,或是江湖中“天王盖地虎,宝塔镇河妖”等传统的口令形式,都是以密码作为基本形态进行身份认证。然而,随着密码在越来越多敏…

即时设计:一键查看设计稿与页面差异,让设计师的工作更便捷高效

设计稿走查 在设计工作中,对设计稿和实际页面进行对比是必不可少的环节。然而,传统的对比方式往往耗时耗力,无法精确测量差异。为了解决这个问题,我们推出了一款强大的工具,它可以通过图片对比,轻松查看设…

高效分割视频:批量剪辑,轻松提取m3u8视频技巧

在数字媒体时代,视频分割是一项常见的需求。无论是为了编辑、分享还是其他要求,经常要将长视频分割成多个短片。传统的视频分割方法往往需要手动操作,既耗时又容易出错。现在来看云炫AI智剪高效分割视频的方法,批量剪辑并轻松提取…

论文管理器

论文管理器 这个论文管理器仍然存在许多漏洞。目前,通过按照一些例行程序操作,它可以正常工作。我将在有时间的时候改进代码,提供详细说明,并添加新功能。当该管理器的代码进行优化后,我会上传到github上。 一个建立…

3.2.1CURRENT 、3.2.2-SNAPSHOT、3.1.7GA 这三者的springboot版本之前有什么区别

在Spring Boot中,版本号通常遵循主要版本.次要版本.修补版本的格式,有时后面会跟着一个额外的标签来表示版本的特殊性质。根据您提供的版本号 “3.2.1CURRENT”、“3.2.2-SNAPSHOT” 和 “3.1.7GA”,我们可以解释这些版本的含义和它们之间的区…

小迪安全第一天

一、常用的专业术语 参考: https://www.cnblogs.com/sunny11/p/13583083.html POC(proof of concept)验证漏洞的代码EXP(exploit) 利用对一段漏洞代码的利用Playload:有效载荷,当利用exploit成功后如何通过一个管道把这个权限给…

哪个牌子最值得购买?好用的洗地机排行榜

随着生活水平的提高,人们对家庭卫生的重视程度也越来越高,家用洗地机成为了现代家庭清洁中不可或缺的一部分。2024年的品牌排行榜也开始逐渐浮出水面,消费者们对于哪个品牌的家用洗地机更值得信赖也开始产生了新的讨论。接下来,让…

大模型应用实践:AIGC探索之旅

随着OpenAI推出ChatGPT,AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势,而是深刻地塑造着我们交流、工作和思考的方式。 本文介绍了笔者理解的大模型和AIGC的密切联系,从历史沿革到实际应用案例,再到面临的技术挑…