LLMs的Chain-of-Note(CoN)检索

英文原文地址:https://cobusgreyling.medium.com/chain-of-note-con-retrieval-for-llms-763ead1ae5c5

Chain-of-Note (CoN) 旨在通过解决噪声数据、不相关文档和domain场景来改进 RAG 实现。

2023 年 11 月 17 日

CoN 的要点

CoN 框架由三种不同类型组成,研究称之为阅读笔记。

考虑上图,类型(A)显示检索到的数据或文档回答查询的位置。因此,LLM 仅使用 NLG 来格式化所提供数据的答案。

类型(B)是检索到的文档不直接回答查询,但上下文洞察足以使LLMs将检索到的文档与其自己的知识相结合来推断答案。

类型(C)是检索到的文档不相关,并且LLMs没有相关知识来响应,这导致框架不会给出错误或错误的答案。

CoN 是一个自适应过程,或逻辑和推理层,其中直接信息与上下文推理和LLMs知识识别相平衡。

数据的四个方面

为了使模型具备生成NoC阅读笔记的能力,需要进行微调。

我们训练了一个 LLaMa-2 7B 模型,将笔记能力整合到 CON 中。

CoN不仅是一个提示模板,还包含一个针对笔记进行微调的模型。因此CoN可以看作是RAG和Fine-Tuning的结合。

这又回到了数据人工智能的概念和数据的四个方面,即数据发现、数据设计、数据开发和数据交付。

一般而言的 RAG 和具体的 CoN 可以被视为数据交付过程的一部分。但为了训练NoC模型,需要一个数据发现、数据设计和数据开发的过程。

对于这项研究,收集适当的训练数据至关重要。

每个阅读笔记的手动注释都是资源密集型的,因此研究团队采用最先进的语言模型来生成笔记。

这里我必须提一下,如果NoC要在企业环境中实施,AI加速的数据生产力工作室将是至关重要的。这种人机交互的过程对于具有清晰信号的相关训练数据非常重要。

CoN Template

下面显示了 LangSmith 游乐场的 CoN 模板。在此示例中,给定一个问题,查询维基百科并使用 OpenAI 和 Chain-of-Note 提示来提取答案。

来源

对于标准 RAG,指令为:

Task Description: The primary objective is to briefly answer a specific question.

对于具有 CON 的 RALM,指令为:

Task Description:

1. Read the given question and five Wikipedia passages to gather relevant information.
2. Write reading notes summarizing the key points from these passages.
3. Discuss the relevance of the given question and Wikipedia passages.
4. If some passages are relevant to the given question, provide a brief answer based on the passages.
5. If no passage is relevant, direcly provide answer without considering the passages.

CoN的对于RAG的改善

Retrieval-Augmented Generation已成为LLMs的重要推动者。最值得注意的是,随着 RAG 的引入,模型幻觉得到了显着抑制,并且 RAG 还充当了模型性能的均衡器。请在此处阅读有关此内容的更多信息。

RAG 面临的挑战是确保在推理阶段向LLMs提供准确、高度简洁且上下文相关的数据。

检索不相关的数据可能会导致错误的响应,并可能导致模型忽视其固有知识,即使它拥有足够的信息来解决查询。

因此,Chain-of-Note(CoN)作为一种新方法,旨在提高 RAG 的弹性。特别是在 RAG 数据不包含与查询上下文相关的明确信号的情况下。

该研究的下图更详细地说明了 NoC 的实施。该框架主要构建了三种类型的阅读笔记……

来源

CoN 框架为检索到的文档生成顺序阅读笔记,从而能够系统地评估从外部文档检索到的信息的相关性和准确性。

通过创建顺序阅读笔记,该模型不仅可以评估每个文档与查询的相关性,还可以识别这些文档中最关键和最可靠的信息。

此过程有助于过滤掉不相关或不太可信的内容,从而获得更准确且与上下文相关的响应。

最后

平衡

基于 LLM 的弹性企业级生成式 AI 实施的答案不是 RAG模型微调。而是两者的结合,NoC 就是一个很好的例子。

语境

其次,上下文参考非常重要,数据提取中可供参考的信号越清晰越好。经过微调的模型提供了额外的上下文,以及检索到的文档和 NoC 提示模板。

数据

展望未来,数据以及高效且有效的数据发现和设计方法将变得越来越重要。我很想更深入地了解训练数据的结构。

总结

基于LLM的生成式人工智能实现的答案不是RAG或模型微调。而是两者的结合。因为上下文参考是非常重要的,从数据提取中的信号越清晰越好。经过微调的模型提供了额外的上下文,以及检索到的文档和NoC提示模板。数据与高效的数据发现和设计方法将变得越来越重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/419070.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【JS逆向】某居深圳登陆信息加密逆向分析探索!

某二手房深圳站点的登陆信息加密逆向分析探索,需要分析查找关键的加密位置,位置在前上部分,需要理解一点代码,往上寻找一段代码,加密特征比较明显,找到后即可调试出来! 网址: aHR0cH…

TCP服务器最多支持多少客户端连接

目录 一、理论数值 二、实际部署 参考 一、理论数值 首先知道一个基础概念,对于一个 TCP 连接可以使用四元组(src_ip, src_port, dst_ip, dst_port)进行唯一标识。因为服务端 IP 和 Port 是固定的(如下图中的bind阶段&#xff0…

Red Hat Enterprise Linux 8.9 安装图解

引导和开始安装 选择倒计时结束前,通过键盘上下键选择下图框选项,启动图形化安装过程。需要注意的不同主板默认或者自行配置的固件类型不一致,引导界面有所不同。也就是说使用UEFI和BIOS的安装引导界面是不同的,如图所示。若手动调…

Minio文件分片上传实现

资源准备 MacM1Pro 安装Parallels19.1.0请参考 https://blog.csdn.net/qq_41594280/article/details/135420241 MacM1Pro Parallels安装CentOS7.9请参考 https://blog.csdn.net/qq_41594280/article/details/135420461 部署Minio和整合SpringBoot请参考 https://blog.csdn.net/…

【JavaEE Spring】SpringBoot 日志

SpringBoot 日志 1. 日志概述2. 日志使用2.1 打印⽇志2.1.1 在程序中得到⽇志对象2.1.2 使⽤⽇志对象打印⽇志 2.2 ⽇志框架介绍2.2.1 ⻔⾯模式(外观模式)2.2.2 SLF4J 框架介绍 2.3 ⽇志格式的说明2.4 ⽇志级别2.4.1 ⽇志级别的分类2.4.2 ⽇志级别的使⽤ 2.5 ⽇志配置2.5.1 配置…

Docker-Compose.yml 指南:让容器编排更简单

Docker-Compose.yml 指南:让容器编排更简单 引言Docker Compose 简介什么是 Docker Compose?Docker Compose 与 Docker 的区别 核心指令解析versionservicesnetworksvolumesbuildports其他常用指令 实战案例:使用 Docker Compose 搭建多容器应…

高性能前端UI库 SolidJS | 超棒 NPM 库

SolidJS是一个声明式的、高效的、编译时优化的JavaScript库,用于构建用户界面。它的核心特点是让你能够编写的代码既接近原生JavaScript,又能够享受到现代响应式框架提供的便利。 SolidJS的设计哲学强调了性能与简洁性。它不使用虚拟DOM(Vir…

HarmonyOS 应用开发入门

HarmonyOS 应用开发入门 前言 DevEco Studio Release版本为:DevEco Studio 3.1.1。 Compile SDK Release版本为:3.1.0(API 9)。 构建方式为 HVigor,而非 Gradle。 最新版本已不再支持 (”Java、JavaScrip…

ckman:非常好用的ClickHouse可视化集群运维工具

概述 什么是ckman ckman,全称是ClickHouse Management Console, 即ClickHouse管理平台。它是由擎创科技数据库团队主导研发的一款用来管理和监控ClickHouse集群的可视化运维工具。目前该工具已在github上开源,开源地址为:github…

vue路由-全局前置守卫

1. 介绍 详见:全局前置守卫网址 使用场景: 对于支付页,订单页等,必须是登录的用户才能访问的,游客不能进入该页面,需要做拦截处理,跳转到登录页面 全局前置守卫的原理: 全局前置…

中期国际1.18黄金市场分析:零售销售强劲增长,美联储降息可能性大幅降低!

金价在周四下跌,其中一个主要原因是美国国债收益率的持续上升。此外,强劲的美国零售销售报告也对金价造成了影响,该报告显示零售销售额大幅上涨,超出预期值,这使得美联储3月份降息的可能性大幅降低。 12月份的消费者价…

树的一些经典 Oj题 讲解

关于树的遍历 先序遍历 我们知道 树的遍历有 前序遍历 中序遍历 后序遍历 然后我们如果用递归的方式去解决,对我们来说应该是轻而易举的吧!那我们今天要讲用迭代(非递归)实现 树的相关遍历 首先呢 我们得知道 迭代解法 本质上也…