面向法律领域的大模型微调与应用

news/2024/10/10 20:21:02/文章来源:https://www.cnblogs.com/pam-sh/p/18457052

来源:论文

摘要

这篇论文探讨了如何通过微调大型语言模型来实现法律领域的智能化服务。作者指出,以往的智慧法律系统需要为每个特定的任务设计专门的算法或模型,面临着研发成本高、集成难度大的困难。而现在,通过微调大型语言模型,可以同时处理多种法律任务,从而提高法律从业者的效率和准确性。此外,作者还介绍了一种中文智慧法律大模型LawLLM,该模型可以面向不同用户群体,提供多样的法律服务,并且在法律信息抽取等任务上取得了良好的表现。

创新点

方法描述

该论文提出了一个名为LawBench的开源大语言模型综合评估基准,旨在评估基于中国法律体系的大语言模型在记忆、理解和应用三个认知水平上的表现。LawBench数据集包含了20个不同的任务,每个任务有500个示例,并且评价指标有所差异。

方法改进

该论文并没有提到具体的改进方法,但可以推测出可能是在设计LawBench数据集时考虑到了不同任务的特点,并针对这些特点制定了相应的评价指标。

解决的问题

该论文主要解决了如何评估基于中国法律体系的大语言模型在记忆、理解和应用三个认知水平上的表现的问题。通过建立LawBench数据集和相关的评价指标,可以帮助研究人员更好地了解大语言模型在中国法律领域的表现,并为后续的研究提供参考。

LawLLM模型

模型整体框架:
image

模型训练

模型训练分为 监督微调检索增强 两个阶段。

  • 基座模型为:Baichuan-13B-base

  • 做全参数微调:批大小(batch size)为64、学习率为5×10-5、2个epoch训练阶段、上下文长度为4 096个Token

  • 环境:8*A800GPU

  1. 监督微调

监督微调阶段的训练目标和自回归模型一样,即根据已知文本预测下一个Token。

  • 优点:经过监督微调,模 型能够具备基础的法律文本处理能力,包括法律语言的理解和生成能力,并具备法律推理思维。
  • 不足:但在很多法律场景下,例如法律咨询和判决预测场景,模型的输出如果能有法律法规作为支持依据则更有说服力。同时在监督微调之后,模型可能会因为幻觉或过时的知识而产生不准确的输出。
  1. 检索增强

为了解决这个问题,检索增强阶段利用开源的检索框架Langchain来增强模型的能力。

首先建立包括中国宪法、刑法、行政诉讼法、著作权法、专利法等50多类法律的知识库,将这些文档编码为向量并保存在本地知识库。

检索过程中,对于每一个用户输入,检索器计算输入与知识库中文本块(chunk)的相似性,从知识库中召回最相关的Top-K个文本块,候选文档和原始用户输入经过设计的提示(prompt)组合后,再输入模型中得到输出。

image

论文实验

本文进行了多个对比实验,包括:

  1. 智慧法律大模型的零样本和少样本学习能力比较。实验结果表明,本文提出的中文智慧法律大模型LawLLM在零样本和少样本学习能力方面表现优异,超越了其他通用大模型和法律领域大模型。
  2. 长文本信息抽取任务的比较。实验结果表明,LawLLM在裁判文书信息抽取任务上表现出色,仅次于175×109个参数、16 000字上下文长度的GPT-3.5-Turbo-0125模型。同时,本文也指出了其他法律类任务的微调可以使模型具备完成新的法律任务的能力。
  3. 不同长度文本和不同抽取问题上的实验结果比较。实验结果表明,LawLLM在不同长度文本和不同抽取问题上的表现都有所差异,但在整体上仍然表现出色。

综上所述,本文的实验结果表明,中文智慧法律大模型LawLLM在各种场景下都能表现出色,具有广泛的应用前景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/811253.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

招标书样本

本文来自博客园,作者:ukyo--夜王,转载请注明原文链接:https://www.cnblogs.com/ukzq/p/18457050

Gradio 5 稳定版正式发布

在过去的几个月里,我们一直在努力工作,今天,我们想向大家展示成果:Gradio 5 稳定版现已发布。 有了 Gradio 5,开发者可以构建 生产级的机器学习 Web 应用,这些应用不仅性能优越、可扩展、设计精美、易于访问,而且还遵循了最佳的 Web 安全实践。更重要的是,只需几行 Pyt…

我理解的伽马校正(Gamma Correction

写在前面 我相信几乎所有做图像处理方面的人都听过伽马校正(Gamma Correction)这一个名词,但真正明白它是什么、为什么要有它、以及怎么用它的人其实不多。我也不例外。最初我查过一些资料,但很多文章的说法都不一样,有些很晦涩难懂。直到我最近在看《Real Time Rendering…

Odoo18.0 支付宝

odoo16.0官方将支付宝模块弃用了,但是需求还在,我们也不太可能去使用推荐的asipay,因此,我们决定,自己手动实现它。 安装与配置 首先,我们在应用中安装我们的支付宝模块:安装好之后,我们在销售-配置-在线支付-支付提供商菜单进入支付宝配置界面: 这里对各个参数简单介…

【Azure Event Hub】诡异现象之Event Hub无法删除的根源

问题描述 遇见一个诡异的现象。在Event Hub 事件中心中删除了一个Event Hub后,会立马被重建,多次删除发现都是同样的问题。 这是什么情况呢? 问题解答 经过对Event Hub调查发现,使用了Kafka客户端持续的发送/消费事件。而Kafka客户端自带属性auto.create.topics.enable = …

实验一 现代C++编程初体验

实验结论: 任务一: task1.cpp1 // 现代C++标准库、算法库体验2 // 本例用到以下内容:3 // 1. 字符串string, 动态数组容器类vector、迭代器4 // 2. 算法库:反转元素次序、旋转元素5 // 3. 函数模板、const引用作为形参6 7 #include <iostream>8 #include <string&g…

玩玩虚拟化-KVM

1、讲在前面(玩这个的心历路程) 最近一段时间想玩一些集群之类的东西,学习搞一下K8s,集群啥的,但是我没有多台服务器,如果购买云服务器成本太高,后来想到了买台台式机弄点虚拟机来玩,于是我就在某鱼上淘了台二手台式机(24核+32G+512G+4G显卡),价格1280。后来想到要装虚…

欢迎加入Web3交流群

加入群聊后先看 群公告,入群二维码会及时更新的哈! 微信内长按二维码图片即可识别入群!

初步认识vue脚手架

初步认识vue脚手架 脚手架的优势统一的项目目录 本地程序调试 热部署 单元测试 集成打包上线 vue脚手架会产生统一的项目目录,能够支持热部署,就是不重新调试也可以更新数据。其他几点我还不是很理解。对脚手架的分析node_modules表示目录包 public 表示静态包 src 为源代码 …

闲话 10.10(有更新)

杂项乱写 10.10想到什么写什么昨晚CTH(大喊):HDK! HDK(大喊):CTH! CTH(愣了一下):干啥?2-SAT 定义 给出若干个形如 \(a\lor b\) 的限制条件,询问是否有满足条件的一组解。 人话:给出 \(n\) 个集合,每个集合两个元素,再给定若干个限制条件 \(\left \langle a,b\…

2024秋软件工程结对作业(第二次)

软件工程 班级链接:https://edu.cnblogs.com/campus/fzu/SE2024作业要求链接 https://edu.cnblogs.com/campus/fzu/SE2024/homework/13281作业目标 开发一套跨专业合作平台,为大学生提供发起和参与跨学科项目的渠道。学号 102201313Github项目地址 https://github.com/KeepUp…