【论文阅读】一些多轮对话文章的体会 ACL 2023

前言

  • 本文是对昨天看到的ACL 2023三篇多轮对话文章的分享
  • 这三个工作都是根据一些额外属性控制输出的工作,且评估的方面比较相似,可以借鉴

方法

这几篇文章都不是做general任务的,倾向于通过一些额外信息,来做specific任务

  • 【1】提出应该在instance-level上而不是task-level上生成attribute prompt(i.e. user’s persona/dialogue intent)

    • train a lightweight prompt module that takes as input a control attribute(shallow and deep version)
    • 而不是 training static soft tokens for the dialogue task

    在这里插入图片描述

  • 【2】在inference阶段,基于对话历史预测persona信息来定制dialogue agent,而不依赖显式的persona描述

    • 提出两种方式的persona detection model:
      • 给定模型对话历史,训练其输出的向量与persona向量(通过输入persona description来编码得到)近似
      • 给定模型对话历史,训练其直接生成persona description
    • 多任务训练:将persona detection model 与 dialogue context encoder联合训练
      • 分享第一层参数,可以看作是一个通用的对话信息编码器
      • 训练persona detection model与dialogue model一起最大化ground truth response的概率

    在这里插入图片描述

  • 【3】生成包含特定语法items的回复(比如现在完成时,虚拟语气,定语从句),尝试了在DialoGPT上用强化学习的方式与基于GPT-3的in-context learning方式,发现都可以

数据集与评估

  • 【1】Dailydialog for label control 与 FoCus for document control

    • Dailydialog :对每句话都标注了dialogue act(图中是标记的是emotiong,act在另一个文件中),一共四种(陈述,问题,指示,承诺)

      在这里插入图片描述

    • FoCus: 包含user’s persona,希望构建 dialogue agent

    • 评估response

      • controllability for customizing responses
      • n-gram based: BLEU, NIST, ROUGE-L, METEOR for fluency and adequacy
      • distinct n-gram: Dist and Entropy for diversity
      • humane evaluation for consistency between dialogue context and response and attribute controllability
  • 【2】PersonaChat and Dailydialog

    • PersonaChat(arxiv 2018)

      在这里插入图片描述

    • 为了验证泛化性,在Dailydialog上测试

    • 评估:

      • ppl for fluency
      • Dist for diversity
      • P-Cover for covering persona information
      • human evaluation(20 annotators)
      • etc.
  • 【3】Dailydilog(SCoRE 来训练分类器)

    • 评估:
      • Dist for diversity
      • G-Ration for containing the item
      • GOAL for fluency

参考

  • [1]Attribute Controlled Dialogue Prompting
  • [2]Learning to Predict Persona Information for Dialogue Personalization without Explicit Persona Description
  • [3]Generating Dialog Responses with Specified Grammatical Items for Second Language Learning

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/27801.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux的基本使用和web程序部署

注意:本文章不适合C学习者(知识点远远不够),只适合Java学习者,学习简单的Linux命令 1.Linux的背景知识 1.1Linux是什么 Linux是一个操作系统,和Windows是“并列”的关系。经过多年的发展,Lin…

Three.js——十三、自定义大小画布、UI交互按钮以及3D场景交互、渲染画布为文件(图片)

画布全屏以及自定义大小画布 <!-- canvas元素默认是行内块元素 --> <divclass"model"style"background-color: #ff0000;"width"300"height"180" ></div>画布随窗口变化 // 画布跟随窗口变化 window.onresize fun…

Qt 项目架构之----MVC架构

MVC 模式代表 Model-View-Controller&#xff08;模型-视图-控制器&#xff09; 模式。这种模式用于应用程序的分层开发。 Model&#xff08;模型&#xff09;-是应用程序中用于处理应用程序数据逻辑的部分。通常模型对象负责在数据库中存取数据。View&#xff08;视图&#x…

2023 Testing Expo倒计时-聚焦风丘9003展位

请点击此处&#xff0c;即可进行在线登记报名并了解更多信息&#xff01;

25个高级SQL查询-列出结果集的前5行

本专栏中的许多示例将基于以下员工表(employee)。只有少数例子将以其他表格为基础;在这些情况下,表格将与示例一起进行说明。 一、WITH WITH AS 短语,也叫做子查询部分,定义一个SQL片断后,该SQL片断可以被整个SQL语句所用到。有的时候,with as 是为了提高SQL语句的可读…

2023 Testing Expo倒计时-聚焦Softing 9003展位

请点击此处&#xff0c;即可进行在线登记报名并了解更多信息&#xff01;

计算机二级c语言考试复习大纲(一战到底)

1.C语言关键字 1.数据类型关键字&#xff08;12个&#xff09; char(字符型) short&#xff08;短整型&#xff09; int&#xff08;整型&#xff09; long&#xff08;长整型&#xff09; float&#xff08;单精度浮点型&#xff09; double&#xff08;双精度浮点…

设计模式——单例模式

单例模式 定义 确保某一个类只有一个实例&#xff0c;而且自行实例化并向整个系统提供这个实例。 即保证一个类只有一个实例&#xff0c;并且提供一个全局访问点 优缺点、应用场景 优点 单例对象在内存中只有一个实例&#xff0c;减少了内存的开支。尤其对于一个频繁创建…

UE学习记录02----UMG创建控件模板+事件分发器

官网4.27&#xff1a; 创建控件模板 | 虚幻引擎文档 (unrealengine.com) 使用UMG创建的每个 控件蓝图 都被视为 用户控件&#xff0c;其可在其他控件蓝图中重复使用和放置。 其视觉效果和脚本功能都将延续到该蓝图中。 利用某些蓝图脚本&#xff0c;可创建UI控件的运行方式或…

TCP/IP详解

目录 一、OSI参考模型 1.图示 2.OSI七层模型各自作用 3.七层通信过程 二、IP协议 1.IPv4首部 2.IPv6首部 三、TCP协议 1.tcp首部格式 2.握手挥手图示 3.握手流程 4.为什么要三次握手&#xff1f; 5.四次挥手流程 6.为什么要四次分手&#xff1f; 7.为什么要等待…

使用 Pytest 运行 yaml 文件来驱动 Appium 自动化测试

目录 前言&#xff1a; 获取 yaml 文件 YamlTest 测试类 Appium 初始化 Pytest 测试类 自定义 runtest demo&#xff1a; 自定义错误输出 Yaml 使用方式规则 前言&#xff1a; 使用Pytest来运行yaml文件来驱动Appium自动化测试是一种方便且灵活的方法。通过将测试数据…

uniapp:针对与富文本解析的几种方法

第一章、富文本的解析方法 1.1 uniapp自带组件&#xff1a;rich-text <rich-text :nodes"nodes"></rich-text> 1.2 v-html <view v-html"item.content"></view> 1.3 uview组件&#xff1a;u-parse <u-parse :content&quo…