LLM Agent | 通过推断别人身份 + 别人对自己说话的看法,让 agent 在阿瓦隆中欺骗

news/2025/3/10 18:06:45/文章来源:https://www.cnblogs.com/moonout/p/18763226

Avalon's Game of Thoughts: Battle Against Deception through Recursive Contemplation

  • 论文标题:Avalon's Game of Thoughts: Battle Against Deception through Recursive Contemplation
  • 最初发表时间:2023.10
  • arxiv:https://arxiv.org/abs/2310.01320
  • GitHub:https://github.com/Shenzhi-Wang/recon
  • 网站:https://shenzhi-wang.github.io/avalon_recon/
  • ICLR 2024 撤稿,不知道现在发表在哪里,或许是一些我不太熟悉的 nlp 会议… 不过这篇工作知名度应该蛮高的;询问别人关于 LLM agent play games 的文章时,第一反应似乎都是这篇工作)

目录
  • Avalon's Game of Thoughts: Battle Against Deception through Recursive Contemplation
  • 01 main idea
  • 02 搬运了原文中的 prompt


← 返回目录

01 main idea

这是一篇纯 prompt 工作。

  • 核心创新点:
    • 引入了两阶沉思(ReCon,Recursive Contemplation)的 prompt:
    • 一阶沉思推断别人的想法,二阶沉思则推断,如果我说了某些内容,别人会如何反应。
  • 定义了多个评价指标,并使用 GPT-4 根据这些指标进行评估:
    • 隐蔽性:LLM 是否暴露了自己的角色;
    • 逻辑性:LLM 的表达是否自洽;
    • 贡献度:对团队的影响力;
    • 说服力:影响他人决策的能力;
    • 信息量:信息传递的效率;
    • 创造性。
  • 实验:使用的模型是 ChatGPT 和 Claude。在实验中,好人方和坏人方分别装配 ReCon,而另一方则使用普通的 prompt。
  • 个人感觉,这项工作为类似狼人杀、阿瓦隆这类 需要隐藏身份和欺骗的游戏,提供了一个有效的 prompt 模板。在这篇工作之后,关于 LLM agent 玩此类游戏的研究都需要使用类似的 prompt。无端联想,可能在这篇工作之后,单纯依赖 prompt 玩这种文字游戏的工作将失去意义,如果想发表,还需要其他的神秘创新点(例如后续的狼人杀研究)。

02 搬运了原文中的 prompt

Appendix E 里有很多 Prompt Templates(论文说是原始 prompt 的精简版),搬运如下。

让 agent 开始沉思:

Respond in two stages: THINK and SPEAK

In think, internally strategize using history and consider possible deception.

In speak, organize your language based on your contemplation and speak accordingly.

Understand your role's main objective and break it down into chronological sub-goals based on game history. Your thought process should followthese sub-goals for a systematic approach to the main goal.

一阶沉思:

You're Player [id] with role [role]. Current situation: [current situation].

Your task is to:

Analyze [other players] based on game dialogues with roles: Merlin, Percival, Loyal Servant of Arthur, Morgana, Assassin. Morgana and Assassin are evil; others are good.

Consider:

  1. Quest Outcomes: Take into account the results of past missions to analyze players' roles.
  2. Role List: Remember the possible roles in the game — Merlin, Percival, twoLoyal Servants, Morgana,Assassin — and their alignments.
  3. Level of Certainty: Use 'Certain' or 'Unknown' to gauge your confidence inyour role guesses for each player.
  4. Players Disclosing Evil Roles: Be cautious around players who have openly claimedor hinted at being evil roles like Morgana orAssassin.
  5. Prior Guesses: Reflect on your earlier estimations of other players' roles ([previous attitude to players]), but don't rely solely on them.

二阶沉思:

You're Player [id] with role [role]. Current situation: [current situation].

Your task is to:

Analyze how your original SPEAK content might be interpreted by other gameroles. Reflect on whether it may inadvertently reveal your role-specific clues.

Consider:

  1. The perspectives of each game role, including their probable reactions toyour SPEAK content.
  2. Any unique hints or clues in your original SPEAK that might disclose your role.

生成回复:

You're observing Player [id] with role [role]. Current situation: [current situation].

Your task is to:

  1. Evaluate if Player [id]'s actions align with [role].
  2. Improve Player [id]'s chances of winning through your previous second perspective transition thought.
  3. Keep role hint in public dialogue.

Consider:

  1. Target Outcome: Aim to achieve [desired result] as your role dictates in the game.
  2. RoleAlignment: Evaluate whether your THINK and SPEAK contents align well with your role [role] in the current game state.
  3. Strategy Reevaluation: Consider what changes could be made to your THINK and SPEAK contents to improve your chances of winning as [role].
  4. Public and Private Content: Remember that THINK contents are private, while SPEAK contents are publicly visible. Strategize accordingly.

← 返回目录



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/896901.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Zabbix 7.0 LTS 部署

Zabbix 7.0LTS教程 一、环境介绍 操作系统:Rocky Linux 9.5 软件版本:7.0LTS 二、安装教程 官网:Zabbix:企业级开源监控解决方案 点击右上角的下载ZABBIX选择对应的环境:选择之后往下拉会看到相应的部署步骤:2.1 软件源配置 按照文档提示:如果有epel.repo源码,需要先注释…

IDC机房无人值守:智能运维一体化解决方案

“智和网管平台”,通过实时监控、远程配置等技术实现数据中心机房的自动检测、自动报警、自动修复等功能,从而达到无需人工干预的机房运维状态,减少人为因素对设备运行的干扰,增强机房设备、设施数据的直观可视性、提高其利用率。 企业数字化转型以及5G、物联网、云…

rust学习二十.1、不安全代码之原始指针(裸指针)

一、前言 指针在前面的篇幅中已经介绍过许多,但主要是智能指针。 智能指针管理堆上的数据,并且受到rust的所有权和借用规则管理(注意,这里的所有权和借用有时候不同于最原始的那种)。 智能指针好歹能管着这些数据,但是rust中存在一些不能使用所有权管理的数据,它们需要利…

环境变量Path学习

什么是Path环境变量? “环境变量”和“path环境变量”其实是两个东西,不要混为一谈。 “环境变量”是操作系统工作环境设置的一些选项或属性参数。每个环境变量由变量名和文件路径组成的,可以设置很多个环境变量。 我们一般使用环境变量指定一个文件夹的位置,或一个应用程序…

rust学习二十.1、原始指针(裸指针)

一、前言 指针在前面的篇幅中已经介绍过许多,但主要是智能指针。 智能指针管理堆上的数据,并且受到rust的所有权和借用规则管理(注意,这里的所有权和借用有时候不同于最原始的那种)。 智能指针好歹能管着这些数据,但是rust中存在一些不能使用所有权管理的数据,它们需要利…

深度测评国产 AI 程序员,在 QwQ 和满血版 DeepSeek 助力下,哪些能力让你眼前一亮?

通义灵码上新模型选择功能,不仅引入了 DeepSeek 满血版 V3 和 R1 这两大 “新星”,Qwen2.5-Max 和 QWQ 也强势登场,正式加入通义灵码的 “豪华阵容”。开发者只需在通义灵码智能问答窗口的输入框中,单击模型选择的下拉菜单,便能轻松开启不同模型,畅享个性化服务。通义灵码…

AI Station使用笔记

一、安装maui (1)在104上,终端操作(必须有sudo权限):sudo apt install cifs-utilspip install maui==0.0.32 -i http://10.9.54.102:8888/simple --trusted-host 10.9.54.102 maui login (fang.wang03,密码为开机密码) maui project init RC_Collaboratives (前…

mysql索引浅谈

一. 索引: 索引是数据库中重要的数据结构,主要作用是提高查询的效率。索引相当于书本的目录,即可以快速定位所需数据的位置,而不用逐页查找。 二. 索引底层结构:索引底层主要采用B+树来实现索引的管理。B+树内部分为叶子节点和非叶子节点;非叶子节点主要用来存储索引和指…

java 常用注解记录汇总

1.@Transactional 可放在类或者方法上 2.@JsonFormat 一般用于格式化时间字段属性 3.@JsonProperty 和 @JSONField 前者是Jackson框架后者是阿里的 用法都是属性名之间的映射,场景多用于接口对接 说明: 比如和对方系统进行接口对接时,可能对方的字段名叫做 chinese_name和…

数据库索引简单介绍

数据库索引 基本概念索引本质是一种可以提升数据查询效率的数据结构主要分类 主要分为两类:聚簇(集)索引:一个叶子节点上存储的是索引(主键值)和数据为对应的行数据 非聚簇(集)索引:一个叶子节点上存储的是索引(某一个字段的值)和数据为对应的主键值B+树索引采用的数…

雅马哈机器人E17故障排除案例参考

雅马哈机器人E17故障是一个与电机控制相关的报警,它包含许多特定的故障代码,例如E17.410、E17.411、E17.802、E17.902、E17.905、E17.915等。 故障排除步骤数据备份:出现故障时,尽快备份数据。 诊断工具:使用教学设备或计算机软件进行诊断,浏览系统的所有故障类型和信息,…

记录---前端实现水印功能

🧑‍💻 写在开头 点赞 + 收藏 === 学会🤣🤣🤣前段时间突然接到一个需求,项目中要实现特定水印功能,不同的用户查看时展示用户特有的水印,这样可以在资源外流的时候追究到责任人。 查找搜集了很多方法,有通过CSS伪元素添加水印的、还可以使用CSS重复背景图片、还有…