ChatGPT 可以预测未来吗?

推荐 4月13日的一篇有趣的 paper,特来分享。

👉 当前的大型语言模型(LLMs)具有强大的数据合成和推理能力,但它们在直接预测尚未发生事件的准确性上常常受到限制。传统的预测方法依赖于直接询问模型关于未来的问题。

本研究采用了一种双重提示策略来评估ChatGPT-3.5和ChatGPT-4的未来事件预测准确性。研究团队利用了ChatGPT在实验时的一个限制:即训练数据只到2021年9月。因此,他们利用ChatGPT对2022年的事件进行预测,采用了直接预测和“未来叙事”两种策略。

本文的挑战

1️⃣ 挑战1:如何提高预测具体未来事件的准确性

解决方法: 研究中采用的“未来叙事”提示策略,让ChatGPT讲述设定在未来的虚构故事,这些故事中的角色经历了训练数据后的事件。例如,模型可能被提示创建一个故事,在这个故事中,一个角色描述了他们在2022年观看奥斯卡颁奖典礼的经历。这种方法通过利用模型的叙事构建能力来提高数据综合和推断,从而提高预测的准确性。

2️⃣ 挑战2:如何有效利用模型的叙事能力进行预测

解决方法: 在经济情境中,研究者们利用模型扮演像美联储主席杰罗姆·鲍威尔这样的公众人物来进行叙事预测。通过让ChatGPT-4“扮演”鲍威尔,预测例如通货膨胀率这类宏观经济变量,研究发现模型在这种设置下能更准确地预测未来经济趋势。这说明通过故事叙述可以更有效地利用模型的生成能力,进行更深入的数据分析和预测。

                                                  图:ChatGPT3.5 最佳男配角预测。

本文的一些有趣发现 👉

1️⃣ 未来叙事策略的有效性: 研究发现,与直接预测相比,使用未来叙事的提示策略显著提高了ChatGPT-4在预测未来事件(特别是奥斯卡奖项和经济趋势)的准确性。这表明,利用故事叙述的方式可以更好地激发模型的数据综合和推断能力。

2️⃣ 模型对公众意见敏感的场景表现出色: 特别在预测涉及公众意见的领域(如奥斯卡奖项)时,ChatGPT-4的叙事预测非常准确。这可能表明,在公众意见对结果有显著影响的情景中,大型语言模型可以展现出更好的性能。

3️⃣ 预测准确性的双重性: 在一些宏观经济现象的预测中,尽管叙事提示提高了预测的准确性,但在某些情况下,重要的信息分享可能导致估计结果出现反向偏差。这说明在使用这些模型进行预测时,信息的处理和整合方式极其重要。

总而言之,本文通过展示未来叙事策略在提高大型语言模型预测准确性方面的潜力,鼓励读者重新思考我们如何设计和利用AI工具的方式。作者希望借此引发关于如何负责任地使用AI技术的更广泛讨论,尤其是在确保使用AI时能够保障人类福祉和权利方面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/625757.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python爬虫入门教程!

什么是爬虫? 爬虫就是自动获取网页内容的程序,例如搜索引擎,Google,Baidu 等,每天都运行着庞大的爬虫系统,从全世界的网站中爬虫数据,供用户检索时使用。 爬虫流程 其实把网络爬虫抽象开来看,它…

Python编程与算法面试-编程面试的重点

在求职面试的过程中,编程能力也是面试官非常看重的一项能力。而对于编程这项能力主要的考察点也有三个维度: 初级:编程的基本功 编程的基本功主要考察的编程语言的基本语法,原理知识,以及一些在编程过程中的常见问题…

v-for中涉及的key

一、为什么要用key? key可以标识列表中每个元素的唯一性,方便Vue高效地更新虚拟DOM;key主要用于dom diff算法,diff算法是同级比较,比较当前标签上的key和标签名,如果都一样,就只移动元素&#…

【从零开始手搓12306项目】第一阶段遇到的问题及解决方案

IDEA中datebase连接mysql失败 读取外包函数报错 注意区分private和public 找不到数据库? 一定要注意数据库的url链接,在datebase的url复制过来 xml和java对应不上? 最好复制一遍到xml文件 git忽略条件文件目录 定义Git全局的 .gitigno…

【XR806开发板试用】 VSCode + Samba环境搭建

概览 考虑到开发环境使用linux,对于我这种初学者还不太习惯使用,而且还需要安装虚拟机。个人感觉挺麻烦的,于是我使用以下方案,达到再Windows下使用开发的目的。 主要思路是:使用WSL(Windows Subsystem for Linux)用来…

:has()伪类使用

下面的 CSS 代码表示如果 <a> 元素里面有 <img> 元素&#xff0c;则这个 <a> 元素就会匹配。 a:has(img) { display: block; } 我们可以使用这个选择器轻松区分是文字链接还是图像链接 a:has(> img) { display: block; } 表示匹配子元素是 <img>…

5.HC-05蓝牙模块

配置蓝牙模块 注意需要将蓝牙模块接5v,实测接3.3v好像不太好使的样子 首先需要把蓝牙模块通过TTL串口模块接到我们的电脑,然后打开我们的串口助手 注意,我们现在是配置蓝牙模块,所以需要进入AT模式,需要按着蓝牙模块上的黑色小按钮再上电,这时候模块上的LED灯以一秒慢闪一次…

基于java+springboot+vue实现的健身俱乐部系统(文末源码+Lw+ppt)23-49

摘 要 随着社会的发展&#xff0c;健身俱乐部的管理形势越来越严峻。越来越多的用户利用互联网获得信息&#xff0c;健身信息鱼龙混杂&#xff0c;信息真假难以辨别。为了方便用户更好的获得本健身俱乐部管理信息&#xff0c;因此&#xff0c;设计一种安全高效的健身俱乐部网…

YOLOv8 目标检测项目实操

一 yolov8 背景介绍 YOLOv8是一种尖端的、最先进的(SOTA)模型&#xff0c;建立在以前 YOLO 版本的成功基础上&#xff0c;并引入了新的特性和改进&#xff0c;以进一步提高性能和灵活性。YOLOv8被设计为快速、准确、易于使用&#xff0c;这使它成为一个很好的选择&#xff0c;…

三相交流电子负载的重要指标

三相交流电子负载是一种模拟实际负载的电子设备&#xff0c;主要用于测试电源、变频器、逆变器等电力电子设备的性能和稳定性。在选择和使用三相交流电子负载时&#xff0c;需要关注以下几个重要指标&#xff1a; 1. 额定功率&#xff1a;三相交流电子负载的额定功率是指其能够…

Adobe发布Acrobat AI助手,PDF互动新体验;OpenAI推出Batch批处理API,支持半价优惠

&#x1f989; AI新闻 &#x1f680; Adobe发布Acrobat AI助手&#xff0c;PDF互动新体验 摘要&#xff1a;Adobe公司近日宣布&#xff0c;继2月推出测试版后&#xff0c;Acrobat AI 助手已在Acrobat Reader、桌面和网页上全面推出。以每月4.99美元的附加订阅形式提供&#x…

PgSQL之WITH Queries/Statement

PostgreSQL WITH 子句 在 PostgreSQL 中&#xff0c;WITH 子句提供了一种编写辅助语句的方法&#xff0c;以便在更大的查询中使用。 WITH 子句有助于将复杂的大型查询分解为更简单的表单&#xff0c;便于阅读。这些语句通常称为通用表表达式&#xff08;Common Table Express…