论文导读 | 10月专题内容精选:人的预测

编者按

本次论文导读,编者选择了10月份OR和MS上与"人的预测"有关的三篇文章,分别涉及群体智慧的提取,个体序列预测的评估,以及决策者对风险的扭曲感知在分布式鲁棒优化中的应用。其中,从基于"生成式可能世界状态模型"(GPWM)进行群体预测的聚合,到使用严格的序贯检验模型来比较预测者的表现,本次选取的三篇文章对"人的预测"相关的数学建模、统计分析及其在优化问题中的应用都有一定启发,希望能引起相关读者的兴趣。

推荐文章1

● 题目:A Bayesian Hierarchical Model of Crowd Wisdom Based on Predicting Opinions of Others 

基于他人意见预测的群体智慧贝叶斯层次模型

● 期刊:Management Science

 原文链接:https://doi.org/10.1287/mnsc.2023.4955

 发表日期:October 19, 2023

● 作者:John McCoy, Drazen Prelec

● 关键词

◦ Wisdom of crowds 群体智慧

◦ Expertise 专家知识

◦ Bayesian hierarchical model 贝叶斯层次模型

◦ Surprisingly popular answer 令人惊讶的流行答案

● 主要内容

  • 本文的背景知识是关于群体智慧的提取方法和挑战。群体智慧是指多个人的集体智慧比单个个体更强大,可以应用于企业决策、市场研究、公共政策和医疗保健等领域。文章介绍了一些提取群体智慧的方法,如统计聚合信息和识别专业知识。然而,这些方法存在一些弱点,如无法考虑个体之间的信息差异和洞察力差异,以及无法准确获取世界先验知识和信号矩阵。文章提出了一种新的方法,称为generative possible worlds model (GPWM),以解决这些问题。

  • 本文的实现过程是通过引入、探索和实证验证generative possible worlds model (GPWM)。作者认为GPWM是将频率学派元素转化为贝叶斯群体智慧推断模型的自然而必要的一步。作者在多个实证数据集上评估了模型的性能,包括分类和概率数据,并将其与标准的单问题群体智慧方法以及现有的两个贝叶斯层次模型进行了比较。GPWM和现有的贝叶斯层次聚合模型之间的区别在于,现有的贝叶斯层次聚合模型将正确答案与共识联系起来,而GPWM则不做这个假设。现有的模型假设共识是正确答案,而GPWM允许多数信号在所有问题上都是错误的可能性。即使在这种极端情况下,GPWM原则上也可以恢复正确答案,因为人们对其他人的预测提供了关于正确信号的概率的额外信息。此外,现有的贝叶斯层次聚合模型依赖于学习受访者级别的参数,而GPWM可以使用关于他人的预测来推断问题级别的潜在参数,从而获得正确答案,而无需在多个问题上学习个体受访者的信息。

    • 预测回答真的比例(即预测别人的预测)在GPWM模型中起到了重要的作用。根据论文中的信息,预测回答真的比例可以帮助揭示参与者对信息的共享程度以及谁拥有不被广泛共享的信息的信念。如果理性的参与者在预测自己处于少数派的情况下仍然给出特定的判断,那么这表明他们相信自己拥有不被广泛共享的知识或洞察力。通过比较投票预测和实际投票,可以帮助了解参与者对信息在群体中的普遍程度以及谁拥有不被广泛共享的信息的信念。此外,预测回答真的比例还可以帮助确定在不同可能的世界状态下,群体投票的分布情况。这对于正确解释群体中投票分布是必要的,因为仅仅知道群体中70%的人投票“是”并不能得出最佳答案是“是”,还需要知道在不同可能的世界状态下群体会如何投票。因此,预测回答真的比例在模型中有助于获取关于群体中投票分布的信息,从而提高群体智慧的准确性和可靠性。

  • 作者在实验中采用了多个研究来评估模型的性能。根据论文中的信息,其中三个研究是关于美国州首府的问题,参与者需要判断每个问题的答案是真还是假,并预测回答真的比例。这三个研究分别在麻省理工学院和普林斯顿大学的实验室中进行。另外两个研究是关于20世纪艺术品市场价格的问题,一个研究中参与者是艺术专业人士,主要是画廊所有者,另一个研究中参与者是没有学习过艺术或艺术史课程的研究生。参与者需要判断90件20世纪艺术品的市场价格,并将其分为两个价格范围:低于30,000美元和高于30,000美元。在这些研究中,参与者除了回答问题和预测比例外,还需要给出他们的自信度。具体的实验协议和数据分析细节可以在论文的在线附录中找到。

推荐文章2

● 题目:Comparing Sequential Forecasters 

比较序列时间预测者

● 期刊:Operations Research

 原文链接:https://doi.org/10.1287/opre.2021.0792

 发表日期:October 17, 2023

● 作者:Yo Joong Choe, Aaditya Ramdas

● 关键词

◦ anytime valid sequential inference 任意时间有效的序贯推理

◦ confidence sequences 信心序列

◦ e-processes e-过程

◦ forecast evaluation 预测评估

◦ nonparametric statistics 非参数统计

● 主要内容

◦ 本文的背景是关于预测能力比较的问题。文章指出,尽管预测在各个领域中非常普遍,但在如何正式比较不同预测者的预测能力方面并不明显,特别是在预测者针对一系列结果进行预测的顺序设置中。例如,文章提到了2019年世界大赛每场比赛的概率预测,但我们不清楚如何有效地建模随时间变化的棒球比赛结果,并且对于每个预测者如何得出预测也没有完整的信息。文章通过观察这些预测和结果的过程,使用置信区间序列来评估预测者之间的差异,并量化这种差异是否可以归因于偶然或运气。这种评估方法不需要对现实或预测方法做出假设。

◦ 本文设计了一种新颖的顺序推断程序,用于估计预测分数的时变差异。这些程序使用了连续监测的置信区间序列,这些序列在任意数据相关的停止时间点上都是有效的。置信区间的宽度是根据分数差异的底层方差自适应调整的。这些程序的构建基于博弈论统计框架,进一步识别了用于顺序检验弱零假设的e-processes和p-processes,即一个预测者在平均情况下是否优于另一个预测者。这些方法不对预测或结果做分布假设;主要定理适用于任何有界分数,而后续提供了针对无界分数的替代方法。

  •   本文的模型主要是基于预测得分的差异来评估预测者的能力。模型定义了点预测得分差异和其经验估计。通过计算累积的差异和,可以构建一个鞅(martingale)。对于所有的时间点,通过构建指数测试超鞅(exponential test supermartingales),可以对累积的差异和进行统一且非渐近的界定,从而完成估计和覆盖。

  • 停止时间的概念在本文中涉及是因为我们希望能够在任意数据依赖的停止时间上进行有效的推断和比较不同预测者的预测能力。在预测任务中,我们通常会在一定的时间范围内观察预测者的预测和实际结果。停止时间是指我们选择观察预测者的预测和实际结果的时间点。通过引入停止时间的概念,我们可以更准确地评估预测者的预测能力,并进行比较。这种方法可以避免在固定时间点上进行比较时可能出现的偏差和误导。因此,停止时间的概念在本文中起到了关键的作用。

本文使用真实数据进行了实证验证。在棒球方面,研究者比较了不同预测者对2019年世界大赛每场比赛的概率预测。在天气预报方面,研究者比较了不同预测者使用统计后处理方法的集合天气预报。此外,研究者还在模拟数据上验证了他们的方法,并与固定时间和渐近置信区间进行了比较。

推荐文章3

● 题目:Distributionally Robust Optimization Under Distorted Expectations 

在扭曲期望下的分布式鲁棒优化

● 期刊:Operations Research

 原文链接:https://doi.org/10.1287/opre.2020.0685

 发表日期:October 10, 2023

 作者:Jun Cai, Jonathan Yu-Meng Li, Tiantian Mao

● 关键词

◦ distributionally robust optimization 分布式鲁棒优化

◦ distortion risk measure 扭曲的风险度量

◦ convex risk measure 凸风险度量

◦ convex envelope 凸包

● 主要内容

◦ 本文的是关于分布鲁棒优化(Distributionally Robust Optimization,DRO)在处理决策优化中的分布不确定性问题的重要范式。在决策者不是风险中性的情况下,DRO中最常用的方案是使用期望效用函数来捕捉风险态度。然而,本文提出了一种替代方案,即使用双重期望效用(dual expected utility)来处理决策者的风险态度。在这种方案中,通过应用畸变函数将物理概率转化为主观概率,从而得到一个被称为畸变期望的结果,该畸变期望能够捕捉决策者的风险态度。与期望效用函数线性地依赖概率不同,在双重方案中,畸变期望通常是概率的非线性函数。

◦ 扭曲期望是一种模拟决策者风险态度的方法。与线性依赖概率的期望效用函数不同,在扭曲期望的方案中,扭曲期望通常是概率的非线性函数。这种非线性性质使得扭曲期望能够更灵活地捕捉决策者的风险态度,包括对极端结果的过度权重或偏好。这个扭曲函数是一个非递减函数,并且满足一些特定的条件。在实践中,常用的扭曲函数包括累积概率理论中的反S形扭曲函数。通过使用扭曲期望来模拟决策者的风险态度,我们可以更准确地在决策优化中反映决策者对不确定性的态度。

◦ 本文强调了基于扭曲期望构建的分布鲁棒优化问题的计算可行性,并且表明在许多情况下,可以通过求解基于某个凸扭曲函数构建的替代分布鲁棒优化问题来解决这个问题,后者通常可以通过凸优化技术来精确或近似地求解。本文的DRDRO框架的可行性是建立在分析的基础上的,该分析表明,当根据基于矩的模糊集绘制的最坏情况分布进行评估时,具有非凸扭曲函数的扭曲期望总是给出与其凸对应物等价的风险评估。此外,本文还提供了一个必要条件,用于判断模糊集合是否满足这种等价性。值得注意的是,本文还提到了对于其他类型的模糊集,如基于距离的模糊集,是否可以获得类似的等价结果,这是一个自然的问题。

◦ 数值实验的结果显示,当决策者在面对分布不确定性时过度关注极端结果时,最优决策会变得更加风险规避,并且随着对极端结果的权重增加,决策者试图对冲的最坏情况分布也会发生变化。数值实验还展示了使用扭曲期望来进行决策时的一些情况。具体来说,数值实验使用了逆S形扭曲函数,并应用于一个具体的案例,该案例涉及到运输成本的不确定性。数值实验中使用的数据来源是根据论文中提供的信息进行的模拟。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/219118.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java、PHP、C语言经典项目源码合集推荐(一)

(一).Java智慧校园系统源码、 智慧学校源码、 智慧校园平台源码、智慧校园电子班牌系统源码、中小学智慧校园系统源码、 原生微信小程序端源码、电子班牌系统源码 项目技术栈 1、使用springboot框架Javavue2 2、数据库MySQL5.7 3、移动端小程序使用小程…

基于springboot实现智慧党建系统项目【项目源码】

基于springboot实现智慧党建系统演示 Java技术 Java是由Sun公司推出的一门跨平台的面向对象的程序设计语言。因为Java 技术具有卓越的通用性、高效性、健壮的安全性和平台移植性的特点,而且Java是开源的,拥有全世界最大的开发者专业社群,所以…

GIT版本控制和常用命令使用介绍

GIT版本控制和常用命令使用介绍 1. 版本控制1.1 历史背景1.2 什么是版本控制1.3 常见版本控制工具1.4 版本控制的分类 2 Git介绍2.1 Git 工作流程2.2 基本概念2.3 文件的四种状态2.4 忽略文件2.5 Git命令2.5.1 查看本地git配置命令2.5.2 远程库信息查看命令2.5.3 分支交互命令2…

适用于 Mac 和 Windows 的顶级U 盘数据恢复软件

由于意外删除或设备故障而丢失 USB 驱动器中的数据始终是一件令人压力很大的事情,检索该信息的最佳选择是使用优质数据恢复软件。为了让事情变得更容易,我们已经为您完成了所有研究并测试了工具,并且我们列出了最好的 USB 记忆棒恢复软件&…

零基础学Linux内核:1、Linux源码组织架构

文章目录 前言一、Linux内核的特征二、Linux操作系统结构1.Linux在系统中的位置2.Linux内核的主要子系统3、Linux系统主要数据结构 三、linux内核源码组织1、下载Linux源码2、Linux版本号3、linux源码架构目录讲解 前言 这里将是我们从零开始学习Linux的第一节,这节…

大量索引场景下 Easysearch 和 Elasticsearch 的吞吐量差异

最近有客户在使用 Elasticsearch 搜索服务时发现集群有掉节点,并且有 master 收集节点信息超时的日志,节点的负载也很高,不只是 data 节点,master 和协调节点的 cpu 使用率都很高,看现象集群似乎遇到了性能瓶颈。 查看…

3、MSF使用

文章目录 一、利用ms17-010漏洞对靶机执行溢出攻击二、后渗透模块meterpreter的使用 一、利用ms17-010漏洞对靶机执行溢出攻击 分别输入以下命令,使用ms17_010_eternalblue模块对目标机的ms17-010漏洞进行利用: use exploit/windows/smb/ms17_010_eter…

iar如何全擦芯片内存

Project ->Download -> Erase memory

【理解ARM架构】 散列文件 | 重定位

🐱作者:一只大喵咪1201 🐱专栏:《理解ARM架构》 🔥格言:你只管努力,剩下的交给时间! 目录 🏓引出重定位🏓散列文件🏓可读可写数据段重定位&#…

QXDM Filter使用指南

QXDM Filter使用指南 1. QXDM简介2 如何制作和导入Filter2.1 制作Filter2.1.1 制作Windows环境下Filter2.1.2 制作Linux环境下Filter 2.2 Windows环境下导入Filter 3 Filter配置3.1 注册拨号问题3.1.1 LOG Packets(OTA)3.1.2 LOG Packets3.1.3 Event Reports3.1.4 Message Pack…

【开源】基于Vue和SpringBoot的木马文件检测系统

项目编号: S 041 ,文末获取源码。 \color{red}{项目编号:S041,文末获取源码。} 项目编号:S041,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 木马分类模块2.3 木…

【算法萌新闯力扣】:卡牌分组

力扣热题:卡牌分组 一、开篇 今天是备战蓝桥杯的第22天。这道题触及到我好几个知识盲区,以前欠下的债这道题一并补齐,哈希表的遍历、最大公约数与最小公倍数,如果你还没掌握,这道题练起来! 二、题目链接:…