博弈论——动态博弈

动态博弈

0 引言

前面一篇文章介绍了博弈过程中的三个分类:静态博弈、动态博弈、重复博弈。今天具体讲讲动态博弈的处理方法。
博弈论——博弈过程

1 概念

首先还是介绍一下动态博弈的概念,即博弈中各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方决策行为之前可以看到其他博弈方的决策行为,甚至包括双方的交替选择和行动。这种博弈无论哪种意义上都无法看作同时决策的静态博弈,我们称为“动态博弈”( dynamic games)、“多阶段博弈”(multistage games)或者“序列博弈(sequential games)”。根据例子可以更好地理解动态博弈,如下象棋就是典型的动态博弈,两位棋手在规则之内交替移动棋子,并且这个过程中,双方都可以看到对方的决策行为,又比如斯塔克尔伯格博弈中,领导者先做决策,追随者后做决策,也是一个动态过程。
动态博弈中,博弈方的选择有先后次序,通常将一个博弈方的一次选择称为一个“阶段”(stage)。动态博弈中也可能存在几个博弈方同时选择的情况,此时这些博弈方的同时选择构成一个阶段。一个动态博弈至少由两个阶段构成,所以动态博弈也被称为多阶段博弈。

2 动态博弈表示方法——扩展形

扩展形是一种简单明了的用于表示动态博弈的方法,该方法类似于树状图的结构,通过选择节点、从选择节点出发代表可能选择的线段,以及终端处得益数组三个要素来表示动态博弈。因为扩展形可以反映动态博弈中博弈方的选择次序和博弈阶段,是动态博弈的最佳表示方法。
下面举一个例子来进一步介绍扩展形:
以开金矿博弈为例:甲开采一个价值四千万元的金矿时缺一千万资金,而乙正好有一千万闲置资金。甲想说服乙将资金借给自己开矿,许诺采到金子后双方对半分成。乙是否应该同意借钱?假设金矿价值经过权威部门探测确认且开采技术和销路都有保障,乙需要担心的只是甲采到金子后是否会履行诺言跟自己平分,还是会卷款潜逃。
我们用扩展形来表示这个博弈:最上面的圆圈表示乙的选择信息集,乙在此处有“借”和“不借”两种选择。乙选择“不借”则博弈结束,他能保住一千万元本钱,而甲得不到开矿利润,乙选择“借”则到达甲的选择信息集,轮到甲进行选择。甲可以选择“分”或“不分”。“分”则皆大欢喜,甲得两千万元开矿利润,乙的一千万元本钱增值成两千万元。若甲选择“不分”可以独吞四千万元,乙则血本无归。图中3个终端黑点处的数组表示两博弈方依次选择到达这些终端的“路径”实现的双方得益,其中第一个数字是乙的得益、第二个数字是甲的得益。
在这里插入图片描述

3 动态博弈特点

动态博弈主要有两个基本特点:
第一个特点在前面已经提到过,在动态博弈中,各个博弈方的选择和行为不仅有先后之分,还可能有多次,而且多次行为之间有内在联系,比如下象棋,每一位棋手在移动棋子的时候都会看到全局的棋子分布以及对方的行为选择。动态博弈中博弈方选择的不是博弈方在单个阶段的行为,而是在整个博弈中轮到选择的每个阶段,针对前面阶段的各种情况作相应选择的完整计划。动态博弈中博弈方的“策略"就是指这种计划。
第二个特点是非对称性。由于动态博弈中,博弈方的选择行为有先后次序且后行为者能观察到先行为博弈方的行为。先行为博弈方可能拥有先行的主动权,这是一种先行优势;后行为博弈方则可以相机作针对性的选择,而且有更多信息帮助选择行为,可能有后发制人的优势。动态博弈中究竟是先行有利还是后行有利并不确定,要根据具体博弈环境、利益关系决定。可以肯定的是,动态博弈的博弈方之间通常存在形势利益的某种不对称性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/130481.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jmeter排查正则表达式提取器未生效问题

今天在使用Jmeter的时候遇到一个很简单的问题,使用正则表达式提取token一直未生效,原因是正则表达式中多了一个空格。虽然问题很简单,但是觉得排查问题的方法很普适,所以记录下,也希望能够给遇到问题的大家一个参考。 …

归并排序递归方法和非递归方法详解

文章目录 归并排序递归方法和非递归方法详解1、归并排序(递归)1.1、归并排序思想(递归)1.2、排序过程(递归)图解1.3、归并排序(递归)代码 2、归并排序(非递归&#xff09…

论文解析——AMD EPYC和Ryzen处理器系列的开创性的chiplet技术和设计

ISCA 2021 摘要 本文详细解释了推动AMD使用chiplet技术的挑战,产品开发的技术方案,以及如何将chiplet技术从单处理器扩展到多个产品系列。 正文 这些年在将SoC划分成多个die方面有一系列研究,MCM的概念也在不断更新,AMD吸收了…

Golang--channel+waitGroup控制并发量

文章目录 channelwaitGroup控制并发量前言示例 channelwaitGroup控制并发量 前言 golang的goroutine非常轻量级,同时启动数万协程都没问题。如果不对并发量进行控制,比如同时产生数百万的协程,会压垮服务器通过控制channel缓冲区的大小&…

mac(M1)卸载miniconda3

参考https://stackoverflow.com/questions/29596350/how-to-uninstall-mini-conda-python step1 因为我目前只有一个base环境,所以直接在这个环境中安装 anaconda-clean即可 conda install anaconda-clean然后继续输入 anaconda-clean如果不加–yes,那…

el-table进阶(每条数据分行或合并)

最麻烦的还是css样式&#xff0c;表格样式自己调吧 <!-- ——————————————————————————————————根据数据拓展表格—————————————————————————————————— --> <div style"display: flex"&…

Multi-Grade Deep Learning for Partial Differential Equations

论文阅读&#xff1a;Multi-Grade Deep Learning for Partial Differential Equations with Applications to the Burgers Equation Multi-Grade Deep Learning for Partial Differential Equations with Applications to the Burgers Equation符号定义偏微分方程定义FNN定义PI…

Android:自定义原生TimePickerDialog样式

效果图&#xff1a; 目标效果图&#xff1a; 原生效果&#xff1a; 实现&#xff1a; 首先是Dialog样式&#xff1a; <style name"TimePickerDialogStyle" parent"style/Theme.AppCompat.DayNight.Dialog.Alert"><item name"android:time…

Stretched mesh

https://www.particleincell.com/2015/stretched-mesh/

JavaScript入门——(5)函数

1、为什么需要函数 函数&#xff1a;function&#xff0c;是被设计为执行特定任务的代码块 说明&#xff1a;函数可以把具有相同或相似逻辑的代码“包裹”起来&#xff0c;通过函数调用执行这些被“包裹”的代码逻辑&#xff0c;有利于精简代码方便复用。 比如之前使用的ale…

大运新能源天津车展深度诠释品牌魅力 为都市人群打造理想车型

如今&#xff0c;新能源汽车行业发展潜力巨大&#xff0c;不断吸引无数车企入驻新能源汽车赛道&#xff0c;而赛道的持续紧缩也让一部分车企很难找到突破重围的机会。秉持几十年的造车经验&#xff0c;大运新能源凭借雄厚的品牌实力从一众车企中脱颖而出。从摩托车到重卡&#…

ThreeJS-3D教学五-材质

我们在ThreeJS-3D教学二&#xff1a;基础形状展示中有简单介绍过一些常用的材质&#xff0c;这次我们举例来具体看下效果&#xff1a; 代码是这样的&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8">&…