【优化数学模型】2. 动态规划DP方法的求解思路

在这里插入图片描述

【优化数学模型】2. 动态规划DP方法的求解思路

  • 一、动态规划
    • 1. 概述
    • 2. 最优性原理
    • 3. 最优子结构特性
  • 二、示例:0-1背包问题
    • 1. 问题描述
    • 2. 使用自顶向下的方法
    • 3. 使用自下而上的方法


一、动态规划

1. 概述

多阶段决策问题,就是要在允许的决策范围内,选择一个最优决策使整个系统在预定标准下达到最佳效果。

动态规划 (dynamic programming,DP) 是用来解决多阶段决策过程最优化的一种数量方法。其特点在于,它可以把一个n维决策问题变换为几个一维最优化问题,从而一个一个地去解决。

与分而治之技术的不同之处在于,动态规划解决方案中的子问题是重叠的,因此解决一个子问题所需的一些相同步骤也需要用于其他子问题。

许多文章中提到动态规划会将其称为是一种经典的算法,需要指出的是,动态规划是1951年,美国数学家贝尔曼等人根据一类多阶段决策问题特性提出的解决这类问题的“最优化原理”,是其创建出的最优化问题的一种新思路,是求解一类问题的一种方法,是考察问题的一种途径,而不是一种算法。

在解决相应问题时,必须对具体问题进行具体分析,运用动态规划的原理和方法,建立相应的模型,然后再用动态规划方法去求解。

在这里插入图片描述

2. 最优性原理

应用动态规划设计使多阶段决策过程达到最优(成本最省、效益最高、路径最短等),依据动态规划的最优性原理:“作为整个过程的最优策略具有这样的性质,无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略”。也就是说,最优决策序列中的任何子序列都是最优的。

3. 最优子结构特性

最优性原理体现为问题的最优子结构特性。当一个问题的最优解中包含了子问题的最优解时,则称该问题具有最优子结构特性。最优子结构特性使得在从较小问题的解构造较大问题的解时,只需考虑子问题的最优解,从而大大减少了求解问题的计算量。

二、示例:0-1背包问题

1. 问题描述

0-1背包问题是应用动态规划设计求解的典型案例。

已知有 N 种物品和一个可容纳 W 重量的背包,物品 i 的重量为 w i w_i wi ,产生的效益为 p i p_i pi 。在装包时物品 i 可以装入,也可以不装,但不可拆开装。即物品 i可产生的效益为 x i p i x_ip_i xipi 。这里 x i x_i xi∈{0,1}, c, w i w_i wi , p i p_i pi∈ N+。

示例:
在这里插入图片描述

2. 使用自顶向下的方法

  • 一般使用一个数组或者一个哈希map充当这个备忘录。
  • 声明函数,并将项目、容量、临时字典和当前索引作为参数。
  • 如果小于 0、小于 0或大于列表长度,则返回 0.
  • 否则,如果总重量小于容量,则创建两个利润,用于检查相邻项目。这可以通过使用不同参数递归调用函数来实现。
  • 将这两个利润中的最大值分配给字典的当前元素。 将字典中的该值作为输出返回。
class Item:def __init__(self, profit, weight):self.profit = profitself.weight = weightdef zeroKnapsack(items, capacity, currentIndex, tempDict):dictKey = str(currentIndex) + str(capacity)if capacity <= 0 or currentIndex < 0 or currentIndex >= len(items):return 0elif dictKey in tempDict:return tempDict[currentIndex]elif items[currentIndex].weight <= capacity:profit1 = items[currentIndex].profit + zeroKnapsack(items, capacity-items[currentIndex].weight, currentIndex+1, tempDict)profit2 = zeroKnapsack(items, capacity, currentIndex+1, tempDict)tempDict[dictKey] = max(profit1, profit2)return tempDict[dictKey]else:return 0mango = Item(31, 3)
apple = Item(26, 1)
orange = Item(17, 2)
banana = Item(72, 5)items = [mango, apple, orange, banana]print(zeroKnapsack(items, 7, 0, {}))

3. 使用自下而上的方法

  • 声明函数,并将利润、物品权重和背包容量作为参数。
  • 如果容量小于 0,利润长度等于 0,或者利润长度和权重不一致,则返回 0。
  • 创建变量:迭代行数和容量,初始化的值为 0。
  • 创建两个变量用于存储利润。只要权重不超过容量,就存储矩阵中每一行和每一列的值。
  • 重复上述过程,并返回两个变量的最大值作为输出。
class Item:def __init__(self, profit, weight):self.profit = profitself.weight = weightdef zoKnapsackBU(profits, weights, capacity):if capacity <= 0 or len(profits) == 0 or len(weights) != len(profits):return 0numberOfRows = len(profits) + 1dp = [[None for i in range(capacity+2)] for j in range(numberOfRows)]for i in range(numberOfRows):dp[i][0] = 0for i in range(capacity+1):dp[numberOfRows-1][i] = 0for row in range(numberOfRows-2, -1, -1):for column in range(1, capacity+1):profit1 = 0profit2 = 0if weights[row] <= column:profit1 = profits[row] + dp[row + 1][column - weights[row]]profit2 = dp[row + 1][column]dp[row][column] = max(profit1, profit2)return dp[0][capacity]profits = [31, 26, 17, 72]
weights = [3, 1, 2, 5]print(zoKnapsackBU(profits, weights, 7))

最大利润是通过以下组合实现的:

Apple(W: 1, P: 26) + Banana(W: 5, P: 72) = W: 6, P: 98


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/472684.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电子元器件基础5---二极管

除了电阻、电容和电感等线性元器件之外,还有二极管、三极管这些常用的非线性器件广泛应用于日常生活中。那么今天我们来介绍以下二极管这一常用的电子元器件。 一、二极管概念 二极管是用半导体材料(硅、硒、锗等)制成的一种电子器件 。二极管有两个电极,正极,又叫阳极;负…

沐编程APP免费下载|获取免费项目以及技术教程

软件介绍 沐编程专注于分享IT编程相关知识的网站&#xff0c;主要分享毕业设计案例代码&#xff0c;课程设计案例代码&#xff0c;实用功能代码&#xff0c;bug解决方案&#xff0c;编程工具推荐以及编程课程分享等 下载方式 蓝奏云下载&#xff1a;https://wfr.lanzout.com…

C语言学习day15:数组强化训练

题目一&#xff1a; 称体重&#xff1a;分别给10个值&#xff0c;来获得最大值 思路&#xff1a; 定义数组&#xff0c;给数组内赋10个值第一个下标的值与第二个下标的值进行比较定义max&#xff0c;将比较得来的较大的值赋值给max一直比较直到比较到最后一个下标&#xff0…

回溯题中借助哈希法来巧妙去重的操作

今天总结一下回溯法以来做过的这些题&#xff0c;我又发现一个困扰了我的问题&#xff0c;就是在491. 非递减子序列、46. 全排列、47. 全排列 II中都有涉及到用哈希法&#xff0c;去记录曾经用过的元素&#xff0c;下面来总结一下吧。 首先得知道&#xff0c;为什么会用到哈希法…

BulingBuling - 《研究巴菲特》 [ Buffettology ]

研究巴菲特 使沃伦-巴菲特成为世界上最著名的投资者的那些以前未曾解释过的技术 作者&#xff1a;玛丽-巴菲特 Buffettology The Previously Unexplained Techniques That Have Made Warren Buffett The Worlds Most Famous Investor By Mary Buffett 内容提要 《Buffetto…

机器学习中7种常用的线性降维技术总结

上篇文章中我们主要总结了非线性的降维技术&#xff0c;本文我们来总结一下常见的线性降维技术。 1、Principal Component Analysis (PCA) Principal Component Analysis (PCA) 是一种常用的降维技术&#xff0c;用于将高维数据集转换为低维表示&#xff0c;同时保留数据集的…

如何打开Windows 10及更低版本系统的控制面板?这里提供详细步骤

Windows中的控制面板是一组小程序,有点像小程序,可以用来配置操作系统的各个方面。 例如,“控制面板”中的一个小程序允许你配置鼠标指针的大小(以及其他内容),而另一个则允许你调整所有与声音相关的设置。 其他小程序可用于更改网络设置、设置存储空间、管理显示设置等…

什么是位段?位段的作用是什么?他与结构体有什么关系?

目录 1.什么是位段&#xff1f; 2.位段的内存分配 判断当前机器位段的内存分配形式 1.什么是位段&#xff1f; 位段的声明和结构是类似的&#xff0c;有两个不同&#xff1a; 1.位段的成员必须是 int、unsigned int 或signed int或char 。 2.位段的成员名后边有一个冒号和…

基于RTOS的嵌入式软件开发与可靠性提升

&#xff08;本文为简单介绍&#xff0c;观点来自网络&#xff09; 随着科技的快速发展&#xff0c;嵌入式系统无所不在&#xff0c;从你的智能手表到汽车的自动驾驶系统&#xff0c;它们都在静静地改变我们的世界。而在这一切的背后&#xff0c;实时操作系统&#xff08;RTOS&…

CTFshow web(文件上传158-161)

web158 知识点&#xff1a; auto_append_file 是 PHP 配置选项之一&#xff0c;在 PHP 脚本执行结束后自动追加执行指定的文件。 当 auto_append_file 配置被设置为一个文件路径时&#xff0c;PHP 将在执行完脚本文件的所有代码后&#xff0c;自动加载并执行指定的文件。 这…

【HarmonyOS】hdc 环境变量设置

hdc&#xff08;HarmonyOS Device Connector&#xff09;是 HarmonyOS 为开发人员提供的用于调试的命令行工具&#xff0c;通过该工具可以在 windows/linux/mac 系统上与真实设备或者模拟器进行交互。 hdc 工具通过 HarmonyOS SDK 获取&#xff0c;存放于 /Huawei/Sdk/openhar…

网络原理-TCP_IP(6)

网络层 在复杂的网络环境中确定一个合适的路径. IP协议 与TCP协议并列,都是网络体系中最核心的协议. 基本概念 主机:配有IP地址,但是不进行路由控制的设备; 路由器:即配有IP地址,又能进行路由控制; 节点:主机和路由器的统称; 协议头格式 4位版本号(version):指定IP协议的版…