算法导论复习——CHP16 贪心算法

定义

        每一步都做出当前看来最优的操作。

问题引入——活动选择问题

         问题描述

        活动选择问题就是对给定的包含n个活动的集合S,在已知每个活动开始时间和结束时间的条件下,从中选出最多可兼容活动的子集合,称为最大兼容活动集合。 不失一般性,设活动已经按照结束时间单调递增排序。

        分析

                这个问题具有最优子结构,可以用动态规划,但用贪心复杂度更低。

                实际上,任何一个可以用贪心解决的问题都可以用动态规划解决。 

                这里的贪心策略为:每次都选择能选择的活动中结束时间最早的活动。

        证明贪心正确性:

                感性上,这样做可以为后面留出最多的时间。

                严格证明,只需证明如下定理:

        考虑任意非空子问题S_k,令a_mS_k中结束时间最早的活动,则a_m必在S_k的某个最大兼容活动子集中。

        证明:

                设A_kS_k的一个最大兼容活动子集,A_k中最早结束的活动为a_j

                若a_j = a_m,则成立。

                若a_j \neq a_m,则设A^{'} = A_k-\{a_m\}\cup \{a_j\},由于A_k中活动兼容,有a_m结束时间比A_k中最早的还早,故A^{'}也是S_k的一个兼容活动子集,又|A_k| =|A^{'}|,故A^{'}也是S_k的一个最大兼容活动子集,故a_mS_k的某个最大兼容活动子集中,也成立。

                证毕。

        实现

                自顶向下

                

                自底向上

                

总结——贪心算法的一般步骤 

        1)确定问题的最优子结构; 

        2)将最优化问题转化为这样的形式:每次对其作出选择后,只剩下一个子问题需要求解;

        3)证明作出贪心选择后,剩余的子问题满足:其最优子解与前面的贪心选择组合即可得到原问题的最优解(具有最优子结构)。 

总结——证明贪心算法正确性

        贪心选择性质最优子结构性是两个关键要素。

        贪心选择性质:可以通过做出局部最优(贪心)选择来构造全局最优解的性质。

        贪心选择性质使得我们进行选择时,只需做出当前看起来最优的选择,而不用考虑子问题的解。

例子——Huffman编码

        Huffman算法

                从 |C| 个叶子结点开始,每次选择频率最低的两个结点合并,将得到的新结点加入集合继续合并,这样执行 |C|-1次 “合并” 后即可构造出一棵编码树——Huffman树。

                (采用以freq为关键字的最小优先队列Q,提取两个最低频率的对象将之合并。) 

                时间复杂度分析

                假设Q使用最小二叉堆实现,则:

                首先,Q的初始化时间复杂度O(n)。

                其次,循环的总代价是O(nlgn):for循环共执行了n-1次,每次从堆中找出当前频率最小的两个结点及把合并得到的新结点插入到堆中均花费O(lgn),所以循环的总代价是O(nlgn)。

                总时间复杂度O(nlgn)。 

                正确性证明

                首先,可以发现,一个最优字符编码方案总对应一棵满 (full) 二叉树, 即每个非叶子结点都有两个孩子结点。

                引理1

                令C为一个字母表,其中每个字符 c∈C 都有一个频率 c.freq。 令 x 和 y 是C中频率最低的两个字符。那么存在C的一个最优前缀码,x和y的码字长度相同,且只有最后一个二进制位不同。

 证:        

                令T是一个最优前缀码所对应的编码树,a和b是T中深度最大的兄弟叶结点。 不失一般性,假设 a.freq ≤ b.freq 且 x.freq ≤ y.freq。

                由于x和y是叶结点中频率最低的两个结点,所以应有 x.freq ≤ a.freq 且y.freq ≤ b.freq。

                若 x.freq = b.freq,则有a.freq = b.freq = x.freq = y.freq,此时引理成立。

                若 x.freq ≠ b.freq,即 x≠ b。则在T中交换 x 和 a,生成一棵 新树T’ ;然后再在T’中交换 b和y,生成另一棵新树T” ,那么在T”中x和y是深度最深的两个兄弟结点

                计算代价差:

                

                同理有B(T')\ge B(T'') 

                因此B(T'')\le B(T),又B(T)为最优编码,故B(T'') = B(T)

                即得证:T” 也是最优解,且 x 和 y 是其中深度最大的两个兄弟结点,x和y的码字长度相同,且只有最后一个二进制位不同。

                引理2

                令C为一个给定的字母表,其中每个字符c∈C都有一 个频率c.freq。x和y是C中频率最低的两个字符。

                令C'为C去掉字符x和y,并加入一个新字符z后得到的字母表, 即C' = C - {x, y}∪{z},z.freq= x.freq + y.freq。 令T'为字母表C'的任意一个最优前缀码对应的编码树。

                则有:可以将T'中叶子结点 z 替换为一个以x和y为孩子的内部结点,得到树T,而T表示字母表C的一个最优前缀码。

                由引理1、2可得Huffman算法的正确性。 

        

                 

                

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/325734.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023年12月 C/C++(一级)真题解析#中国电子学会#全国青少年软件编程等级考试

C/C++编程(1~8级)全部真题・点这里 第1题:数的输入和输出 输入一个整数和双精度浮点数,先将浮点数保留2位小数输出,然后输出整数。 时间限制:1000 内存限制:65536 输入 一行两个数,分别为整数N(不超过整型范围),双精度浮点数F,以一个空格分开。 输出 一行两个数,分…

Huggy Lingo: 利用机器学习改进 Hugging Face Hub 上的语言元数据

太长不看版: Hub 上有不少数据集没有语言元数据,我们用机器学习来检测其语言,并使用 librarian-bots 自动向这些数据集提 PR 以添加其语言元数据。 Hugging Face Hub 已成为社区共享机器学习模型、数据集以及应用的存储库。随着 Hub 上的数据集越来越多&…

Redis第四讲——Redis的数据库结构、删除策略及淘汰策略

一、redis中的数据库 redis服务器将所有数据库都保存在服务器状态redis.h/redisServer结构的db数组中。db数组的每项都是一个redis.h/redisDb结构,而每个redisDb结构就代表一个数据库。在初始化服务器时,程序会根据服务器状态的dbnum属性来决定应该创建多…

【userfaultfd 条件竞争】starCTF2019 - hackme

前言 呜呜呜,这题不难,但是差不多一个多月没碰我的女朋友 kernel pwn 了,对我的 root 宝宝也是非常想念,可惜这题没有找到我的 root 宝宝,就偷了她的 flag。 哎有点生疏了,这题没看出来堆溢出&#xff0c…

《微机原理与应用》期末考试题库(附答案解析)

第1章 微型计算机概述 1.微型计算机的硬件系统包括___A _____。 A.控制器、运算器、存储器和输入输出设备 B.控制器、主机、键盘和显示器 C.主机、电源、CPU和输入输出 D.CPU、键盘、显示器和打印机 2.微处…

对Git的理解

1.Git介绍 Git 是一个免费的、开源的分布式版本控制系统,可以快速高效地处理从小型到大型的各种 项目。 2.版本控制 简单来说,就是记录文件的内容变化,记录下你每一次对文件的修改的版本,以免你改来改去想要回退到之前的版本的时…

STM32学习笔记二十一:WS2812制作像素游戏屏-飞行射击游戏(11)探索游戏脚本

还记得上次在第十七章中为BOSS创建的路径动画吧。我们写了一大坨的代码来描述BOSS的运动路径,但凡是写过几年代码的人都不会干出这样的事情。-_-! 没办法,谁叫那时候还没有脚本呢。这章就来补齐这块短板。 脚本属于配置化的一种,你可以把脚…

罗德与施瓦茨FSVA40信号和频谱分析仪

罗德与施瓦茨FSVA40是一款功能信号和频谱分析仪,适用于从事射频系统的开发、生产、安装和服务的用户。FSVA40信号和频谱分析仪系列始终提供最佳的价格和性能组合,无论是根据最新通信标准测试生产中的无线设备,还是测量低相位噪声、高灵敏度和…

QT翻金币

QT翻金币 在B站跟着视频进行QT学习&#xff0c;现把代码全部贴上来&#xff0c;备忘 整体解决方案文件结构如下&#xff1a; chooselevelscene.h #ifndef CHOOSELEVELSCENE_H #define CHOOSELEVELSCENE_H#include <QMainWindow> #include"playscene.h"class…

Hive实战:分科汇总求月考平均分

文章目录 一、实战概述二、提出任务三、完成任务&#xff08;一&#xff09;准备数据1、在虚拟机上创建文本文件2、上传文件到HDFS指定目录 &#xff08;二&#xff09;实现步骤1、启动Hive Metastore服务2、启动Hive客户端3、创建分区的学生成绩表4、按分区加载数据5、查看分区…

域名流量被劫持怎么办?如何避免域名流量劫持?

随着互联网不断发展&#xff0c;流量成为线上世界的巨大财富。然而一种叫做域名流量劫持的网络攻击&#xff0c;将会在不经授权的情况下控制或重定向一个域名的DNS记录&#xff0c;导致用户在访问一个网站时&#xff0c;被引导到另一个不相关的网站&#xff0c;从而劫持走原网站…

Git 命令大全:解锁代码版本控制的神奇秘密!

Git 命令大全&#xff1a;解锁代码版本控制的神奇秘密&#xff01; 以下是备忘单中的所有命令&#xff1a; 设置 设置将附加到提交和标记的名称和电子邮件 $ git config --global user.name "Danny Adams"$ git config --global user.email "myemailgmail.c…