机器学习之——决策树信息增益比计算[附加计算程序]

news/2024/9/20 23:44:11/文章来源:https://www.cnblogs.com/hello-nullptr/p/18393486

0 前言

  • 本文主要介绍决策树信息增益比的计算,并给出例子帮助读者理解。
  • 读者需要具备:信息熵、条件熵、信息增益 相关知识。
  • 本文使用数据集:游玩数据集 1.1节。

1 信息增益比计算公式

image

2 信息增益比计算

2.1 gR(play,outlook)的计算

根据信息增益(跳转)相关知识,得出:

  • 特征outlook对数据集D的信息增益g(D,outlook)就等同于g(play,outlook),这里play是最终分类的属性。
    先计算分子:g(play,outlook),有如下计算过程:
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403
    H(play|outlook)=(4.0/14)* 0.0000+(5.0/14)* 0.9710+(5.0/14)* 0.9710=0.6935
    g(play,outlook)=H(play)-H(play|outlook)=0.9403-0.6935=0.2467
    H(play)的计算方法请参考:信息熵。
    H(play|outlook)的计算方法请参考:条件熵。

  • 根据分母HA(D)的公式,不难看出其就是某个随机变量D的信息熵。
    故有HA(D)等同于H(D),即随机变量D的信息熵,在本例题等同于H(play)。
    计算分母:HA(D)=H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403

  • 计算gR(play,outlook)。
    根据公式gR(play,outlook)=g(play,outlook) / H(play) = 0.2467 / 0.9403=0.2624

2.2 gR(play,temperature)的计算

  • 计算分子g(play,temperature)。
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403
    H(play|temperature)=(4.0/14)* 0.8113+(4.0/14)* 1.0000+(6.0/14)* 0.9183=0.9111
    g(play,temperature)=H(play)-H(play|temperature)=0.9403-0.9111=0.0292

  • 计算分母H(play)。
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403

  • 计算gR(play,temperature)。
    gR(play,temperature)=g(play,temperature) / H(play)=0.0292 / 0.9403=0.0311

3 计算程序

程序

4 结语

如有错误请指正,禁止商用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/791232.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

财务知识-什么是计提

什么是计提计提就是“计算”和“提取”,用通俗的方式来讲就是把一些即将发生却没有实际发生,没有实际支付的出现的一部分,像将他们计算出来,进行提取,计入相关的费用和成本,这样操作后,可以更利于我们了解企业的真实利润。为什么要做计提根据企业会计准则,现在大部分的…

在diff的过程中,什么是就地复用

首先,先简单介绍一下什么是diff,在react或者vue框架中。组件更新时,不会直接去操作DOM,而是首先更新虚拟dom。比如一次更新中,更新了10次数据,那么反应到页面上,就会更新10次dom。这是很浪费性能的,所以虚拟dom就产生了,把10从更新,聚集到一块,统一更新一次虚拟dom,…

浙江省建设人才远程继续教育平台刷课脚本-JavaScript编写

脚本 学习网站:https://zj.zjjsrc.cn/web/web_toUserSignUp.page 脚本地址:浙江省建设人才远程继续教育平台刷课脚本: https://greasyfork.org/zh-CN/scripts/506406-浙江省住房和城乡建设行业专业技术人员继续教育-刷课脚本 教程 1.插件安装(以Microsoft Edge浏览器为例)打…

浙江省住房和城乡建设行业继续教育刷课脚本-JavaScript编写

脚本 学习网站:https://zj.zjjsrc.cn/web/web_toUserSignUp.page 脚本地址:浙江省住房和城乡建设行业专业技术人员继续教育-刷课脚本: https://greasyfork.org/zh-CN/scripts/506406-浙江省住房和城乡建设行业专业技术人员继续教育-刷课脚本 教程 1.插件安装(以Microsoft Ed…

博客园-awescnb插件-geek皮肤优化-表情配置

💖简介 博客园-awescnb插件-geek皮肤下,表情配置及优化 🔗链接官方配置:https://www.yuque.com/awescnb/user/rycpvv#KwRr4官方配置文档在线Emoji:https://tool.itzd.cn/在线获取Emoji表情🔧配置 🌟配置项:emoji字段 类型 描述 默认值enable Boolean 是否启用 true…

CAS简介

CAS定义 CAS,是Compare and Swap的简称,实现并发算法是常用到的一种技术,在这个机制中有三个核心的参数。1.主内存中存放的共享变量的值:V(一般情况下这个V是内存的地址值,通过这个地址可以获得内存中的值)。 2.工作内存中共享变量的副本值,也叫预期值:A。 3.需要将共…

【网络安全 | Java代码审计】Code-Breaking Puzzles-javacon

未经许可,不得转载。源码:https://www.leavesongs.com/media/attachment/2018/11/23/challenge-0.0.1-SNAPSHOT.jar,下载至桌面。 考察知识点:SpEL注入 正文 执行命令运行环境: java -jar C:\Users\86177\Desktop\challenge-0.0.1-SNAPSHOT.jar浏览器访问localhost:8080使…

.NET周刊【9月第1期 2024-09-01】

国内文章 【音视频通话】使用asp.net core 8+vue3 实现高效音视频通话 https://www.cnblogs.com/1996-Chinese-Chen/p/18384394 该文章描述了使用SRS实现音视频通话和共享桌面的经验。从最初使用nginx的RTMP到研究SRS和ZLMediaKit的过程,再到最终实现功能的详细步骤,涵盖了服…

第十讲:怎么给字符串字段加索引?

第十讲:怎么给字符串字段加索引? ​ 现在,几乎所有的系统都支持邮箱登录,如何在邮箱这样的字段上建立合理的索引,是我们今天要讨论的问题。 总概类似邮箱登录系统的长表索引 假设,你现在维护一个支持邮箱登录的系统,用户表是这么定义的: mysql> create table SUser(…

软件工程课程第一次作业

软件工程作业软件工程课程第一次作业这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2024这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2024/homework/13243这个作业的目标 为以后软件工程的学习做准备工作学号 102202156后台博文编辑页面的截图。Lo…

记一次yoga联想电脑黑屏

yoga联想电脑黑屏记一次yoga联想电脑黑屏 下午还好好的,晚上就黑屏了 能开机但是后面就一直黑了网上到处搜半天没搜到合理的解决办法,bios进了,长按电源键20s也试了,之前电脑有一段时间待机一段时间后就会没有wifi,连wifi的设置都没有,后来解决办法是把设备适配器里有一个…