数据仓库作业五:第8章 关联规则挖掘

目录

    • 第8章 关联规则挖掘
      • 作业题


第8章 关联规则挖掘

作业题

1、设4-项集 X = { a , b , c , d } X=\{a,b,c,d\} X={a,b,c,d},试求出由 X X X 导出的所有关联规则。

解:

首先生成项集的所有非空真子集。这包括:
{ a } , { b } , { c } , { d } \{a\},\{b\},\{c\},\{d\} {a},{b},{c},{d}
{ a , b } , { a , c } , { a , d } , { b , c } , { b , d } , { c , d } \{a,b\},\{a,c\},\{a,d\},\{b,c\},\{b,d\},\{c,d\} {a,b},{a,c},{a,d},{b,c},{b,d},{c,d}
{ a , b , c } , { a , b , d } , { a , c , d } , { b , c , d } \{a,b,c\},\{a,b,d\},\{a,c,d\},\{b,c,d\} {a,b,c},{a,b,d},{a,c,d},{b,c,d}

对于每个非真空子集,生成相应的关联规则。一般地,对于子集 { A } \{A\} {A},关联规则的形式是 { X } ⇒ { X − A } \{X\}\Rightarrow\{X-A\} {X}{XA},其中 X − A X-A XA 表示项集 X X X 中不包含在 A A A 中的项。

下面是所有可能的关联规则:

{ a } ⇒ { b , c , d } , { b } ⇒ { a , c , d } , { c } ⇒ { a , b , d } , { d } ⇒ { a , b , c } , \{a\}\Rightarrow\{b,c,d\},\{b\}\Rightarrow\{a,c,d\},\{c\}\Rightarrow\{a,b,d\},\{d\}\Rightarrow\{a,b,c\}, {a}{b,c,d},{b}{a,c,d},{c}{a,b,d},{d}{a,b,c},

{ a , b } ⇒ { c , d } , { a , c } ⇒ { b , d } , { a , d } ⇒ { b , c } , { b , c } ⇒ { a , d } , { b , d } ⇒ { a , c } , { c , d } ⇒ { a , b } , \{a,b\}\Rightarrow\{c,d\},\{a,c\}\Rightarrow\{b,d\},\{a,d\}\Rightarrow\{b,c\},\{b,c\}\Rightarrow\{a,d\},\{b,d\}\Rightarrow\{a,c\},\{c,d\}\Rightarrow\{a,b\}, {a,b}{c,d},{a,c}{b,d},{a,d}{b,c},{b,c}{a,d},{b,d}{a,c},{c,d}{a,b},

{ a , b , c } ⇒ { d } , { a , b , d } ⇒ { c } , { a , c , d } ⇒ { b } , { b , c , d } ⇒ { a } \{a,b,c\}\Rightarrow\{d\},\{a,b,d\}\Rightarrow\{c\},\{a,c,d\}\Rightarrow\{b\},\{b,c,d\}\Rightarrow\{a\} {a,b,c}{d},{a,b,d}{c},{a,c,d}{b},{b,c,d}{a}

这些规则代表了项集导出的所有可能的关联规则。

2、设有交易数据库如下表1所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid顾客id购买商品购买日期
t 1 t_1 t1 c 01 c_{01} c01 { a , b } \{a,b\} {a,b}2015.03.01
t 2 t_2 t2 c 02 c_{02} c02 { c , b , d } \{c,b,d\} {c,b,d}2015.03.01
t 3 t_3 t3 c 01 c_{01} c01 { c } \{c\} {c}2015.03.03
t 4 t_4 t4 c 02 c_{02} c02 { b , d } \{b,d\} {b,d}2015.03.03

解:

因为最小支持度 M i n S = 0.3 MinS=0.3 MinS=0.3,事务数据库有4条记录, M i n S p t N = 0.3 × 4 = 1.2 MinSptN=0.3\times4=1.2 MinSptN=0.3×4=1.2,所以最小支持数 M i n S p t N = 2 MinSptN=2 MinSptN=2

如下表,候选频繁1-项集 C 1 C_1 C1和频繁1-项集 L 1 L_1 L1

在这里插入图片描述
如下表,候选频繁2-项集 C 2 C_2 C2和频繁2-项集 L 2 L_2 L2

在这里插入图片描述
得所有的频繁项集为 L = L 2 = { { b , d } } L=L_2=\{\{b,d\}\} L=L2={{b,d}}

3、对如表1所示的交易数据库,令MinC=0.6,试在习题2所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度 M i n C = 0.6 MinC=0.6 MinC=0.6
C o n f i d e n c e ( { b } ⇒ { d } ) = S u p p o r t ( { b , d } ) S u p p o r t ( { b } = 2 3 ≈ 0.67 > 0.6 Confidence(\{b\}\Rightarrow\{d\})=\frac{Support(\{b,d\})}{Support(\{b\}}=\frac{2}{3}\approx0.67>0.6 Confidence({b}{d})=Support({b}Support({b,d})=320.67>0.6 C o n f i d e n c e ( { d } ⇒ { b } ) = S u p p o r t ( { b , d } ) S u p p o r t ( { d } = 2 2 = 1 > 0.6 Confidence(\{d\}\Rightarrow\{b\})=\frac{Support(\{b,d\})}{Support(\{d\}}=\frac{2}{2}=1>0.6 Confidence({d}{b})=Support({d}Support({b,d})=22=1>0.6

所以 { b } ⇒ { d } \{b\}\Rightarrow\{d\} {b}{d} { d } ⇒ { b } \{d\}\Rightarrow\{b\} {d}{b} 都是强关联规则。

4、设有交易数据库如表2所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid顾客id购买商品购买日期
t 1 t_1 t1 c 01 c_{01} c01 { a , b , e } \{a,b,e\} {a,b,e}2015.03.01
t 2 t_2 t2 c 02 c_{02} c02 { b , d } \{b,d\} {b,d}2015.03.01
t 3 t_3 t3 c 03 c_{03} c03 { b , c } \{b,c\} {b,c}2015.03.01
t 4 t_4 t4 c 01 c_{01} c01 { a , b , d } \{a,b,d\} {a,b,d}2015.03.03
t 5 t_5 t5 c 02 c_{02} c02 { a , c } \{a,c\} {a,c}2015.03.03
t 6 t_6 t6 c 03 c_{03} c03 { b , c } \{b,c\} {b,c}2015.03.03
t 7 t_7 t7 c 01 c_{01} c01 { a , c } \{a,c\} {a,c}2015.03.05
t 8 t_8 t8 c 03 c_{03} c03 { a , b , c , e } \{a,b,c,e\} {a,b,c,e}2015.03.05
t 9 t_9 t9 c 03 c_{03} c03 { a , b , c } \{a,b,c\} {a,b,c}2015.03.06

解:

因为最小支持度 M i n S = 0.3 MinS=0.3 MinS=0.3,事务数据库有9条记录, M i n S p t N = 0.3 × 9 = 2.7 MinSptN=0.3\times9=2.7 MinSptN=0.3×9=2.7,所以最小支持数 M i n S p t N = 3 MinSptN=3 MinSptN=3

如下表,候选频繁1-项集 C 1 C_1 C1和频繁1-项集 L 1 L_1 L1

在这里插入图片描述
如下表,候选频繁2-项集 C 2 C_2 C2和频繁2-项集 L 2 L_2 L2

在这里插入图片描述
如下表,候选频繁3-项集 C 3 C_3 C3

在这里插入图片描述
得所有的频繁项集为 L = L 2 = { { a , b } , { a , c } , { b , c } } L=L_2=\{\{a,b\},\{a,c\},\{b,c\}\} L=L2={{a,b},{a,c},{b,c}}

5、对如表2所示的交易数据库,令MinC=0.6,试在习题4所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度 M i n C = 0.6 MinC=0.6 MinC=0.6
C o n f i d e n c e ( { a } ⇒ { b } ) = S u p p o r t ( { a , b } ) S u p p o r t ( { a } = 4 6 ≈ 0.67 > 0.6 Confidence(\{a\}\Rightarrow\{b\})=\frac{Support(\{a,b\})}{Support(\{a\}}=\frac{4}{6}\approx0.67>0.6 Confidence({a}{b})=Support({a}Support({a,b})=640.67>0.6 C o n f i d e n c e ( { b } ⇒ { a } ) = S u p p o r t ( { a , b } ) S u p p o r t ( { b } = 4 7 ≈ 0.57 < 0.6 Confidence(\{b\}\Rightarrow\{a\})=\frac{Support(\{a,b\})}{Support(\{b\}}=\frac{4}{7}\approx0.57<0.6 Confidence({b}{a})=Support({b}Support({a,b})=740.57<0.6 C o n f i d e n c e ( { a } ⇒ { c } ) = S u p p o r t ( { a , c } ) S u p p o r t ( { a } = 4 6 ≈ 0.67 > 0.6 Confidence(\{a\}\Rightarrow\{c\})=\frac{Support(\{a,c\})}{Support(\{a\}}=\frac{4}{6}\approx0.67>0.6 Confidence({a}{c})=Support({a}Support({a,c})=640.67>0.6 C o n f i d e n c e ( { c } ⇒ { a } ) = S u p p o r t ( { a , c } ) S u p p o r t ( { c } = 4 6 ≈ 0.67 > 0.6 Confidence(\{c\}\Rightarrow\{a\})=\frac{Support(\{a,c\})}{Support(\{c\}}=\frac{4}{6}\approx0.67>0.6 Confidence({c}{a})=Support({c}Support({a,c})=640.67>0.6 C o n f i d e n c e ( { b } ⇒ { c } ) = S u p p o r t ( { b , c } ) S u p p o r t ( { b } = 4 7 ≈ 0.57 < 0.6 Confidence(\{b\}\Rightarrow\{c\})=\frac{Support(\{b,c\})}{Support(\{b\}}=\frac{4}{7}\approx0.57<0.6 Confidence({b}{c})=Support({b}Support({b,c})=740.57<0.6 C o n f i d e n c e ( { c } ⇒ { b } ) = S u p p o r t ( { b , c } ) S u p p o r t ( { c } = 4 6 ≈ 0.67 > 0.6 Confidence(\{c\}\Rightarrow\{b\})=\frac{Support(\{b,c\})}{Support(\{c\}}=\frac{4}{6}\approx0.67>0.6 Confidence({c}{b})=Support({c}Support({b,c})=640.67>0.6

所以 { a } ⇒ { b } \{a\}\Rightarrow\{b\} {a}{b} { a } ⇒ { c } \{a\}\Rightarrow\{c\} {a}{c} { c } ⇒ { a } \{c\}\Rightarrow\{a\} {c}{a} { c } ⇒ { b } \{c\}\Rightarrow\{b\} {c}{b} 是强关联规则。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/636263.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vivado 在波形查看器中查看 ILA 探针数据

在波形查看器中查看 ILA 探针数据 Vivado 集成设计环境 (IDE) 中的“ ILA 波形查看器 (ILA waveform viewer) ”提供了一种强大的方法 &#xff0c; 可分析从 ILA 调 试核采集的数据。成功触发 ILA 核并采集数据后 &#xff0c; Vivado 会以从 ILA 核收集的数据自动填…

solidity入门

Solidity 是以太坊智能合约开发的主要编程语言&#xff0c;支持多种数据类型&#xff0c;其中数组是一种非常常用和灵活的数据结构。在本教程中&#xff0c;我们将深入探讨 Solidity 中数组的各种类型、创建规则以及常见操作。 ### 固定长度数组 固定长度数组在声明时指定了数…

前端css中table表格的属性使用

前端css中table表格的属性使用 一、前言二、常见的表格属性1.边框的样式2.布局和对齐3.间距和填充4.背景和颜色5.字体的样式6.边框的圆角 三、简单的表格&#xff0c;例子11.源码12.源码1效果截图 四、给表格添加动画效果&#xff0c;例子21.源码22.源码2的运行效果 五、结语六…

Linux文件系统 软硬链接

文章目录 文件背景知识磁盘文件磁盘物理结构磁盘存储结构对磁盘的存储进行逻辑抽象Boot BlockSuper blockData blocksInode TableBlcokBitmapinode BitmapGroup Descriptor Table 文件名和inode编号创建文件删除文件查找文件 软硬链接软链接硬链接查看文件信息stat命令取消软硬…

数据结构 -- 二叉树二叉搜索树

二叉树 二叉树是这么一种树状结构&#xff1a;每个节点最多有两个孩子&#xff0c;左孩子和右孩子 重要的二叉树结构 完全二叉树&#xff08;complete binary tree&#xff09;是一种二叉树结构&#xff0c;除最后一层以外&#xff0c;每一层都必须填满&#xff0c;填充时要遵…

百科不全书之 docker记录

docker记录 1.参考文件2. Docker简介与虚拟机的区别 3. 安装Docker注意 Windows家庭版的要额外设置 4.使用5.docker与ROS 1.参考文件 参考视频&#xff1a;B站【GeekHour】Docker入门教程: 【GeekHour】30分钟Docker入门教程 2. Docker简介 Docker是一个用于构建运行 传送…

【智能算法】吉萨金子塔建造算法(GPC)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2021年&#xff0c;S Harifi等人受到观古代遗迹构造启发&#xff0c;提出了吉萨金子塔建造算法&#xff08;Giza Pyramids Construction, GPC&#xff09;。 2.算法原理 2.1算法思想 GPC模拟了古埃…

Python 面向对象——1.基本概念

本章学习链接如下&#xff1a; 基本概念与语法 类&#xff08;Class&#xff09;&#xff1a;定义了一组对象共有的属性和方法的蓝图。类是创建对象的模板。 对象&#xff08;Object&#xff09;&#xff1a;类的实例。对象包含实际的数据和操作数据的方法。 属性&#xff0…

unity学习(89)——unity塞满c盘!--删除editor下的log文件

卸了一个视频后强制续命打开详细信息&#xff1a; 这个再往下找也是没用的&#xff01; 显示隐藏文件夹后&#xff01;执行如下操作&#xff01; 30个g&#xff01; 其中unity占23g editer占了21g 删除C:\Users\王栋林\AppData\Local\Unity\Editor下的log文件 恢复到之前的水…

Android AIDL接口

一.AlDI接口简介 AIDL&#xff08;Android Interface Definition Language&#xff09;是一种 IDL 语言&#xff0c;用于生成可以在 Android 设备上两个进程之间进行进程间通信&#xff08;IPC&#xff09;的代码。 通过 AIDL&#xff0c;可以在一个进程中获取另一个进程的数据…

详细剖析多线程4----锁策略(八股文/面试常考)

文章目录 前言一、常见锁策略(八股文)1.1乐观锁和悲观锁1.2轻量级锁和重量级锁1.3自旋锁和挂起等待锁1.4普通互斥锁和读写锁1.5公平锁和非公平锁1.6可重入锁和不可重入锁1.7总结 二、synchronized内部原理三、CAS四、JUC(java.util.concurrent) 的常见类4.1Callable 接⼝4.2Ree…