Apriori关联规则算法

news/2025/1/16 0:58:10/文章来源:https://www.cnblogs.com/aisuanfa/p/18673977

Apriori关联规则算法

假设我们有一个超市的交易记录数据库,我们想要找出哪些商品经常一起购买。
步骤 1: 设定最小支持度阈值
假设我们设定最小支持度阈值为5%。这意味着,如果一个商品组合在所有交易中出现的频率至少为5%,我们才认为它是一个频繁项集。
步骤 2: 找出频繁1-项集
我们首先统计数据库中每个商品的出现次数,然后除以总交易数,以计算每个商品的支持度。例如,如果牛奶在100笔交易中出现了40次,那么它的支持度是40%。只有当支持度超过5%的商品才会被认为是频繁1-项集。
步骤 3: 生成候选频繁2-项集
我们将上一步找到的频繁1-项集进行两两组合,生成候选频繁2-项集。例如,如果频繁1-项集有{牛奶, 面包, 鸡蛋, 橙汁},那么候选频繁2-项集可能包括{牛奶, 面包}、{牛奶, 鸡蛋}、{牛奶, 橙汁}等。
步骤 4: 计算候选频繁2-项集的支持度
我们遍历数据库中的所有交易,统计候选频繁2-项集的出现次数,并计算它们的支持度。那些支持度超过5%的候选集将成为频繁2-项集。
步骤 5: 重复步骤3和步骤4
我们继续这个过程,使用频繁2-项集生成候选频繁3-项集,计算它们的支持度,然后找到频繁3-项集。这个过程一直重复,直到没有新的频繁项集可以找到。
步骤 6: 生成关联规则
一旦我们找到了所有的频繁项集,我们就可以生成关联规则。例如,如果我们有一个频繁3-项集{牛奶, 面包, 鸡蛋},我们可以生成以下规则:

  • 如果购买了牛奶和面包,那么购买鸡蛋的概率是多少?
  • 如果购买了牛奶和鸡蛋,那么购买面包的概率是多少?
  • 如果购买了面包和鸡蛋,那么购买牛奶的概率是多少?
    步骤 7: 计算规则的置信度
    对于每一条规则,我们计算它的置信度。置信度是通过将规则的支持度除以前件的支持度来计算的。例如,如果{牛奶, 面包} → {鸡蛋}的支持度是4%,而{牛奶, 面包}的支持度是6%,那么规则的置信度是4%/6% = 66.67%。
    步骤 8: 应用最小置信度阈值
    最后,我们应用最小置信度阈值来筛选有趣的规则。假设我们设定的最小置信度阈值是50%,那么只有当规则的置信度超过50%时,我们才认为这是一个有趣的关联规则。
    通过这个案例,我们可以看到Apriori算法是如何一步步地从原始交易数据中挖掘出有用的关联规则的。在实际应用中,这些规则可以帮助零售商进行商品布局、促销活动策划等决策。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/869864.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Retinex算法的图像去雾matlab仿真

1.算法运行效果图预览 (完整程序运行后无水印) 2.算法运行软件版本 matlab2022a3.部分核心程序 (完整版代码包含详细中文注释和操作步骤视频)%卷积滤波 R_conv3 = imfilter(Img1_RN,e,conv, replicate); % 对红色分量进行第三次卷积滤波 G_conv3 = imfilter(Img1_RG,e,conv,…

机器学习吃瓜教程task1

机器学习机器学习三观假设空间和版本空间 训练集可以有多个假设空间,且在不同的假设空间中都有可能学得能够拟合训练集的模型,我们将所有能够拟合训练集的模型构成的集合称为"版本空间"。 基本术语 ...... 模型:机器学习的一般流程如下:首先收集若干样本(假设此…

猴子也能学会的stm32配置

你是一个马喽,你想要用STM32驱动外设/实现功能步骤 1. 打开【CubeMX】 1.1 配置GPIO 1.1.1 如果要配置输入引脚选择上拉电阻和下拉电阻在电路中的作用主要是用于稳定电平和防止浮空,以确保电路在不同情况下能够正常工作。具体来说,它们的作用如下: 作用:确定电平状态:在没…

ciscn_2019_en_2 1

打开ida记得绕过加密,因为它会改变s里面的值exp from pwn import * from LibcSearcher import * context(os=linux, arch=amd64) context.log_level=debug io=remote(node5.buuoj.cn,26931) elf = ELF(./ciscn_2019_en_2) io.sendline(b1) main = elf.sym[main] puts_plt = el…

低代码平台:2024 年国内主流平台盘点

在当今数字化转型的浪潮中,低代码平台作为一种高效的软件开发工具,正逐渐受到企业的广泛关注。它能够以更少的编码、更快的速度构建和交付应用软件,为企业带来诸多优势。本文将对低代码平台进行全面介绍,包括其定义、对企业的意义、企业级低代码平台的特色、国内主流平台盘…

速看!国内外 7大企业AI知识库大盘点

随着人工智能技术的飞速发展,AI知识库已成为企业智能化转型的重要基石。它不仅能够大幅提升知识检索效率,还能通过智能推荐与学习,不断优化知识库内容,助力企业决策与创新。本文将为您盘点国内外七家企业的AI知识库,探索其技术亮点与应用实践。1. HelpLook:智能知识管理的…

vscode快捷上传博客园博文

vscode快速上传cnblogs md文件中的图片上传到博客园路径需要手动更新,这很傻。 vscode安装博客园插件:登录: 在左侧栏中:点击登录。接下来就可以爽起来了。 具体使用: 1、typora正常写md文件,这个方便简洁。 2、写完后用vscode打开这个文件,并点击右上角上传到博客。第一…

ShellCheck工具:帮你发现Shell脚本安全隐患

作为一名运维工程师,你是否经常为Shell脚本中的各种隐藏bug而头疼?今天我要向大家推荐一个堪称"神器"的工具 - ShellCheck。它就像一位经验丰富的Shell编程导师,能够精准地发现你的脚本中的各种潜在问题,并给出专业的改进建议。它有多强? 想象一下,你有一位经验超过…

1.C++基础入门

C++基础入门。C++基础入门 1 C++初识 1.1 第一个C++程序 编写一个C++程序总共分为4个步骤创建项目 创建文件 编写代码 运行程序1.1.1 创建项目 ​ Visual Studio是我们用来编写C++程序的主要工具,我们先将它打开1.1.2 创建文件 右键源文件,选择添加->新建项给C++文件起个…

【Java开发】实现 License 认证(只校验有效期)

一、License介绍 License也就是版权许可证书,一般用于收费软件给付费用户提供的访问许可证明 1.1 应用场景应用部署在客户的内网环境 这种情况开发者无法控制客户的网络环境,也不能保证应用所在服务器可以访问外网 因此通常的做法是使用服务器许可文件,在应用启动的时候加载…

Proj CJI Paper Reading: AdaPPA: Adaptive Position Pre-Fill Jailbreak Attack Approach Targeting LLMs

AbstractBackground: 目前的jailbreak mutator方式更集中在语义level,更容易被防御措施检查到 本文: AdaPPA (Adaptive Position Pre-Filled Jailbreak Attack) Task: adaptive position pre-fill jailbreak attack approach Method: 利用模型的instruction following能力,先…