【COMP337 LEC2】

Association Pattern Mining 关联模式挖掘

Special case: Frequent Pattern Mining (binary data sets) 频繁模式挖掘

Given data matrix, identify all subsets of columns ( features ) such that at least a fraction of rows (objects ) in the matrix have all the features enabled (i.e., the features take on the value of 1).

Classification 分类

1. The goal is to use training data to learn relationships between a fixed feature (called class label ) and the remaining features in the data
使用训练数据去学习一个固定特征(被叫做 类特征 )和数据中其他特征的关系
2. The resulting learned model may then be used to estimate (predict) values of the class label for records, where the value is not known.
根据学习后得到的模型来 预测 records的 类特征 的值

3. The objects whose class label is unknown are test objects (test data).

类特征未知的对象叫测试对象

4. 监督学习

Examples
1. Targeted marketing
2. Text recognition

Clustering 聚类

1. Given a data set (data matrix), partition its objects (rows) into sets (clusters) C 1 , C 2 , …, C k such that the objects in each cluster are “ similar ” to one another. 

2. Specific definitions depend on how the notion of similarity is defined

3. Can be seen as an unsupervised version of classification.  未监督学习版本的分类

Examples
1. Customer segmentation (identify similar customers for targeted product promotion)
2. Data summarisation (cluster can be used to create a summary of the data)

Outlier Detection 异常值检测

Given a data set, determine the outliers , i.e. the objects that are significantly different from the remaining objects.

Examples:• Credit card fraud • Detecting sensor events • Medical diagnosis • Earth science

Linear algebra

1. vector

2. matrices

3. vector arithmetic

4. matrix arithmetic

5. transpose and inverse

6. linear independence

7. rank

invertible 可倒转的

8. matrix trace

9. eigenvalues and eigenvectors

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/466759.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

雨云裸金属服务器

雨云服务器与裸金属服务器:云端与实体的完美交融 随着信息技术的迅猛发展,云服务已经成为企业和个人数据处理与存储的重要选择。其中,雨云服务器和裸金属服务器作为两种截然不同的服务形式,各自拥有独特的优势和应用场景。本文将深…

Solidworks:从2D走向3D

Sokidworks 的强大之处在于三维实体建模,这个形状看似复杂,实际上只需要拉伸一次,再做一次减法拉伸就行了。第一次做三维模型,费了不少时间才搞明白。 接下来做一个稍微复杂一点的模型,和上面这个操作差不多&#xff0…

Hive SQL编译成MapReduce任务的过程

一、 Hive 底层执行架构 Hive是Facebook实现的一个开源的数据仓库工具。 Hive基于Hadoop实现,底层数据存放HDFS,计算(查询)使用MapReduce任务实现将结构化的数据文件映射为数据库表,并提供HQL查询功能,将HQ…

Netty应用(九) 之 编解码器概念 Netty常见的编解码器

目录 22.编解码器 22.1 编解码的概念 22.2 netty中的编解码 22.3 序列化 23.编解码器在使用过程中的两部分核心内容 23.1 序列化协议(编码格式)(传输数据的格式) 23.1.1 Java默认的序列化与反序列化 23.1.2 XML的序列化与反…

Netty应用(十) 之 自定义编解码器 自定义通信协议

目录 25.自定义编解码器 25.1 自定义编解码器编码 25.2 自定义编解码器的总结和补充 26.自定义通信协议 26.1 关于通信协议的关注点 26.2 自定义通信协议的格式 26.3 编解码 25.自定义编解码器 有了上面这个大体框架的流程之后,我们来聊一个非常特殊的&#x…

《Linux 简易速速上手小册》第5章: 用户与群组管理(2024 最新版)

文章目录 5.1 管理用户账户5.1.1 重点基础知识5.1.2 重点案例:创建一个新的开发者账户5.1.3 拓展案例 1:禁用用户登录5.1.4 拓展案例 2:设置账户到期 5.2 群组概念与管理5.2.1 重点基础知识5.2.2 重点案例:为项目团队设置群组5.2.…

零售连锁门店管理软件有哪些好用?

在当今的零售行业中,随着连锁经营模式的普及和发展,对于高效、便捷的门店管理需求日益增加。一款好用的零售连锁门店管理软件,能够为商家提供全方位的解决方案,助力企业实现信息化管理,提升运营效率。那么,…

Github 2024-02-13 开源项目日报 Top9

根据Github Trendings的统计,今日(2024-02-13统计)共有9个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量JavaScript项目2Python项目2C项目2TypeScript项目2Rust项目1Go项目1Dart项目1Java项目1C项目1 系统设计指南 …

【lesson51】信号之信号处理

文章目录 信号处理可重入函数volatileSIGCHLD信号 信号处理 信号产生之后,信号可能无法被立即处理,一般在合适的时候处理。 1.在合适的时候处理(是什么时候?) 信号相关的数据字段都是在进程PCB内部。 而进程工作的状态…

【Chrono Engine学习总结】4-vehicle-4.1-vehicle的基本概念

由于Chrono的官方教程在一些细节方面解释的并不清楚,自己做了一些尝试,做学习总结。 1、基本介绍 Vehicle Overview Vehicle Mannel Vehicle的官方demo 1.1 Vehicle的构型 一个车辆由许多子系统构成:悬挂、转向、轮子/履带、刹车/油门、动…

MogaNet实战:使用 MogaNet实现图像分类任务(二)

文章目录 训练部分导入项目使用的库设置随机因子设置全局参数图像预处理与增强读取数据设置Loss设置模型设置优化器和学习率调整策略设置混合精度,DP多卡,EMA定义训练和验证函数训练函数验证函数调用训练和验证方法 运行以及结果查看测试完整的代码 在上…

应急响应实战笔记02日志分析篇(1)

第1篇:Windows日志分析 0x01 Windows事件日志简介 Windows系统日志是记录系统中硬件、软件和系统问题的信息,同时还可以监视系统中发生的事件。用户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹。 Windows主要有以下三类日志记…