曾梦想执剑走天涯,我是程序猿【AK】
目录
- 简述概要
- 知识图谱
简述概要
提示:简要描述文章内容,适合哪些人观看
知识图谱
- 样本(Sample)/实例(Instance):在机器学习中,我们获得的数据集中的一条数据被称为一个样本或实例。样本是一个统计学概念,通常对应一个个体或者对某个对象的一次观测。
- 特征(Feature)/属性(Attribute):这些是记录样本的某种性质或者在某方面的表现的指标或变量。特征是用来描述样本的重要信息,是机器学习模型进行预测和分类的基础。
- 特征向量(Feature Vector):一个样本的全部特征构成的向量被称为特征向量。特征向量是机器学习模型处理的基本单位。
- 特征空间(Feature Space)/ 属性空间(Attribute Space)/ 样本空间(Sample
Space):由所有特征/属性张成的空间,也即特征向量所在的空间。每一维对应一个特征。 - 学习(Learning)/训练(Training):这是模型凭借数据提供的信息改进自身性能的过程。在这个过程中,模型会学习如何根据输入的特征预测目标变量。
- 测试(Testing):训练结束之后,需要使用测试数据来检验模型的训练效果,即模型在未见过的数据上的表现。
- 训练数据(Training Data)/ 训练集(Training Set):用于训练模型的数据集,其中的每一个样本称为一个训练样本。
- 模型(Model):在机器学习中,模型是对现实世界事物的一种抽象表示,用于根据输入的特征预测目标变量。
- 预测(Prediction):利用训练好的模型,对新的、未见过的数据进行预测,得到其目标变量的值。
- 监督学习(Supervised Learning):在这种学习模式下,模型从已知类别的训练数据中学习如何预测目标变量。
- 无监督学习(Unsupervised Learning):在这种学习模式下,模型从未知类别的训练数据中学习数据的结构和特征,如聚类、降维等。
- 半监督学习(Semi-Supervised Learning):在这种学习模式下,模型同时使用已知类别和未知类别的训练数据进行学习,以在有限的标注数据下提高模型的性能。
这些术语和概念构成了机器学习的基本框架和理论基础,对于理解和应用机器学习技术非常重要。
---- 永不磨灭的番号:我是AK