机器学习:什么是监督学习和无监督学习

目录

一、监督学习

(一)回归

(二)分类

二、无监督学习

聚类


一、监督学习

        介绍:监督学习是指学习输入到输出(x->y)映射的机器学习算法,监督即理解为:已知正确答案对其学习结果进行监督

        原理:提供算法示例以供学习,通过查看 x->y 的正确示例,使得算法最终达到给定输入值 x 可以获得对于输出值 y 的合理预测或猜测结果

        例子:监督学习主要包括分类问题和回归问题,如一个判断邮件是否为垃圾邮件、广告公司根据客户数据判断是否会点击广告、根据房子的面积拟合合适的线条预测房价,等等。

(一)回归

        如下图是一个监督学习的特殊例子——回归,给定了算法一个数据集,其中对于每个面积 x,都有一个“正确答案”——y 标签,学习算法将持续进行学习,从无数个可能的输入对象预测结果

        未来探讨的问题在于,如何选择合适的直线或其他曲线对模型拟合

(二)分类

        例子:医生使用一个诊断工具,根据病人医疗记录数据判断肿瘤是否是恶性的还是良性的,从而检测一名病人是否患有乳腺癌

        为了简便,假设可以通过肿瘤大小这一属性判断其性质,在过往数据集里,可能有各种各样大小的肿瘤,如下横轴代表肿瘤大小,标记代表两个值(O为良性,X为恶性),学习算法可以以此判断是否为恶性肿瘤

        有可能会有多个输出类型

        也可以有多个输入值来预测输出:如根据年龄和肿瘤大小两个属性判断是否恶性

        基于这样的数据集,学习算法要做的是找到合适的边界区分恶性肿瘤和良性肿瘤

        除此之外可能会有更多的属性进行协助判断并得出结果

        分类与回归的最大区别:分类输出的是预测类别,离散、小而有限(如0,1,2,则不能是除了这三类外的任意结果),而回归会从无限个可能的输入,预测输出数值

二、无监督学习

聚类

        监督学习中,每个示例 x 与输出标签 y 相关联(x->y),而在无监督学习中,数据并未和任意输出标签相关,我们也没有对输入值指定一个所谓的“正确答案”,而是,在数据集中发现其本身特有的结构或模式。

        如在上述肿瘤检测的问题中,我们并未给定所谓“良性”或“恶性”的标签,而由聚类算法(无监督学习的一种)根据数据集的特征,自行决定如何把并未标记的数据集划分为不同集群

        如对于一个“某一些人为什么想学习AI”这个问题,聚类算法会根据客户信息的数据库,在没有标签的情况下自动将客户划分为某些类别,这个过程并不需要人为干预,这种即为无监督学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/423021.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大模型的高效训练和部署技术卷出新高度

01 大模型训练的挑战 1. 大模型发展现状及问题 上图中展示了大模型的发展历程,其中纵坐标是 AI 模型的参数量。在过去几年间,AI 大模型的参数量飞速增长,大约每 18 个月时间就会增长 40 倍。例如 2016 年,世界最好的大模型 ResNe…

上位机图像处理和嵌入式模块部署(qt图像处理)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 很多人一想到图像处理,本能的第一反应就是opencv,这也没有错。但是呢,这里面还是有一个问题的,不知…

如何用 500 行 SQL 实现 GPT2学习

目录 理论背景实现过程GenerationTokenizerEmbeddingsAttention为什么我们需要有因果掩码?为什么矩阵是 Q,K 和 V? BlocksTokens为什么要使用 softmax 转换概率?Inference 俄罗斯有个大佬每年都会用 SQL 来实现一个挑战庆祝新年&a…

在linux部署Prometheus+Grafana+Exporter监控系统性能

Prometheus、Grafana和Report组件是什么? Prometheus、Grafana和Exporter是常用于系统监控和指标收集的组合。 Prometheus是一种开源的系统监控和警报工具。它可以收集各种指标数据,并提供强大的查询语言和灵活的警报规则,用于实时监控系统…

【论文阅读笔记】Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation

1.介绍 Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation Swin-Unet:用于医学图像分割的类Unet纯Transformer 2022年发表在 Computer Vision – ECCV 2022 Workshops Paper Code 2.摘要 在过去的几年里,卷积神经网络&#xff…

制造业实施了ERP,为啥还要实施MES?

为啥要实施MES系统? 很多客户听说ERP系统较多,做规划也是先实施ERP系统,觉得上了ERP系统,就可以取而代之MES系统了,其实不然,原因有几点。 1、车间信息高效沟通的刚需 工厂和车间需要信息畅通无阻&#x…

JS进阶-函数进阶(一)

• 函数提升 函数提升与变量提升比较类似,是指函数在声明之前即可被调用。 总结: 1. 函数提升能够使函数的声明调用更灵活 2. 函数表达式不存在提升的现象 3. 函数提升出现在相同作用域当中 • 函数参数 1. 动态参数 arguments 是函数内部内置的伪…

Apache DolphinScheduler社区新晋Committer:伏长海的开源之旅

文章作者:**伏长海** 文章整理:曾辉 个人介绍 大家好,我是伏长海,目前在珍岛集团担任大数据开发工程师职位! GitHub ID:fuchanghai 在算法平台后端的研究领域耕耘了三年,任务调度方面也有一年半的深入探索。闲暇时…

ORA-01033: ORACLE initialization or shutdown in progress---惜分飞

客户反馈数据库使用plsql dev登录报ORA-01033: ORACLE initialization or shutdown in progress的错误 出现该错误一般是由于数据库没有正常open成功,查看oracle 告警日志发现 Mon Jan 22 16:55:50 2024 Database mounted in Exclusive Mode Lost write protection disabled …

【Linux】—— 命名管道详解

命名管道是一种在操作系统中用于进程间通信的机制,它允许不同的进程之间通过管道进行数据交换。与匿名管道相比,命名管道具有更多的灵活性和功能。在本博客中,我们将深入探讨命名管道的概念、用途以及如何在编程中使用它们。 目录 &#xff…

pycharm创建vue项目idealTree:npm: sill idealTree buildDeps,换taobao源后还不好使?那就再换一个

心血来潮打算写个小项目,前后端分离,flask/fastapivue(具体用哪个后端还没想好),里面的功能大概就是目前所有热门的应用的合集,一键出结果的那种,然后跟随着科技趋势,不断去更新维护…

实现钉钉与宁波银行对接,助力东吴黄金集团财务智能化

客户介绍: 某黄金集团有限公司是一家在国内外黄金市场上具有重要影响力的综合性黄金企业。该公司拥有一支高素质、专业化的团队,具备丰富的行业经验和卓越的执行力。在业务范围上,该公司涵盖了黄金勘探、采选、冶炼、加工、销售等全产业链&a…