机器学习算法应用场景与评价指标

在这里插入图片描述

一、应用场景

机器学习的算法选择大部分依赖于具体的问题类型和数据特征。下面是一些典型的场景以及对应的常用算法:

1.二元分类问题

当你的目标变量只有两个类别时,如垃圾邮件过滤(垃圾邮件/非垃圾邮件)、患者疾病诊断(疾病/健康)等。常用的算法包括逻辑回归、支持向量机、朴素贝叶斯、随机森林、梯度提升机等。

2.多元分类问题

当你的目标变量有超过两个类别时,如手写数字识别、新闻文章分类等。常用的算法包括K近邻、决策树、随机森林、梯度提升机、神经网络等。

3.回归问题

当你的目标变量是连续的数值时,如预测房价、预测销售额等。常用的算法包括线性回归、决策树回归、随机森林回归、梯度提升回归、神经网络回归等。

4.聚类问题

当你想将数据分为若干组,且这些组内的数据相似,组间的数据不同时,如用户行为分群、新闻文章分群等。常用的算法包括K-Means、层次聚类、DBSCAN、谱聚类等。

5.异常检测

当你需要在数据中检测出不符合预期或者与众不同的点时,如信用卡欺诈检测、工业设备故障检测等。常用的算法包括基于统计的异常检测、基于距离或者密度的异常检测如LOF(Local Outlier Factor)、孤立森林等。

6.推荐系统

当你想根据用户的历史行为或者属性来推荐物品时,如电影推荐、广告推荐等。常用的算法包括协同过滤(包括用户基于和物品基于)、矩阵分解、深度学习推荐模型等。

7.强化学习

当你需要让机器根据与环境的交互来学习最佳策略时,如游戏AI(如AlphaGo)、机器人导航等。常用的算法包括Q-learning、SARSA、Deep Q Network、Policy Gradient等。
请注意,选择最佳的机器学习算法通常需要进行多次试验和调整,以确定哪种算法在特定问题上表现最好。此外,特征工程的质量、模型参数的调整以及数据的预处理也将大大影响模型的性能。

二、模型评价

以下是各种机器学习任务常用的模型评价指标:

1.分类任务

对于二元或者多元分类任务,以下是一些常见的评价指标:
TP(True Positive)是真正类,即正确预测的正样本数;
TN(True Negative)是真负类,即正确预测的负样本数;
FP(False Positive)是假正类,即错误预测的正样本数(实际为负);
FN(False Negative)是假负类,即错误预测的负样本数(实际为正)。

  • 准确率 (Accuracy):所有预测正确的样本数占样本总数的比例。
    Accuracy = (TP + TN) / (TP + TN + FP + FN)
  • 精确率 (Precision):预测为正且预测正确的样本数占预测为正的样本总数的比例,是关注假阳性(被错误地标记为正类)的一个指标。
    Precision = TP / (TP + FP)
  • 召回率 (Recall):预测为正且预测正确的样本数占真正正类样本总数的比例,是关注假阴性(被错误地标记为负类)的一个指标。
    Recall = TP / (TP + FN)
  • F1 分数:精确率和召回率的调和平均值,适用于类别不平衡的情况。
    F1 Score = 2 * (Precision * Recall) / (Precision + Recall)
  • AUC-ROC:ROC 曲线下的面积,反映的是分类器对样本的排序能力,即无论阈值设定为何值,总体上看分类器对样本的识别能力如何。
    FPR = FP / (FP + TN)
    TPR = TP / (TP + FN)
  • 混淆矩阵/classification_report:一个表格,用于描述分类模型的性能,表格中的每一行代表模型预测的类别,每一列代表实际的类别。
          precision    recall  f1-score   support0       0.83      0.97      0.89     127701       0.99      0.94      0.96     41711accuracy                           0.95     54481macro avg       0.91      0.95      0.93     54481
weighted avg       0.95      0.95      0.95     54481
  • KS值
    KS值越大,表示模型能够将正、负客户区分开的程度越大。通常来讲,KS>0.2即表示模型有较好的预测准确性。

  • ROC曲线
    ROC的全称是“受试者工作特征”(Receiver Operating Characteristic)曲线,用来评判分类、检测结果的好坏。

  • AUC值
    AUC(Area Under Curve)就是ROC曲线下的面积大小,它能够量化地反映基于ROC曲线衡量出的模型性能。AUC的取值一般在0.5和1之间,AUC越大,说明分类器越可能把实际为正的样本排在实际为负的样本的前面,即正确做出预测。

2.回归任务

对于回归任务,常用的评价指标主要有:

  • 均方误差 (MSE):预测值与真实值的平方差的平均值。
    MSE = (1/n) * Σ(yi - ŷi)²
    其中,n 是样本数量,yi 是实际值,ŷi 是预测值。这个指标度量了模型预测值和实际值的平均平方差异。
    越接近 0 表示模型越好。
  • 均方根误差 (RMSE):预测值与真实值的平方差的平均值的平方根。
    RMSE = sqrt(MSE)
    RMSE 是 MSE 的平方根。相比于 MSE,RMSE 的量纲和原始目标变量一致,因此更容易解释
  • 平均绝对误差 (MAE):预测值与真实值之间的绝对值的平均值。
    MAE = (1/n) * Σ|yi - ŷi|
    MAE 表示的是模型预测值和实际值的平均绝对差异。MAE 相比于 MSE 或 RMSE,对于异常值不敏感。
  • R-squared:解释变量能解释的因变量的变异程度。
    R² = 1 - [ Σ(yi - ŷi)² / Σ(yi - ymean)² ]
    其中,ymean 是 y 的平均值。R² 分数(也叫确定系数)度量的是模型预测的目标变量的方差占总方差的比例。
    R² 值越接近 1,表示模型越好。

3.聚类任务

对于聚类任务,常用的评价指标主要有:

  • 轮廓系数 (Silhouette Coefficient):一个样本与同簇的其他样本的距离的平均值和该样本与其他最近簇的样本的平均距离的比值。
  • Davies-Bouldin Index:簇间的平均距离与簇内的平均距离的比值。
  • Rand Index:所有样本对的正确分类与总样本对数的比值。

4.异常检测

对于异常检测任务,常用的评价指标主要有:

  • Precision@k:在排名前 k 的样本中,真正的异常样本所占的比例。
  • ROC-AUC:如上所述,ROC 曲线下的面积。

5.时间序列预测

对于时间序列预测任务,常用的评价指标主要有:

  • 均方误差 (MSE):预测值与真实值的平方差的平均值。
  • 均方根误差 (RMSE):预测值与真实值的平方差的平均值的平方根。
  • 平均绝对误差 (MAE):预测值与真实值之间的绝对值的平均值。
  • 平均绝对百分比误差 (MAPE):预测值与真实值之间的绝对百分比误差的平均值。
    请注意,根据具体的应用场景和问题,这些评价指标的适用性可能会有所不同。你可能需要结合你的具体情况来选择最合适的评价指标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/276421.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java:仿写一个简易的tomcat(步骤 + 详细代码)

文章目录 流程图实现代码解析一、构建测试样例二、自定义注解三、 自定义 request 类、response 类MyrequestMyresponse 四、反射,创建servlet对象五、接收请求,调用方法六、处理传入的TCP协议七、测试运行 流程图 实现代码解析 一、构建测试样例 这里…

HarmonyOS使用HTTP访问网络

HTTP数据请求 1 概述 日常生活中我们使用应用程序看新闻、发送消息等,都需要连接到互联网,从服务端获取数据。例如,新闻应用可以从新闻服务器中获取最新的热点新闻,从而给用户打造更加丰富、更加实用的体验。 那么要实现这样一种…

【C语言初阶】什么操作符你还没搞懂?试试这篇文章让你彻底理解各种操作符!

🎬 鸽芷咕:个人主页 🔥 个人专栏:《C语言初阶篇》 《C语言进阶篇》 ⛺️生活的理想,就是为了理想的生活! 文章目录 一、 算术操作符:1.1 加减乘除 二、 移位操作符:2.1 计算机中整数的存储2.2 >> 右…

@德人合科技——天锐绿盾|电脑文件防止泄密|文件、文档、图纸、源代码等透明加密保护,防泄密软件系统

德人合科技——天锐绿盾提供了一种企业办公电脑文件防止泄密的解决方案,该方案对文件、文档、设计图纸、源代码等进行了透明加密保护。 pc访问地址: https://isite.baidu.com/site/wjz012xr/2eae091d-1b97-4276-90bc-6757c5dfedee 透明加密是一种保护文…

YOLOv8改进 | 2023Neck篇 | 利用RepGFPN改进特征融合层(附yaml文件+添加教程)

一、本文介绍 本文给大家带来的改进机制是Damo-YOLO的RepGFPN(重参数化泛化特征金字塔网络),利用其优化YOLOv8的Neck部分,可以在不影响计算量的同时大幅度涨点(亲测在小目标和大目标检测的数据集上效果均表现良好涨点…

2019年第八届数学建模国际赛小美赛C题预测通过拥堵路段所需的时间解题全过程文档及程序

2019年第八届数学建模国际赛小美赛 C题 预测通过拥堵路段所需的时间 原题再现: 在导航软件中,行程时间的估计往往是一个重要的功能。现有的导航软件往往通过出租车或安装了该软件的车辆获取实时GPS数据来确定当前的路况。在交通拥堵严重的情况下&#…

Tomcat 十大安全优化方法(详解版)

目录 1 talnet管理端口保护 2 AJP连接端口保护 3 禁用管理器 4 降权启动 5 控制文件列表的访问 6 隐藏版本信息 7 server header重写 8 限制IP访问 9 修改脚本权限 10 访问日志格式规范 1 talnet管理端口保护 配置内容: (1)修改默…

短剧分销平台开发,打造短剧内容变现新模式

短剧目前已经成为了影视行业中的一匹黑马,短剧主要是根据爽文小说翻拍,将小说中精彩高潮的剧情翻拍成短剧爽文,使得观众沉浸在短剧中,欲罢不能! 短剧分销平台是短剧推广的新模式,它打破了传统的分销模式。…

【每日一题】【12.15】2415.反转二叉树的奇数层

🔥博客主页: A_SHOWY🎥系列专栏:力扣刷题总结录 数据结构 云计算 数字图像处理 力扣每日一题_ 2415. 反转二叉树的奇数层https://leetcode.cn/problems/reverse-odd-levels-of-binary-tree/ 今天终于碰到了一个mid题目&#x…

从零构建属于自己的GPT系列5:模型部署1(文本生成函数解读、模型本地化部署、文本生成文本网页展示、代码逐行解读)

🚩🚩🚩Hugging Face 实战系列 总目录 有任何问题欢迎在下面留言 本篇文章的代码运行界面均在PyCharm中进行 本篇文章配套的代码资源已经上传 从零构建属于自己的GPT系列1:数据预处理 从零构建属于自己的GPT系列2:模型训…

Linux-----11、压缩打包

# 打包压缩 # 一、压缩工具 # 1、常见的压缩与解压缩工具 压缩工具说明解压缩工具zip兼容类unix与windows,可以压缩多个文件或目录unzipgzip压缩单个文件,压缩率相对低,cpu开销相对低gunzipbzip2压缩单个文件,压缩率相对高&…

pycharm在终端处删除连接过的服务器

目录 操作 操作 打开设置处的SSH配置进行删除