【机器学习300问】62、若想将逻辑回归用于多分类有哪些常见做法?

        逻辑回归算法在设计之初是用于二分类问题的,但若想把它用在多分类上也不是不行,这得看你具体面临的多分类问题是什么样的(问题的定义)。不同的问题就有不同的应对之策:

一、一对一

(1)方法的原理

        一对一即一个样本输入一个模型对应一个输出类别,在这种方法中,针对每一个类别,都会独立训练一个逻辑回归模型,该模型预测样本是否属于这个类别。如果有K个类别就会得到K个模型。例如,想要得知一个图像样本是否属于3个类别中的其中一种(猫、狗、鸟)就可以先为每一个类别训练一个模型,然后用来预测分类:

  • 模型1用来判断这个图像样本是否属于猫
  • 模型2用来判断这个图像样本是否属于狗
  • 模型3用来判断这个图像样本是否属于鸟

        因为逻辑回归算法中在经过sigmoid处理之后,会得到一个概率。所以这里三个模型输出的是三个概率

        当新的电影样本A输入进来后,每个模型都会给出自己的分类结果,所以会得到三个预测结果(即属于各个类别的概率),如果某个模型预测其属于该类别的概率最高,则认为该样本属于这一类别。

(2)类别互斥与否对方法的影响

        这里猫、狗、鸟是互斥的类别即一个样本不可能同时是猫又是鸟。但倘若一个样本可以同时拥有多个类别呢?比如在电影分类中,若要预测一部电影是否属于动作片、喜剧片、恐怖片等多个类别。一个电影样本是可能动作喜剧片,这个时候我们可以设定某个阈值(比如\geqslant 0.5)只要三个模型中的某个模型预测的概率超过了阈值,就可以将该电影标记为该类别。

二、一对多

(1)方法的原理 

        一对多即一个样本输入一个模型对应多个输出类别,这种方法将多分类问题转化为多个互斥类别的概率估计问题,通过构建一个模型并输出K个概率值,这些概率值总和为1,代表了样本属于某个类别的概率。该方法只适用于互斥的多分类问题,例如,手写数字识别输入一张手写数字,模型会给出0到9数字的预测概率,其中最高的概率就是分类结果。

  • 模型通过softmax函数将样本所有可能的类别统统计算出概率

        还拿之前的猫狗鸟的例子来说,使用softmax回归时,我们会构建一个模型,其输出层有三个神经元,分别对应猫、狗、鸟的概率[0.3, 0.5, 0.2]。这意味着模型预测样本为狗的概率最高(0.5),其次是猫(0.3),最后是鸟(0.2)。在这种情况下,因为类别通常是互斥的,所以我们会选择概率最高的类别作为最终预测结果(这里是狗)。

(2)类别互斥与否对方法的影响

        如上图,如果类别不是互斥的,那么也可设定一个较高的概率阈值,例如0.5,那么样本就被预测为既是类别1也是类别2

三、多输出逻辑回归

        每个输出节点对应一个类别,所有输出节点共享输入层特征,但拥有各自的权重和偏置参数。模型在训练时优化所有类别的损失函数之和。适用于多标签分类,特别是当类别间有一定相关性,希望通过模型结构捕捉这种相关性时。

        如果我们认为猫、狗、鸟这三个类别之间存在某种关联,比如某些特征可能同时影响着样本被划分为猫和狗的可能性,这时可以选择多输出逻辑回归。仍以动物分类为例,模型输入层接收关于动物特征的数据,然后通过共享权重的隐藏层提取特征,最后输出层有三个节点,分别对应三个类别的概率。模型在训练过程中,会同时考虑所有类别的损失函数,并试图找到一个既能区分各类别又能捕获类别间潜在关系的最优解。在预测阶段,根据输出节点的概率决定样本所属类别,处理多标签问题时同样可以设定阈值筛选出高概率标签。

四、三种方法之间的关系

        这几种方法的关系主要体现在都是通过扩展逻辑回归模型以适应多分类任务,其中一对一和一对多策略在形式上有区别,前者是通过多个独立模型解决,后者则通过一个联合模型;而多输出逻辑回归则是兼顾了两者的特点,既是一个整体模型,又能够单独处理每个类别的输出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/601774.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【三维重建工具】NeRFStudio、3D GaussianSplatting、Colmap安装与使用指南(更新中)

目录 一、NeRFStudio安装1.安装(ubuntu系统)2.安装(windows系统) 二、安装tinycudann三、Colmap安装与使用1. 安装依赖2. 安装colmap3.使用colmap3.1 可视化界面使用3.2 Nerfstudio命令行调用Colmap 四、使用NeRFStudio进行三维重…

6 CUDA内存处理(1)

6.1 简介 在传统的CPU模型中,内存是线性内存或平面内存,单个CPU核可以无约束地访问任何地址的内存。在CPU的硬件实际实现中,有许多一级(L1)、二级(L2)以及三级(L3)缓存。那些善于对CPU代码进行优化以及有高性能计算(High-Performance Comput…

MacOS - 程序坞,但图标消失不见了 但是还能用

如图 强迫症难受死 重启什么的都尝试了。不好使! 差点重装系统。 经验证 改名字可以修复。 但是系统的比如启动台 也显示不出来 全网好使的方案 在“应用程序”中打开“终端” 输入命令如下:(注意:需要 sudo 权限&#xff0…

用国内版Devin:DevOpsGPT开发一个简易官网

前言: 世界上第一个AI程序员Devin想必已经给大家带来了不小的震撼,这种L4级的技术也许已经昭示着AGI离我们或许真的不远了。 这里先给大家普及一个概念: L4是谷歌对AGI划分的第四个等级,把代码丢给 AI 改这个是 L1 或者 L2 级别的…

阿里云又又又降价了!最高降幅59%!附最新活动入口!

2024年4月8日,阿里云官宣:海外市场全线降价,覆盖全球13个地域节点部署的核心云产品、500多个产品规格,平均降幅23%、最高降幅59%,新价格即刻生效! 13个地域节点包括:马来西亚、印尼、新加坡、菲…

快速理解vim编辑器和软硬连接

刚开始学习linux基础命令时最难搞懂的应该就是vi和ln命令了😭,写这篇文章主要想和大家分享一下我对这两个命令的理解,希望能更快的帮助到那些还没搞懂的同学😜 首先我们要知道vim编辑器主要分为三个工作模式,分别是图上…

变电站设计综合应用软件-光纤回路设计解决方案

产品概述 智能变电站光纤回路设计软件——让您的光纤设计之旅变得轻松而高效! 光纤回路设计作为智能变电站的关键环节,对电网的稳定运行起着至关重要的作用。为了让您的光纤设计之路更加顺畅,我们隆重推出了这款智能变电站光纤回路设计软件。这款软件以其简单易用的…

蓝桥杯 子串简写(暴力)

题目&#xff1a;子串简写 代码1&#xff1a; #include<algorithm> #include<iostream> #include<cstring> #include<queue> #include<cmath>using namespace std;char c1,c2; int k; char s[100010]; int a[100010]; int b[100010]; int cnt; …

软件设计师——数据库

数据库 三级模式两级映像关系模型基本术语关系模型中的关系完整性约束 三级模式两级映像 概念模式&#xff08;也称模式&#xff09;对应基本表 外模式&#xff08;也称用户模式或子模式&#xff09;对应视图 内模式&#xff08;也称存储模式&#xff09;对应存储文件 两级映像…

什么是并行通信、串行通信?什么是全双工、半双工、单工? 什么是异步通信、同步通信? 什么是RS232、RS485?什么是pwm?

这篇文章主要讲一下单片机中的通信相关的内容 主要讲一下以下5个问题&#xff1a; 1.什么是并行通信、串行通信&#xff1f; 2.什么是全双工、半双工、单工&#xff1f; 3.什么是异步通信、同步通信&#xff1f; 4.什么是RS232、RS485&#xff1f; 5.什么是pwm&#xff1f;什…

Educational Codeforces Round 162 (Rated for Div. 2) ----- E. Count Paths --- 题解

E. Count Paths&#xff1a; 题目大意&#xff1a; 思路解析&#xff1a; 根据题目中定义的美丽路径&#xff0c;我们可以发现路径只有两种情况&#xff1a; 当前结点作为起始结点&#xff0c;那我们只需要知道它的子树下有多少个相同颜色的结点&#xff0c;并且相同颜色的结…

TR3 - Transformer算法详解

目录 文本输入处理词向量位置向量 编码器 EncoderSelf-Attention多头注意力机制残差连接 解码器 Decoder线性层与Softmax损失函数总结与心得体会 这周来看一下Transformer是怎么将文本转换成向量&#xff0c;然后又输入到模型处理并得到最终的输出的。 文本输入处理 词向量 …