Note-模型的特征学习过程分析

模型的学习过程

将数据的特征分为,有用特征和无用特征(噪声).有用特征与任务有关,无用特征与任务无关.
模型的学习过程就是增大有用特征的权重并减少无用特征的权重的过程.
神经网络反向传播过程简化如下:
y = a 0 x 0 + a 1 x 1 , l o s s = 0.5 ∗ ( y l a b e l − y ) 2 y = a_0x_0 + a_1x_1, loss = 0.5*(y_{label}-y)^2 y=a0x0+a1x1,loss=0.5(ylabely)2
d l o s s / d y = y − y l a b e l d_{loss}/d_y = y-y_{label} dloss/dy=yylabel
d l o s s / d a = d l o s s / d y ∗ d y / d a = ( y − y l a b e l ) ∗ x d_{loss}/d{a} = d_{loss}/d_y*d_y/d_a = (y-y_{label})*x dloss/da=dloss/dydy/da=(yylabel)x
a n e x t = a + η ( y l a b e l − y ) ∗ x , η > 0 a_{next} = a+\eta (y_{label}-y)*x,\eta>0 anext=a+η(ylabely)x,η>0
假设x0为无用特征,x1为有用特征

增大有用特征的权重

考虑上述公式:

假设x1和label正相关,a1为正:
若x1增大(减少),则label也增大(减少),由于学习需要过程,y的增大(减少)跟不上,则此时(y_{label}-y)>0(<0),所以此时a1增大,即学习到了正相关有用特征.
假设x1和label负相关,a1为负:
若x1增大(减少),则label减少(增大),由于学习需要过程,y的增大(减少)跟不上,则此时(y_{label}-y)<0(>0),所以此时a1减少,即模型学习到了负相关的有用特征.
注释:上述的跟不上指学习过程中,如果跟上了就是学习完成了

减少无用特征的权重

考虑上述公式:

x0是无用特征,x和label无关
假设a0为正:
若x0增大(减少),而label不变,y也增大(减少),则此时(y_{label}-y)<0(>0),所以此时a减少,即抑制了无用特征.
假设a0为负:
若x0增大(减少),而label不变,y也减少(增大),则此时(y_{label}-y)>0(<0),所以此时a增大,即抑制了无用特征.

总结以下:在学习过程在,有用特征的权重,总是同向增强(正增负减).无用特征反向减弱(负增正减).
至于如何学习有用特征抑制无用特征,就是让这些特征出现在学习过程中,反向传播自然就是调整它们的梯度.

过拟合

过拟合是指模型在训练数据上表现很好,但在未知数据上表现不佳。这通常是因为模型在训练数据上学习了过多的噪声和异常值,导致在新的、未见过的数据上泛化能力下降。
在这里插入图片描述

在学习过程中,如果无用特征的出现次数太少,其权重就会没有得到抑制,训练集可以通过调整权重,组合有用特征和无用特征,仍然可以输出正确的结果.而测试集上无用特征稍微变化一下,原有的有用特征和无用特征组合就不再适用.

小数据训练trick

小数据集训练指通过单gpu/单batch/无数据增强训练少量数据,快速验证模型的拟合能力.这个学习过程就是过拟合过程,学习了大量无用特征,因此如果想测试,就需要和原有一模一样的数据处理pipeline.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/595764.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

出门一笑, “栈” 落江横 (Java篇)

本篇会加入个人的所谓‘鱼式疯言’ ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. &#x1f92d;&#x1f92d;&#x1f92d;可能说的不是那么严谨.但小编初心是能让更多人…

C语言中strcpy函数的实现

C语言中strcpy函数的实现 为了便于和strcpy函数区别&#xff0c;以下命令为_strcpy。 描述&#xff1a;实现strcpy&#xff0c;字符串拷贝函数&#xff0c;函数原型如下&#xff1a; char* strcpy(char* _Destination, const char *_Source);_strcpy实现&#xff1a; char*…

指针 基础知识

本笔记为观看56 指针-指针的定义和使用_哔哩哔哩_bilibili后的学习笔记 指针的定义和使用 1、定义指针 int main () {//1、定义指针int a 10;//指针定义的语法&#xff1a; 数据类型 * 指针变量名&#xff1b;int * p;//让指针记录变量a的地址p &a; //& 为取址符cou…

学习Python的第四天

使用工具 PyCharm Community Edition 2023.3.4 使用环境 Python3.10.4 目录 1.字面量 1.1 值的类型 1.2 字面量的写法 2.注释 2.1 注释的作用 2.2 单行注释 2.2.1 语法 2.3 多行注释 2.3.1 语法 2.3.2 一般用来解释 2.4 注释示例 2.4.1 运行结果 3.变量 3.1…

【轻松一刻】中国茶叶探索奇妙之旅

文章目录 茶多酚 茶叶大类 龙井茶 泡茶方法 茶叶保存 参考资料 茶多酚 茶多酚是形成茶叶色香味的主要成份之一&#xff0c;也是茶叶中有保健功能的主要成份之一。茶多酚的副产品咖啡因&#xff0c;又称为咖啡碱&#xff0c;能兴奋大脑皮层&#xff0c;所以喝茶有提神作用…

【单片机】PMS5003,PM2.5传感器数据读取处理

文章目录 传感器介绍数据处理解析pm2.5的代码帮助、问询 传感器介绍 PMS5003是一款基于激光散射原理的数字式通用颗粒物浓度传感器,可连续采集 并计算单位体积内空气中不同粒径的悬浮颗粒物个数,即颗粒物浓度分布,进而 换算成为质量浓度,并以通用数字接口形式输出。本传感器可…

ES学习日记(八)-------ik安装和简易使用

一、下载和安装 https://github.com/infinilabs/analysis-ik.git 网络不好可以用这个地址,注意:ik版本要和es版本保持一致 现成地址 注意es用户操作或给es用户权限 plugins新建ik文件夹,并把压缩包解压到ik unzip elasticsearch-analysis-ik-7.4.2.zip /bin目录启动es: 二…

MySql并发事务问题

事务 事务概念&#xff1a; 事务是一组操作的集合&#xff0c;它是一个不可分割的工作单位&#xff0c;事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求&#xff0c;即这些操作要么同时成功&#xff0c;要么同时失败。 事务的特性&#xff1a;ACID&#xff1a; 小…

【HTML】CSS样式(二)

上一篇我们学习了CSS基本样式和选择器&#xff0c;相信大家对于样式的使用有了初步认知。 本篇我们继续来学习CSS中的扩展选择器及CSS继承性&#xff0c;如何使用这些扩展选择器更好的帮助我们美化页面。 下一篇我们将会学习CSS中常用的属性。 喜欢的 【点赞】【关注】【收藏】…

【SCI绘图】【曲线图系列1 python】绘制扫描点平滑曲线图

SCI&#xff0c;CCF&#xff0c;EI及核心期刊绘图宝典&#xff0c;爆款持续更新&#xff0c;助力科研&#xff01; 本期分享&#xff1a; 【SCI绘图】【曲线图1 python】绘制扫描点平滑曲线图 1.环境准备 python 3 import numpy as np import pandas as pd import proplot …

面试算法-139-盛最多水的容器

题目 给定一个长度为 n 的整数数组 height 。有 n 条垂线&#xff0c;第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线&#xff0c;使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 说明&#xff1a;你不能倾斜容器。…

电脑上音频太多,播放速度又不一致,如何批量调节音频播放速度?

批量调节音频速度是现代音频处理中的一个重要环节&#xff0c;尤其在音乐制作、电影剪辑、有声书制作等领域&#xff0c;它能够帮助制作者快速高效地调整音频的播放速度&#xff0c;从而满足特定的制作需求。本文将详细介绍批量调节音频速度的方法、技巧和注意事项&#xff0c;…