【Python机器学习】线性模型——lasso

除了岭回归,还有一种正则化的线性回归是lasso,与岭回归相同,使用lasso也是约束系数使其接近于0,但方法不同,叫做L1正则化。L1正则化的结果是使用lasso时某些系数刚好为0。说明某些特征被模型完全忽略。

同样以波士顿房价数据集为例:

import mglearn.datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge,LinearRegression,Lasso
from sklearn.neighbors import KNeighborsRegressor
import matplotlib.pyplot as plt
import numpy as npplt.rcParams['font.sans-serif']=['SimHei']X,y=mglearn.datasets.load_extended_boston()
X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=0
)lasso=Lasso().fit(X_train,y_train)
print('训练集score:{:.2f}'.format(lasso.score(X_train,y_train)))
print('测试集score:{:.2f}'.format(lasso.score(X_test,y_test)))
print('用到的特征:{}'.format(np.sum(lasso.coef_!=0)))

从结果可以看出,Lasso在训练集和测试集上表现都很差,说明存在欠拟合,因为在数据集的105个特征中只用到了4个。

与岭回归类似,Lasso也存在一个正则化参数alpha,可以控制系数趋向于0的强度,为了减低欠拟合成都,可以减小alpha,同时,增加max_iter(运行迭代的最大次数)


lasso_001=Lasso(alpha=0.01,max_iter=100000).fit(X_train,y_train)
print('训练集score:{:.2f}'.format(lasso_001.score(X_train,y_train)))
print('测试集score:{:.2f}'.format(lasso_001.score(X_test,y_test)))
print('用到的特征:{}'.format(np.sum(lasso_001.coef_!=0)))lasso_00001=Lasso(alpha=0.0001,max_iter=100000).fit(X_train,y_train)
print('训练集score:{:.2f}'.format(lasso_00001.score(X_train,y_train)))
print('测试集score:{:.2f}'.format(lasso_00001.score(X_test,y_test)))
print('用到的特征:{}'.format(np.sum(lasso_00001.coef_!=0)

 

alpha变小可以拟合一个更复杂的模型,在训练集和测试集上 的表现也更好,但是alpha不能设置的太小,否则就会消除正则化的效果,并出现过拟合,得到与线性回归类似的模型。

对不同alpha系数的结果进行可视化对比:

import mglearn.datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge,LinearRegression,Lasso
from sklearn.neighbors import KNeighborsRegressor
import matplotlib.pyplot as plt
import numpy as npplt.rcParams['font.sans-serif']=['SimHei']X,y=mglearn.datasets.load_extended_boston()
X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=0
)
lasso=Lasso().fit(X_train,y_train)
lasso_001=Lasso(alpha=0.01,max_iter=100000).fit(X_train,y_train)
lasso_00001=Lasso(alpha=0.0001,max_iter=100000).fit(X_train,y_train)
ridge_01=Ridge(alpha=0.1).fit(X_train,y_train)plt.plot(lasso.coef_,'s',label='lasso alpha=1')
plt.plot(lasso_001.coef_,'^',label='lasso alpha=0.01')
plt.plot(lasso_00001.coef_,'v',label='lasso alpha=0.0001')plt.plot(ridge_01.coef_,'o',label='岭 alpha=0.1')
plt.xlabel('index')
plt.ylabel('系数大小')
plt.ylim(-25,25)
plt.legend(ncol=2,loc=(0,1.05))
plt.show()

在alpha=1时,大部分系数大小都是0,而且其他系数也很小,alpha=0.01时,大部分特征等于0,alpha=0.0001时,大部分特征都不等于0且很大,就是一个正则化很弱的模型了 。

alpha=0.1的岭回归模型的预测功能与alpha=0.01的Lasso模型类似,但岭回归的所有系数都不为0。

在实践中,一般首选岭回归,但如果特征很多,且只有几个事重要的,那选择Lasso可能更好,且更容易解释。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/326647.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

亚马逊自养号测评:提升商品排名与流量的必要操作

自养号测评是通过使用自主注册的海外买家账号,对商品进行评价,以提升其在平台上的排名和流量的操作。卖家选择自养号这种方式来增强商品的曝光度和吸引更多潜在买家。然而,养号并非易事,需要卖家提高养号技术、掌握相应技巧&#…

SonarQube 漏洞扫描

SonarQube 漏洞扫描 一、部署服务 1.1 docker方式部署 #安装docker curl -L download.beyourself.org.cn/shell-project/os/get-docker-latest.sh | sh yum install -y docker-compose #进去输入:set paste可以保证不穿行 [rootlocalhost sonar]# vim docker-compose.yml v…

git本地创建分支并推送到远程关联起来

git本地创建分支并推送到远程关联起来 git本地基于当前分支创建个新的分支,然后推送到远程,并把本地新创建的分支和远程分支关联 在当前分支下,新建分支 git checkout -b test推送到远程仓库 git push origin test将本地分支和远程分支关联…

0基础学习VR全景平台篇第134篇:720VR全景,云台调整节点

相机、云台和脚架全套设备组装完成后需要进行调校才能开始拍摄。这一节,我们将主要介绍云台调整的两个内容:对中心靶、调三点一线。(后附调校原理) 云台部件名称 一、调节准备 (一)对于安装好的云台 1.检…

音量控制软件sound control mac功能亮点

sound control mac可以帮助用户控制某个独立应用程序的音量,通过每应用音量,均衡器,平衡和音频路由独立控制每个应用的音频,还有整个系统的音量。 sound control mac功能亮点 每个应用程序的音量控制 独立控制应用的数量。 键盘音…

docker安装nodejs,并更改为淘宝源

拉取官方 Node.js 镜像 docker pull node:latest创建 Dockerfile,并更改 NPM 下载源为淘宝源,设置为全局持久化 # 使用最新版本的Node.js作为基础镜像 FROM node:latest# 设置工作目录为/app WORKDIR /app # 更改 NPM 下载源为淘宝源,并设置…

让桥梁学会“说话”

背景 2023年7月6日凌晨时分,G5012恩广高速达万段230公里加80米处6号大桥部分桥面发生垮塌,导致造成2车受损后自燃,3人受轻伤。目前,四川省公安厅交通警察总队高速公路五支队十四大队民警已对现场进行双向管制。 作为世界第一桥梁…

Vue介绍和基本使用

0 前端的发展史 1.HTML(5)、CSS(3)、JavaScript(ES5、ES6):编写一个个的页面 -> 给后端(PHP、Python、Go、Java) -> 后端嵌入模板语法 -> 后端渲染完数据 -> 返回数据给前端 -> 在浏览器中查看 2.Ajax的出现 -> 后台发送异步请求,Re…

【人工智能】深入了解人工智能的核心算法与应用实践

人工智能 学习AI要看的第一本书人工智能应当以人为本人工智能(第3版)通晓六点,明白人工智能是怎么回事基本概念和历史基础知识基于知识的系统高级专题现在和未来安全和编程 人工智能已经是基础学科 学习AI要看的第一本书 人工智能知识对于当…

使用ArrayList居然用forEach遍历删除元素,该打

通常1-3年工作经验的程序员算是初级程序员,再往后基本上就是在编程领域有了一定经验的高级程序员了。 但是最近公司代码review时,我居然发现一个 5 年工作经验的程序员,使用 ArrayList 居然用 forEach 遍历删除元素? 1、现场还原 由于公司代码有一定敏感,我这里把代码进…

Vue页面传值:Props属性与$emit事件的应用介绍

一、vue页面传值 在Vue页面中传值有多种方式,简单介绍以下两种 通过props属性传递值:父组件在子组件上定义props属性,子组件通过props接收父组件传递的值。通过$emit触发事件传递值:子组件通过$emit方法触发一个自定义事件&#…

EtherCAT主站SOEM -- 13 --Qt-Soem通过界面按键控制 EtherCAT IO模块的io输出

EtherCAT主站SOEM -- 13 --Qt-Soem通过界面按键控制 EtherCAT IO模块的io输出 一 mainwindow.c 文件函数:1.1 自定义PDO配置2.2 主站初始化2.3 去motrorcontrol界面二 motrorcontrol.c 文件三 allvalue.h 文件该文档修改记录:总结一 mainwindow.c 文件函数: mainwindow主界…