1、什么是特征工程

1、欢迎来到特征工程!!

在这门课程中,你将学习到构建一个优秀的机器学习模型过程中最重要的一步:特征工程。你将学习如何:

  • 使用互信息确定哪些特征最重要
  • 在几个真实世界的问题领域中创造新的特征
  • 使用目标编码对高基数分类进行编码
  • 使用k-means聚类创建分割特征
  • 使用主成分分析将数据集的变化分解为特征

动手练习将构建一个完整的笔记本,应用所有这些技术来提交房价预测的入门竞赛。完成这门课程后,你将有几个可以用来进一步提高你的性能的想法。

你准备好了吗?让我们开始吧!!

2、特征工程的目标

特征工程的目标就是使你的数据更适合手头的问题。

考虑一下"显而易见的温度"度量,如热指数和风寒指数。这些量试图根据我们可以直接测量的空气温度、湿度和风速来衡量人类感知的温度。你可以把显而易见的温度看作是一种特征工程的结果,试图使观察到的数据更相关于我们真正关心的问题:外面的感觉如何!!

你可能会进行特征工程来:

  • 提高模型的预测性能
  • 减少计算或数据需求
  • 提高结果的可解释性

3、特征工程的指导原则

对于一个特征来说,它必须与你的模型能够学习的目标有关系。例如,线性模型只能学习线性关系。所以,当使用线性模型时,你的目标是转换特征,使它们与目标的关系变为线性。

这里的关键思想是,你应用于一个特征的转换本质上成为了模型本身的一部分。假设你正在试图从一边的长度预测正方形地块的价格。直接将线性模型拟合到长度会得到糟糕的结果:关系不是线性的。
在这里插入图片描述

使用线性模型仅以长度为特征时拟合较差。

如果我们将长度特征平方得到’面积’,然而,我们创建了一个线性关系。将面积添加到特征集意味着这个线性模型现在可以拟合一个抛物线。换句话说,平方一个特征,给了线性模型拟合平方特征的能力。
在这里插入图片描述

左图: 贴合区域要好得多。

右图: 这也使长度更适合。

这应该向你展示了为什么在特征工程上投入时间会有如此高的回报。你的模型无法学习的任何关系,你都可以通过转换自己提供。当你开发你的特征集时,思考一下你的模型可以使用什么信息来达到其最佳性能。

4、例子 - 混凝土配方

为了说明这些想法,我们将看到如何向数据集添加一些合成特征可以提高随机森林模型的预测性能。

混凝土数据集包含各种混凝土配方和最终产品的抗压强度,这是一个衡量这种混凝土可以承受多少负载的度量。这个数据集的任务是根据其配方预测混凝土的抗压强度。

In [1]:

import pandas as pd
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import cross_val_scoredf <

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/434481.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分段函数线性化方法matlab测试

目录 1 使用0-1变量将分段函数转换为线性约束 2 连续函数采用分段线性化示例 3 matlab程序测试 4 matlab测试结果说明 5 分段线性化应用 1 使用0-1变量将分段函数转换为线性约束 2 连续函数采用分段线性化示例 3 matlab程序测试 clc;clear all; gn10;tn1; x_pfsdpvar(1, t…

Python初学者学习记录——python基础综合案例:数据可视化——地图可视化

一、基础地图使用 1、基础地图演示 2、基础地图演示——视觉映射器 from pyecharts.charts import Map from pyecharts.options import VisualMapOpts# 准备地图对象 map Map() # 准备数据 data [("北京市", 99),("上海市", 199),("湖南省", 2…

(八)springboot实战——springboot3下的webflux项目全局异常处理

前言 在webflux响应式编程中&#xff0c;如何处理系统运行时异常是本节的主要内容。在传统的Servlet阻塞式web项目中主要通过HandlerExceptionResolver处理器来处理&#xff0c;而在webflux响应式web项目中&#xff0c;则是通过DispatchExceptionHandler异常处理器来处理异常。…

Hammer.js中文教程

一、什么是hammer.js hammerJS是一个开源的&#xff0c;轻量级的触屏设备javascript手势库&#xff0c;它可以在不需要依赖其他东西的情况下识别触摸&#xff0c;鼠标事件。允许同时监听多个手势、自定义识别器&#xff0c;也可以识别滑动方向。 优点&#xff1a; 为移动端网…

Wpf 使用 Prism 实战开发Day16

客户端使用RestSharp库调用WebApi 动态加载数据 在MyDoTo客户端中&#xff0c;使用NuGet 安装两个库 RestSharp Newtonsoft.Json 一. RestSharp 简单的使用测试例子 当前章节主要目的是&#xff1a;对RestSharp 库&#xff0c;根据项目需求再次进行封装。下面先做个简单的使用…

[SpingBoot] 3个扩展点

初始化器ApplicationContextInitializer监听器ApplicationListenerRunner: Runner的一般应用场景就是资源释放清理或者做注册中心, 因为执行到Runner的时候项目已经启动完毕了, 这个时候可以注册进注册中心。 文章目录 1.初始化器ApplicationContextInitializer2.监听器Applica…

系统架构设计师教程(十七)通信系统架构设计理论与实践

通信系统架构设计理论与实践 17.1 通信系统概述17.2 通信系统网络架构17.2.1局域网网络架构17.2.2 广域网网络架构17.2.3 移动通信网网络架构17.2.4存储网络架构17.2.5 软件定义网络架构17.3 网络构建关键技术17.3.1 网络高可用设计17.3.2 IPv4与IPv6融合组网技术17.3.3 SDN技术…

光明之盒:揭开可解释性人工智能的神秘面纱

在人工智能&#xff08;AI&#xff09;的日益普及之际&#xff0c;可解释性人工智能&#xff08;Explainable AI&#xff0c;简称XAI&#xff09;成为了桥接人机理解的关键技术。XAI不仅让人们窥视AI的内在工作原理&#xff0c;还能够提高我们对其决策过程的信任感。本文将深入…

物联网IOT: 风浆叶片拧紧装配及实时监测系统

某大型风电设备,通过机器人应用与精益化生产体系的融合,打造出行业领先的具备柔性生产能力的“脉动式”生产体系。同时在关键工序上。其中,在叶片装配等关键工序上使用由智能机器人代替人工,以提高生产的效率和装配质量可靠性,将六轴机器人、视觉系统、光电系统、液压、气动、伺…

仅使用 Python 创建的 Web 应用程序(前端版本)第08章_商品详细

在本章中,我们将实现一个产品详细信息页面。 完成后的图像如下。 Model、MockDB、Service都是在产品列表页实现的,所以创建步骤如下。 No分类内容1Page定义PageId并创建继承自BasePage的页面类2Application将页面 ID 和页面类对添加到 MultiPageApp 的页面中Page:定义PageI…

HbuilderX报错“Error: Fail to open IDE“,以及运行之后没有打开微信开发者,或者运行没有反应的解决办法

开始 问题:HbuilderX启动时,打开微信开发者工具报错"Error: Fail to open IDE",以及运行之后没有打开微信开发者,或者运行没有反应的解决办法! 解决办法: 按照步骤一步一步完成分析,除非代码报错,否则都是可以启动的 第一步:检查HbuildX是否登录账号 第二步:检查微信…

Stable Diffusion插件Recolor实现黑白照片上色

今天跟大家分享一个使用Recolor插件通过SD实现老旧照片轻松变彩色&#xff0c;Recolor翻译过来的含义就是重上色&#xff0c;该模型可以保持图片的构图&#xff0c;它只会负责上色&#xff0c;图片不会发生任何变化。 一&#xff1a;插件下载地址 https://github.com/pkuliyi…