第二课 经济金融案例实战

news/2025/2/11 0:39:07/文章来源:https://www.cnblogs.com/dingxingdi/p/18709031

目录
  • 导入数据并观察
  • 合并数据
    • 提取出标签并对标签进行处理
    • 合并训练集和测试集
  • 变量转化
    • 正确化变量属性
    • 对分类型特征进行独热编码
    • 填写数值型特征的缺失值
    • 标准化数值型特征
  • 建立模型
    • 分出训练集和测试集
  • 集成
  • 提交结果

导入数据并观察

合并数据

image
这里可能有个问题。我们说不要让模型提前见到数据,那么这里将训练集和测试集合并起来处理是否违反了这个规则呢?实际上,现实中我们是拿不到测试集的,所以不存在这个问题,在竞赛中,我们拿到了测试集,为了让模型的效果更好,我们会故意让模型提前看到测试集的一部分

提取出标签并对标签进行处理

image
image
image
image
image

合并训练集和测试集

image

变量转化

image

正确化变量属性

image
image
image
image

对分类型特征进行独热编码

image
image
image

填写数值型特征的缺失值

image
image
image
image
image

标准化数值型特征

image
image
image
image

建立模型

分出训练集和测试集

image

集成

image
image
image
image
image
image

提交结果

看到了1:28:15

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/881926.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32学习笔记【电赛历险记嵌入式学习心得】

关于STM32F103C8T6的学习笔记,除基础介绍外,包含标准库与HAL库,涉及蓝牙、电机、超声波、红外等模块,涉及GPIO、中断、定时器、IC输入捕获、ADC、DMA等基础模块,含有CubeMX学习,C语言预编译知识,含有推荐学习项目链接。前言 此篇随笔是博主在打电赛(全国大学生电子设计…

【K8S安全】浅析K8S各种未授权攻击方法

免责声明: 本篇文章仅用于技术交流,请勿利用文章内的相关技术从事非法测试,由于传播、利用本文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,本文作者不为此承担任何责任,一旦造成后果请自行承担!如有侵权烦请告知,我们会立即删除并致歉。谢谢…

卷积神经网络(1)初步了解

先介绍一个简单的例子 要手动实现一个简单的卷积神经网络(CNN)来判断手写数字(1-10),我们可以使用 Python 和 TensorFlow(或其他深度学习框架)。以下是一个简单的实现思路,其中包含了手动构建卷积层、池化层、全连接层等。 假设你已经有了手写数字数据集,比如 MNIST 数…

RocketMQ实战—9.营销系统代码初版

大纲 1.基于条件和画像筛选用户的业务分析和实现 2.全量用户促销活动数据模型分析以及创建操作 3.Producer和Consumer的工程代码实现 4.基于抽象工厂模式的消息推送实现 5.全量用户促销活动消息推送的流程和缺陷分析 6.全量用户促销活动推送引入MQ进行削峰 7.全量用户发优惠券业…

Qwen2.5 Max:最有可能是DeepSeek R1的平替

新年还没过,推理大模型就开始了卷了,除夕当天Qwen就发布了重磅的Qwen2.5 Max推理模型,一、Qwen2.5 Max2025年1月28日,qwen团队发布了Qwen2.5 Max,总体来说,还是很不错的。下面是摘抄他们发表的信息:We evaluate Qwen2.5-Max alongside leading models, whether propriet…

第一课 通用流程

其中\(\text{KNN}\)使用已经很少了,\(\text{SVM}\)在中小型数据集上表现很好目录了解场景和目标了解评估准则认识数据数据预处理数据清洗数据采样特征工程特征处理数值型类别型时间类文本型统计型组合特征特征选择过滤法包装法嵌入法模型融合BaggingStackingBoosting 了解场景…

DeepSeek本地化部署超简单,比装个office还简单

一、背景 最近DeepSeek太火了,以至于每位伙伴都想尝试,都想说上几句。作为一名程序员,不仅想使用这个DeeptSeek的AI工具,还是用其做更多的事情,比如本地化部署、构建自己的知识库,或者其他的应用。 本以为DeepSeek本地化部署有多难,实际上验证后很简单,任何普通人只要会…

【CTF】内存取证分析

免责声明: 此文转载自Tide安全团队原创文章,转载请声明出处!文中所涉及的技术、思路和工具仅供以安全为目的的学习交流使用,任何人不得将其用于非法用途给予盈利等目的,否则后果自行承担!一、基本概念 内存取证是指从计算机内存(RAM)中提取和分析数据的过程。当计算机运…

如何轻松保存或导出 Windows 聚焦图片

转自:https://www.sysgeek.cn/save-windows-spotlight-images/ Windows 聚焦功能可以让桌面和锁屏界面每天都呈现新的风景。如果你看到某张特别喜欢的图片,想要长期使用,要怎么找到图片在哪儿呢?本指南将教你如何在 Windows 11 和 Windows 10 上,轻松找到并保存 Windows 聚…

2025/2/10课堂记录

树上依赖背包,分组背包,vector邻接表,选课,树上dp,叶子的染色,链式前向星邻接表,数字转换,树的直径目录选课 叶子的染色 数字转换选课分组背包题 这次是自己写的代码了,也就瞟了标准答案几眼,真的就几眼用的也是vector邻接表#include<iostream> #include<ve…

3.4 什么是浮点数

很多编程语言中都提供了两种表示小数的数据类型,分别为双精度浮点数和单精度浮点数 双精度浮点数类型用64位、单精度浮点数类型用32位来表示全体小数。 在C语言中,双精度浮点数类型和单精度浮点数类型分别用double和float来表示 浮点数是指用符号、尾数、基数和指数这四部分来…

响应

ResponseBody注解 位置:controll类和方法 作用:将方法返回值直接相应,如果是实体对象和集合转成Json形式再相应、 统一响应格式 result里有静态方法