动手学深度学习-python基础知识介绍（数据处理基础流程）part2-编程知识

动手学深度学习-python基础知识介绍（数据处理基础流程）part2

news/2025/1/8 5:40:36/文章来源:https://www.cnblogs.com/lizhongzheng/p/18656294

数据预处理

import os
os.makedirs(os.path.join('..','data'),exist_ok=True)
data_file=os.path.join('..','data','house_tiny.csv')
with open(data_file,'w') as f:f.write('NumRooms,Alley,Price\n') #列名f.write('NA,Pave,127500\n') #每行表示一个数据样本f.write('2,NA,106000\n')f.write('4,NA,178100\n')f.write('NA,NA,140000\n')#os.path.join('..', 'data')：生成一个路径字符串，表示当前目录的父目录下的data文件夹。
#os.makedirs(..., exist_ok=True)：创建这个目录。如果目录已经存在，exist_ok=True参数会防止抛出错误。
# os.path.join('..', 'data', 'house_tiny.csv')：生成一个路径字符串，表示data文件夹下的house_tiny.csv文件。
# with open(data_file, 'w') as f：以写入模式打开文件。如果文件已存在，会被覆盖。
# f.write(...)：向文件写入字符串。每行字符串表示一个数据样本，包括列名和数据。

从创建的csv文件中加载原始数据集

import pandas as pd
data=pd.read_csv(data_file)
print(data)

处理缺失数据，可以插值以及删除

# 插值
#对于每列中的缺失值，使用该列的平均值进行填充
inputs,outputs=data.iloc[:,0:2],data.iloc[:,2]
inputs=inputs.fillna(inputs.mean())
print(inputs)
#fillna方法填充inputs中的缺失值（NA）
#inputs.mean()：计算inputs中每列的平均值

对于inputs中的类别值（离散值），我们将“NAN”视为一个类别

inputs=pd.get_dummies(inputs,dummy_na=True)
print(inputs)# pd.get_dummies(inputs)：这个函数将inputs DataFrame中的分类变量转换为虚拟变量。对于每个分类变量的每个类别，
# 都会创建一个新的列，值为0或1，表示该类别是否存在于原始数据中。例如，如果Alley列有值Pave和NA，
# 则会生成两个新的列：Alley_Pave和Alley_NA。# dummy_na=True：
# 这个参数指示pd.get_dummies在处理缺失值（NA）时，也要将其视为一个单独的类别，并为其创建一个虚拟变量列。
# 例如，如果Alley列中有缺失值，dummy_na=True会创建一个额外的列（如Alley_NA），
# 并将缺失值所在行的该列值设为1，其他行设为0。

现在inputs和outputs中所有的条目都是数值类型，可以转换为张量格式

import torchx,y=torch.tensor(inputs.values),torch.tensor(outputs.values)
x,y

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/865044.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

VS2022添加Qt窗口类（带.ui文件）

1、项目-属性-右键-添加-模块

基于自抗扰控制器和线性误差反馈控制律(ADRC-LSEF)的控制系统simulink建模与仿真

1.课题概述基于自抗扰控制器和线性误差反馈控制律(ADRC-LSEF)的控制系统simulink建模与仿真。2.系统仿真结果 3.核心程序与模型版本：MATLAB2022a 4.系统原理简介自抗扰控制器(Active Disturbance Rejection Controller, ADRC)结合线性误差反馈控制律(Linear Error Feedback…

MediaWIKI 1.43 教程系列 4 — MediaWIKI 安装后的基本配置

1. 更改logo 将自己的logo 导入到 Mediawiki 的安装目录，即 /var/www/mediawiki/里面的 /resources/assets 然后修改 LocalSettings.php 文件内容，更改如下$wgLogos = [1x => "$wgResourceBasePath/resources/assets/mediawiki.png",icon => "$wgReso…

在iStoreOS上配置frpc客户端

摘自：https://www.koolcenter.com/posts/224 安装frpc，直接在iStoreOS商店找到全部软件。输入名称点新增：填写ip地址以及端口：web 配置看图：

中考英语优秀范文-010 The Spring Festival 春节

1 写作要求近年来我国的发展世人瞩目，中国的传统文化正越来越受到各国朋友的关注。请根据提示，以 “The Spring Festival” 为题写一篇短文，向外国朋友介绍我国的春节。要求： 1、字迹工整，规范； 2、 80词左右。 2 优秀范文 The Spring Festival In China, the Spring f…

FANUC机器人M-410iB/700电机断轴维修方法

发那科（FANUC）作为电机领域的领袖品牌，其伺服电机广泛应用于各种工业设备中，特别是在机床、自动化控制、机器人等领域。然而，即使是如此高品质的伺服电机，也难免会出现FANUC工业机械手电机故障，其中断轴故障是比较常见的一种。一、法兰克机械手电机断轴故障原因分析 1.…

第四章保护模式入门

本文是对《操作系统真象还原》第四章学习的笔记，欢迎大家一起交流。第四章保护模式入门本文是对《操作系统真象还原》第四章学习的笔记，欢迎大家一起交流。知识部分为什么要有保护模式？实模式下安全问题：实模式下操作系统和用户程序属于同一特权级，平起平坐，没有区别…

FMC子卡设计原理图：FMC228-四路1.2Gsps 16bit DA FMC子卡

FMC子卡 , 高性能异构计算卡 , 雷达图像处理 , 模拟信号采集板卡 , 模拟信号输入FMC228-四路1.2Gsps 16bit DA FMC子卡一、板卡概述FMC228 板卡可实现宽波段、四通道、16位、1.2Gsps（600Msps直接射频综合）DAC功能，时钟可采用内部时钟源（可选择锁定到外部参考），或外部提供…

FMC子卡设计原理图：165-2路万兆光纤SFP+ FMC子卡模块

2路万兆光纤SFP+ FMC子卡模块1. 概述　　该板卡是基于kc705和ml605的fmc 10g万兆光纤扩展板设计。　　SFP+（10 Gigabit Small Form Factor Pluggable）是一种可热插拔的，独立于通信协议的光学收发器，通常传输光的波长是 850nm, 1310nm 或1550nm，用于10G bps的SONET/SDH，光…

FMC子卡设计方案：127-4通道 12bit 125Msps 直流耦合 AD FMC 子卡

DA输出子卡 , FMC 子卡 , 中低频信号采集 , 模拟信号输入 , FL9627模块4通道 12bit 125Msps 直流耦合 AD FMC 子卡一、板卡概述:FMC 高速 AD 模块 FL9627 为 4 路 125MSPS， 12 位的模拟信号转数字信号模块。 FMC 模块的 AD 转换采用了 2 片 ADI 公司的 AD9627 芯片，每个 AD9…

跨时区协作：娱乐公司团队的全球化利器！

在线文档协作工具如何提升娱乐公司团队的创意效率？在娱乐行业，创意是核心竞争力。无论是剧本创作、音乐制作，还是影视后期，团队协作的效率直接决定了项目的成败。而在线文档协作工具，正是提升这一效率的利器。今天，我们就从一个具体的点来发散——“实时协作”，看看它如…

tableau连接不上mysql或不显示mysql表的终极解决方法.220301

【报错一】连不上mysql An error occurred while communicating with MySQL The connection to the data source might have been lost. Error Code: 2868C972 The protocol is disconnected! Unable to connect to the MySQL server "*****". Check that the server…