天池XGBoost,重写柱状图代码,标签编码

天池XGBoost

地址

重写柱状图代码:我没考虑复杂度,只考虑直观理解

原文统计地点是否降雨来画柱状图实在是太麻烦了,我重写了一下。最麻烦的就是数据处理。我的思路是:

  1. 首先取下雨的全部数据data[data['RainTomorrow'] == 'Yes']

  2. 然后对地点进行分组groupby('Location').size()。不加size()没输出的,没加的结果:

    <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001FEF989EEE0>
    
  3. 最后加上列数量和列名reset_index(name='Count')。这句不加的结果是这样:

    Location
    Adelaide         513
    Albany           665
    Albury           454
    AliceSprings     169
    BadgerysCreek    425
    
  4. 总结123,下雨和没下雨的数据就为:

    data_LocYes = data[data['RainTomorrow'] == 'Yes'].groupby('Location').size().reset_index(name='Count')
    data_LocNo = data[data['RainTomorrow'] == 'No'].groupby('Location').size().reset_index(name='Count')
    

    输出结果:

    	Location	Count
    0	Adelaide	513
    1	Albany	665
    2	Albury	454
    3	AliceSprings	169
    4	BadgerysCreek	425
    
  5. 然后进行可视化:

    plt.figure(figsize=(15,15))plt.subplot(1,2,1)
    plt.title('RainTomorrow')
    sns.barplot(y = data_LocYes['Location'], x = data_LocYes['Count'], color = "red")plt.subplot(1,2,2)
    plt.title('Not RainTomorrow')
    sns.barplot(y = data_LocNo['Location'], x = data_LocNo['Count'], color = "blue")plt.show()
    

在这里插入图片描述

标签编码

感觉官方少了一句标签编码的代码,不然会报错

data['ColumnName'] = data['ColumnName'].map({'Yes': 1, 'No': 0})
data['ColumnName'] = data['ColumnName'].apply(lambda x: 1 if x == 'Yes' else 0) # 或者这一句

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/247302.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot——嵌入式 Servlet容器

一、如何定制和修改Servlet容器的相关配置 前言&#xff1a; SpringBoot在Web环境下&#xff0c;默认使用的是Tomact作为嵌入式的Servlet容器&#xff1b; 【1】修改和server相关的配置&#xff08;ServerProperties实现了EmbeddedServletContainerCustomizer&#xff09;例如…

Http和WebSocket

客户端发送一次http请求&#xff0c;服务器返回一次http响应。 问题&#xff1a;如何在客户端没有发送请求的情况下&#xff0c;返回服务端的响应&#xff0c;网页可以得服务器数据&#xff1f; 1&#xff1a;http定时轮询 客户端定时发送http请求&#xff0c;eg&#…

IntelliJ IDEA图形安装教程

IntelliJ IDEA图形安装教程 之前开始Java程序&#xff0c;一直用的eclipse&#xff0c;觉得还可以。一直听说IntelliJ IDEA比eclipse好用很多&#xff0c;但因为比较懒&#xff0c;也没有学习使用。机缘巧合下&#xff0c;尝试用了下&#xff0c;顿时有种相见恨晚的感觉&#…

17:00面试,17:06就出来了,问的问题有点变态。。

从小厂出来&#xff0c;没想到在另一家公司又寄了。 到这家公司开始上班&#xff0c;加班是每天必不可少的&#xff0c;看在钱给的比较多的份上&#xff0c;就不太计较了。没想到8月一纸通知&#xff0c;所有人不准加班&#xff0c;加班费不仅没有了&#xff0c;薪资还要降40%,…

编码器-解码器(seq-seq)

1. 背景 encoder-decoder和seq-seq模型可以解决输入与输出都是不定长序列的问题。它们都用到了两个循环NN&#xff0c;分别叫做编码器(用来分析输入序列)与解码器(用来生成输出序列)。 2. 编码器 把一个不定长的输入序列变换成一个定长的背景变量c&#xff0c;并在其中编码输入…

关于栈的简单理解

1. 栈(Stack) 1.1 文字讲解 栈&#xff1a;一种特殊的线性表&#xff0c;其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶&#xff0c;另一端称为栈底。栈中的数据元素遵守后进先出LIFO&#xff08;Last In First Out&#xff09;的原则&a…

设计模式之代理模式(1)

目录 概述定义应用场景主要角色类图 详述基本代码应用实例符合的设计原则 总结 概述 定义 代理模式是一种结构型设计模式&#xff0c;它允许通过一个代理对象来控制对原始对象的访问。代理对象可以在不改变原始对象的情况下&#xff0c;增加一些额外的功能&#xff0c;例如权限…

池化技术(对象池)

什么是池化技术 池化技术是一种很常见的编程技巧&#xff0c;目的在于提前创建如内存&#xff0c;对象&#xff0c;线程资源&#xff0c;降低程序运行时频繁的创建销毁带来的开销。常见的有线程池&#xff0c;内存池&#xff0c;对象池等。 池化技术如何提高性能&#xff0c;…

七、三台虚拟机JDK环境安装

目录 1、在三台机器上分别创建安装目录

glibc下的tpmalloc

文章目录 1、内存布局2、操作系统内存分配的相关函数2.1 Heap 操作相关函数2.2 Mmap 映射区域操作相关函数 3、ptmalloc的实现原理3.1 Main_arena 与 non_main_arena3.2 chunk 结构3.3 空闲 chunk 容器的组织形式3.3.1 small bin3.3.2 Large bins3.3.3 Unsorted bin3.3.4 Fast …

【Qt开发流程】之事件系统1:事件系统描述及事件发生流程

Qt的事件系统 在Qt中&#xff0c;事件是对象&#xff0c;派生自抽象的QEvent类&#xff0c;它表示应用程序内部发生的事情或作为应用程序需要知道的外部活动的结果。事件可以由QObject子类的任何实例接收和处理&#xff0c;但它们与小部件特别相关。以下描述了在典型应用程序中…

【南昌大学主办、往届均已实现EI、Scopus双检索】第三届电子信息工程与数据处理国际学术会议(EIEDP 2024)

第三届电子信息工程与数据处理国际学术会议&#xff08;EIEDP 2024&#xff09; 2024 3rd International Conference on Electronic Information Engineering and Data Processing 第三届电子信息工程与数据处理国际学术会议&#xff08;EIEDP 2024&#xff09;将于2024年3月1…