Python基础之pandas:字符串操作与透视表

文章目录

  • 一、字符串操作
      • 备注:如果想要全部行都能输出,可输入如下代码
    • 1、字符检索
    • 2、字符转换
    • 3、字符类型判断
    • 4、字符调整
    • 5、字符对齐与填充
    • 6、字符检索
    • 7、字符切割
    • 8、字符整理
  • 二、透视表
    • 1、pd.pivot_table
    • 2、多级透视表

一、字符串操作

备注:如果想要全部行都能输出,可输入如下代码

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity='all'

在这里插入图片描述
Series中的字符串如果包含缺失值,最快的处理办法是pandas字符串操作方法
在这里插入图片描述

1、字符检索

  • find()返回字符串第一次出现的位置,如果没有匹配项则返回 -1
  • rfind()返回字符串最后一次出现的位置,如果没有匹配项则返回 -1
    在这里插入图片描述

2、字符转换

  • lower():全部转为小写
  • upper():全部转为大写
  • title:将每个单词的第一个字符转换为大写和保持小写。
  • capitalize():将第一个字符转换为大写字母保持小写。
  • swapcase() :将大写转换为小写,小写转换为大写。
  • translate():字符串转换
    在这里插入图片描述
    在这里插入图片描述

3、字符类型判断

  • islower():是否小写
  • isupper():是否大写
  • isnumeric():是否数字或数字字符串
  • isalnum()是否为字母或数字
  • isdecimal()是否字符串中的所有字符都是十进制
  • isalpha()是否字符串中的所有字符都是字母字符
  • isdigit()是否字符串只包含数字
  • isspace()是否字符串中只包含空格
  • istitle()是否所有单词首字母大写,其余字母小写
    在这里插入图片描述

4、字符调整

  • ljust():定长,左补
  • rjust():定长,右补
    在这里插入图片描述

5、字符对齐与填充

  • startswith()检查字符串是否以指定的前缀开头
  • endswith()检查字符串是否是指定的后缀
  • center()将字符串居中并填充指定的字符,使达到指定的长度
  • zfill()在字符串的左侧填充指定数量的零(zero),使字符串达到指定的长度
    在这里插入图片描述

6、字符检索

  • index()从左至右寻找指定字符,找不到则报错
  • rindex()从右至左寻找指定字符,找不到则报错
  • find()找不到字符,则返回-1
    在这里插入图片描述

7、字符切割

  • split()将字符串按照指定的分隔符进行分割,返回一个字符串列表
  • rsplit()将一个字符串从右边分割成多个子字符串,并将它们放在一个列表中返回
  • partition()在左开始第一次出现分隔符的位置将字符串分割,并返回一个由三个字符串组成的元组,分别是分隔符之前的部分、分隔符本身和分隔符之后的部分
  • rpartition()在右开始第一次出现分隔符的位置将字符串分割,并返回一个由三个字符串组成的元组,分别是分隔符之前的部分、分隔符本身和分隔符之后的部分
    在这里插入图片描述

8、字符整理

  • strip():去除字符串前后空格
  • rstrip():去除字符串后面的空格
  • lstrip():删除字符串开头的指定字符(默认为空格)或字符集
    在这里插入图片描述

二、透视表

1、pd.pivot_table

pd.pivot_table(values=None, index=None, columns=None,fill_value=None, aggfunc=np.sum,margins=False,dropna=True,margins_name='All)

  • values要筛选的列,可选
  • index在数据投失败索引上分组的键
  • columns在数据透视表列上分组的键
  • aggfunc:function,function of list,dict,default numpy.mean
    如果传递的函数列表,则生成的透视表将具有分层列
    如果传递了dict,则键是要聚合的列,值是函数或函数列表
  • fill_value标量,默认无,用于替换缺失值的值
  • margins布尔值,默认False,添加索引行/列(例如,对于小计/总计)
  • dropna布尔值,默认True,不包括条目全部为NaN的列
  • margins_name:String,默认为All,当边距为真时,将包含总计的行/列的名称
    在这里插入图片描述
    在这里插入图片描述
    打印出现乱码时,原因大概率为字体方面,可通过运行以下代码解决:
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['Microsoft YaHei'] # 指定默认字体:解决plot不能显示中文问题
mpl.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题

在这里插入图片描述

2、多级透视表

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/590045.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flask Python:数据库多条件查询,flask中模型关联

前言 在上一篇Flask Python:模糊查询filter和filter_by,数据库多条件查询中,已经分享了几种常用的数据库操作,这次就来看看模型的关联关系是怎么定义的,先说基础的关联哈。在分享之前,先分享官方文档,点击查看 从文档…

2024阿里云老用户服务器优惠价格99元和199元

阿里云服务器租用价格表2024年最新,云服务器ECS经济型e实例2核2G、3M固定带宽99元一年,轻量应用服务器2核2G3M带宽轻量服务器一年61元,ECS u1服务器2核4G5M固定带宽199元一年,2核4G4M带宽轻量服务器一年165元12个月,2核…

JAX深度学习库入门

JAX简介 https://www.bilibili.com/video/BV1Sb4y1b7rK/?spm_id_from333.999.0.0&vd_sourceb2549fdee562c700f2b1f3f49065201b JAX is NumPy wiht Autograd , XLA and Composable (function) transformations, brought together for high-performance machine learning …

HarmonyOS NEXT应用开发之状态管理优秀实践

为了帮助应用程序开发人员提高其应用程序质量,特别是在高效的状态管理方面。本章节面向开发者提供了多个在开发ArkUI应用中常见的低效开发的场景,并给出了对应的解决方案。此外,还提供了同一场景下,推荐用法和不推荐用法的对比和解…

八、从0开始卷出一个新项目之瑞萨RZN2L 3.1.7 debug调试和下载

目录 3.1.7 debug调试和下载 3.1.7.1 官方介绍 3.1.7.2 e2studio debug变量实时监控 3.1.7.3 Iar debug变量实时监控 3.1.7.4 debug经验总结 八、从0开始卷出一个新项目之瑞萨RZN2L 3.1.7 debug调试和下载 3.1.7 debug调试和下载 3.1.7.1 官方介绍 官网: d…

MySQL执行流程

MySQL执行流程 在使用MySQL时,你是否有疑惑,当我们提交一条SQL给MySQL时它到底是如何执行的? 通过了解MySQL的执行流程一定能解开你的疑惑🤔 总体流程 客户端通过连接器连接MySQL查询执行缓存解析器解析SQL执行器执行SQL调用存…

Transformer模型-用jupyter演示逐步计算attention

学习transformer模型-用jupyter演示如何计算attention,不含multi-head attention,但包括权重矩阵W。 input embedding:文本嵌入 每个字符用长度为5的向量表示: 注意力公式: 1,准备Q K V: 先 生…

车载通信与DDS标准解读系列(4):DDSI-RTPS协议

▎什么是RTPS 在DDS协议中,主要描述了实现数据分发服务的DCPS模型和QoS策略,但是我们还不清楚数据怎样在网络中传输,想要了解这些内容,就需要请出咱们的数据搬运工——RTPS。 RTPS全称是Real-Time Publish-Subscribe Protocol&a…

item_get_desc-获得淘宝商品描述api接口:如何通过接口获取商品信息、订单信息、物流信息可以用于数据分析、商品推荐、行业研究等领域

在当今电商繁荣的时代,淘宝作为中国最大的电商平台之一,拥有海量的商品信息。然而,如何高效地获取并利用这些信息,对于商家和开发者来说都至关重要。幸运的是,淘宝开放平台提供了丰富的API接口,其中包括用于…

基于ZooKeeper的Kafka分布式集群搭建与集群启动停止Shell脚本

下载Kafka压缩包 下方是Kafka官网下载地址,本文使用Kafka 3.0.0在虚拟机环境中搭建分布式集群。 Apache Kafka Downloads link 虽然在Kafka 2.8.0之后可以使用KRaft模式搭建高可用的集群以提高数据处理效率,但是目前还有许多企业依然使用ZooKeeper搭建K…

丰诺畅机电科技将莅临2024年第13届生物发酵展

参展企业介绍 无锡丰诺畅机电科技有限公司,是一家分离设备专业制造公司,集开发、设计、制造、销售、服务于一体;具有专业的生产技术,先进的生产工艺,精良的制造设备,完善的检测手段;为满足不同用户的过滤需求&#xf…

酷开科技不断深耕智能电视领域,用酷开系统带给消费者更多可能性

在这个网络快速发展的时代,电视行业也发生了巨大变革。与以往单纯的“看”电视不同,人们不再满足于现有的状态,消费者对电视娱乐的追求更加丰富,这也就带给智能电视产业无限的发展可能。酷开科技瞄准这一产业趋势,不断…