成品app直播源码搭建,常用数据处理手段代码分析

news/2025/1/16 21:07:15/文章来源:https://www.cnblogs.com/yunbaomengnan/p/18340034

成品app直播源码搭建,常用数据处理手段代码分析

数据合并

数据准备
首先定义一个 DataFrame 数据集:

import pandas as pddf_a = pd.DataFrame(columns=['name', 'rank'], data=[['C', 1], ['java', 2], ['python', 3], ['golang', 4]])
df_b = pd.DataFrame(columns=['name', 'year'], data=[['java', 2020], ['python', 2021], ['golang', 2022]])

 

通过 merge() 方法能对DataFrame数据集进行合并,通过内连接、外连接、左连接、右连接等方式,如下实例:

merge方法默认是内连接取交集,通过 how 指定连接类型,on 指定连接字段

# 通过指定 columns 中的 name 内连接
df_tmp = pd.merge(df_a, df_b, on='name', how='outer')
print(df_tmp)# ========打印========name  rank  year
0    java     2  2020
1  python     3  2021
2  golang     4  2022

 

# 通过指定 columns 中的 name 左连接
df_tmp = pd.merge(df_a, df_b, on='name', how='left')
print(df_tmp)# ========打印========name  rank    year
0       C     1     NaN
1    java     2  2020.0
2  python     3  2021.0
3  golang     4  2022.0

 

# 通过指定 columns 中的 name 右连接
df_tmp = pd.merge(df_a, df_b, on='name', how='right')
print(df_tmp)# ========打印========name  rank  year
0    java     2  2020
1  python     3  2021
2  golang     4  2022

 

# 如果合并两个 DataFrame 不含公共的 columns ,可以直接指定匹配的字段
df_c = pd.DataFrame(columns=['name1', 'year'], data=[['java', 2020], ['python1', 2021], ['golang1', 2022]])
df_tmp = pd.merge(df_a, df_c, left_on='name', right_on='name1')
print(df_tmp)# ========打印========name  rank name1  year
0  java     2  java  2020

 

数据分组

数据准备
首先定义一个 DataFrame 数据集:

import pandas as pddf_a = pd.DataFrame(columns=['name', 'nums'], data=[['python', 1], ['java', 2], ['python', 3], ['java', 4]])

 

通过 group() 方法能对DataFrame数据集进行分组操作,分组后还能进行求和、取平均值等操作,如下实例:

# 获取分组后的数据集中每个数据的数量
df_tmp = df_a.groupby('name').size()
print(df_tmp)# ========打印========
name
java      2
python    2
dtype: int64

 

# 将分组后的数据集,根据 nums 字段进行求和
df_tmp = df_a.groupby('name')['nums'].sum()
print(df_tmp)# ========打印========
name
java      6
python    4
Name: nums, dtype: int64

 

# 获取分组后的数据集的大小
df_tmp = df_a.groupby('name').size()
print(df_tmp)# ========打印========
name
java      3
python    2
Name: nums, dtype: int64

 

数据拆分

数据准备
首先定义一个 DataFrame 数据集:

import pandas as pddf_a = pd.DataFrame(columns=['name', 'rank'], data=[['C_no1', 1], ['java_no2', 2], ['python_no3', 3], ['golang', 4]])

 

通过 split() 方法能对DataFrame数据集中某列数据进行拆分操作,如下实例:

# 数据拆分,对 columns 中的某列的数据某个符号匹配拆分,expand:为True可以直接将分列后的结果转换成DataFrame
df_tmp = df_a['name'].str.split('_', 1, expand=True)
print(df_tmp)# ========打印========0     1
0       C   no1
1    java   no2
2  python   no3
3  golang  None

 

# 数据拆分,对拆分后的数据再次与原数据合并
df_tmp = pd.merge(df_a, df_a['name'].str.split('_', 1, expand=True), how='left', left_index=True, right_index=True)
print(df_tmp)# ========打印========name  rank       0     1
0       C_no1     1       C   no1
1    java_no2     2    java   no2
2  python_no3     3  python   no3
3      golang     4  golang  None

 

数据可视化

在使用 Pandas 处理数据的过程中,为了更直观的展示数据的线性关系,我们可以引入 matplotlib 库将我们的数据变成相关图形

# plot() 方法生成相应的线性图形
df_a = pd.DataFrame(columns=['name', 'rank'], data=[['C_no1', 1], ['java_no2', 2], ['python_no3', 3], ['golang', 4]])
df_a.plot()

 

 


以上就是成品app直播源码搭建,常用数据处理手段代码分析, 更多内容欢迎关注之后的文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/777060.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VUE动态路由和按钮的实现

动态路由 动态菜单 //通过循环组件完成动态菜单<el-menu active-text-color="#ffd04b" background-color="#545c64" class="el-menu-vertical-demo" text-color="#fff":collapse="isCollapse" router default-active sty…

最小圆覆盖

性质一:最小圆覆盖是唯一的 证:若存在两个最小圆,如下显然所有点只能存在于两个圆的交集中,于是以中间那条实心蓝线为直径做一个圆,这个圆显然更小而且能够覆盖所有点 性质二:若我们已经用最小覆盖圆覆盖了所有点,设这些点的点集为\(S\),现在我们新加入一个点\(p\),若…

匈牙利算法--二分图的最大匹配

匈牙利算法--二分图的最大匹配给定一个二分图,其中左半部包含 n1个点(编号 1∼n1),右半部包含 n2 个点(编号 1∼n2),二分图共包含 m 条边。 数据保证任意一条边的两个端点都不可能在同一部分中。 请你求出二分图的最大匹配数。二分图的匹配:给定一个二分图 G,在 G的一…

vsftpd源码学习(一)

文件介绍文件名 作用access.c 定义了检查有无权限访问指定文件的函数ascii.c 定义了二进制数据转ascii数据的函数banner.c 定义了提示信息相关函数main.c 定义了主函数oneprocess.c 定义了单进程方式相关的函数twoprocess.c 定义了多进程方式相关的函数makefile vsftpd的makefi…

洛谷P3369 普通平衡树之板子

洛谷P3369题解 传送锚点 摸鱼环节 【模板】普通平衡树 题目描述 您需要写一种数据结构(可参考题目标题),来维护一些数,其中需要提供以下操作:插入一个数 \(x\)。 删除一个数 \(x\)(若有多个相同的数,应只删除一个)。 定义排名为比当前数小的数的个数 \(+1\)。查询 \(x\…

读零信任网络:在不可信网络中构建安全系统07设备信任

设备安全1. 设备信任 1.1. 在零信任网络中建立设备信任至关重要,这也是非常困难的一个环节 1.2. 建立设备信任是基石,直接影响零信任网络架构的成败 1.3. 大多数网络安全事件都和攻击者获得信任设备的控制权相关,这种情况一旦发生,信任就将被彻底瓦解,无法通过设备来确保安…

GPGPU技术杂谈

GPGPU技术杂谈1.GPGPU行业概述GPU最初的设计目标是为了提升计算机对图形、图像、视频等数据的处理性能,解决CPU在图形图像领域处理效率低的难题。随着GPU在并行计算方面性能优势的逐步显现以及并行计算应用范围的逐步拓展,GPU逐渐分化成两条分支,一条是传统意义的GPU,延续专…

C++编译错误的正确查找方式

C++编译错误的正确查找方式 在VS2019或者2022中,代码发生错误: 1、自己排查 2、自己排除不了,就复制错误的代码提示到浏览器查看,然后看到的是CSDN文章 推荐去编译器官网查找,你会发现新大陆!查找编译器错误链接: https://learn.microsoft.com/zh-cn/cpp/error-messages…

音视频相关

1.音视频相关 1.一些基本数据格式封装格式:MP4,RMVB,TS,FLV,AVI 视频编码数据:H.264,MPEG2,VC-1 音频编码数据:AAC,MP3,AC-3 视频像素数据:YUV420P,RGB 音频采样数据:PCM2.播放视频文件的流程 3.编码格式及工具 1)封装格式:视频码流和音频码流按照一定的格式存储在一个文…

伙伴匹配系统踩坑日记2

伙伴匹配系统踩坑日记2 Time:2024.8.2 后端构建 复制一份之前的用户中心后端项目,改名,删去原来的.idea和.mvn,重启idea会提示 maven重构往后写发现不需要用新的项目,直接在原来的用户中心里加功能就行 新建标签表 create table tag (id bigint auto_increment com…

2024 年上海新能源汽车消费补贴 All In One

2024 年上海新能源汽车消费补贴 All In One2024 年上海新能源汽车消费补贴 All In One2024年“上海之夏”汽车消费嘉年市商务委发布国家报废更新补贴和本市置换更新补贴政策。 一是落实国家汽车以旧换新新政策。按照国家实施汽车以旧换新的统一部署,2024年对个人消费者对报废国…