Pandas 分组将指定列的数据转为列表或字典

分组后转为列表

语法

        使用聚合函数,按照指定规则进行分组聚合

作用

        对【Group】该列进行分组,分组后将【Value1】和【Value2】分别用列表进行组合,【OtherColumn】取第一个值

效果

        

代码

import pandas as pd# 创建一个示例DataFrame
data = {'Group': ['A', 'A', 'B', 'B', 'A'],'Value1': [1, 2, 3, 4, 5],'Value2': [10, 20, 30, 40, 50],'OtherColumn': ['X', 'Y', 'X', 'Y', 'Z']
}df = pd.DataFrame(data)# 定义如何对每列进行聚合,例如Value1和Value2列聚合成列表,OtherColumn取第一个值
agg_functions = {'Value1': list,'Value2': list,'OtherColumn': 'first'
}# 使用groupby和指定的聚合函数对DataFrame进行分组聚合
grouped_df = df.groupby('Group').agg(agg_functions).reset_index()print(grouped_df)

分组后转为字典

语法

        使用聚合函数,按照指定规则进行分组聚合

作用

        对【Group】该列进行分组,分组后将【Value1】和【Value2】分别用列表进行组合,【AnotherCol】和【SampleCol】分别用字典进行组合

效果

        

代码

data = {'Group': ['A', 'A', 'B', 'B', 'A'],'Value1': [1, 2, 3, 4, 5],'Value2': [10, 20, 30, 40, 50],'AnotherCol': ['X', 'Y', 'Z', 'W', 'V'],'SampleCol': ['A1', 'A2', 'B1', 'B2', 'A3']
}df = pd.DataFrame(data)# 定义一个函数,将一系列值转换为字典
def to_dict(series):return series.to_dict()# 对特定列执行列表聚合,对其余列进行to_dict聚合
agg_functions = {'Value1': list,'Value2': list,'AnotherCol': to_dict,'SampleCol': to_dict
}# 使用groupby和指定的聚合函数对DataFrame进行分组聚合
grouped_df = df.groupby('Group').agg(agg_functions).reset_index()print(grouped_df)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/640227.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STL_deque_stack_queue

Deque deque容器(双端队列) ​deque是一种双向开口的分段连续线性空间(对外号称连续,使用者无法感知它是分段的)。deque支持从头尾两端进行元素的插入和删除。deque没有容量的概念,因为它是动态地以分段连续空间组合而成的。随时…

社交媒体数据恢复:钉钉

在数字化办公日益普及的今天,钉钉作为一款综合性的企业级通讯工具,已经深入到众多企业和个人的工作与生活中。然而,在日常使用过程中,我们难免会遇到一些意外情况导致数据丢失的问题。本文将针对钉钉数据恢复这一主题,…

腾讯云轻量2核4G5M服务器优惠价格165元1年,2024年多配置报价单

腾讯云轻量2核4G5M服务器优惠价格165元1年。腾讯云服务器价格表2024年最新价格,轻量2核2G3M服务器61元一年、2核2G4M服务器99元1年,三年560元、2核4G5M服务器165元一年、3年900元、轻量4核8M12M服务器646元15个月、4核16G10M配置32元1个月、8核32G配置11…

web前端框架设计第五课-计算属性与监听属性

web前端框架设计第五课-计算属性与监听属性 一.预习笔记 1.计算属性 computed split():拆分 reverse():倒序 join():拼接 计算属性与方法,两者效果一致,但是computed 是基于它的依赖缓存,只有相关依赖发生改变时才会重新取值。而使用 met…

Skill Check: OCI Generative AI Service Deep Dive

Skill Check: OCI Generative AI Service Deep Dive

配置使用IPsec安全框架保护RIPng报文

正文共:999 字 11 图,预估阅读时间:1 分钟 前面我们简单介绍了IPv6的基本概念(IPv6从入门到精通),也做了动态路由协议的相关介绍(IS-ISv6配置),还做了一个综合性比较强的…

厉害了,Numpy

几乎所有使用Python处理分析数据的人都用过Pandas,因为实在太方便了,就像Excel一样,但你知道Pandas是基于numpy开发出来的吗? Pandas和Numpy的关系类似于国产安卓系统和原生安卓,Numpy提供底层数据结构和算法,搭配数…

Leetcode - 周赛394

目录 一,3120. 统计特殊字母的数量 I 二,3121. 统计特殊字母的数量 II 三,3122. 使矩阵满足条件的最少操作次数 四,3123. 最短路径中的边 一,3120. 统计特殊字母的数量 I 本题就是统计有多少个字母的大小写同时出现…

必应搜索广告与谷歌搜索广告对比那个更好?

搜索引擎广告作为企业获取潜在客户的重要渠道之一,其效果直接关系到营销策略的成功与否。两大搜索引擎巨头——谷歌(Google)和必应(Bing)各自提供了广告平台,即谷歌广告(Google Ads)…

Ubuntu系统下 Nvidia驱动 + cuda驱动 + CuDNN安装与卸载

Ubuntu系统下 Nvidia驱动 cuda驱动 CuDNN安装与卸载 一、NVIDIA驱动与CUDA驱动的区别二、NVIDIA驱动安装与卸载1. 查看系统内核版本2. 查看显卡型号3. 查看是否有显卡驱动4. 禁用nouveau并重启5. 卸载旧版本6. 安装1:使用标准Ubuntu仓库进行自动化安装…

算法打卡day39

今日任务: 1)卡码网57. 爬楼梯(70. 爬楼梯进阶版) 2)322.零钱兑换 3)279.完全平方数 4)复习day14 卡码网57. 爬楼梯(70. 爬楼梯进阶版) 题目链接:57. 爬楼梯…

C语言(扫雷游戏)

Hi~!这里是奋斗的小羊,很荣幸各位能阅读我的文章,诚请评论指点,关注收藏,欢迎欢迎~~ 💥个人主页:小羊在奋斗 💥所属专栏:C语言 本系列文章为个人学习笔记&#x…