题目要求如下:
给出的例子如下:
简单地说就是要找出表中订单最多客户的ID。
使用如下的代码进行实现:
import pandas as pddef largest_orders(orders: pd.DataFrame) -> pd.DataFrame:return orders.groupby("customer_number").count().reset_index().nlargest(1,columns="order_number")[["customer_number"]]
先按组进行汇总计算其数量,再获取最大的值再返回其值。最终效果不怎么好,只超越11%的人。