Pandas数据处理之高级聚合

import numpy as np
from pandas import DataFrame, Series
import pandas as pd

'''
假设菜市场张大妈在卖菜,有以下属性:
菜品(item):萝卜,白菜,辣椒,冬瓜
颜色(color):白,红,青
重量(weight)
价格(price)
1.要求以属性作为列索引,新建一个df
2.对df进行聚合操作,求出颜色为白色的价格总和
3.对df进行聚合操作,求出萝卜的所有重量(包括白萝卜,胡萝卜,青萝卜)以及平均价格
4.使用merge合并总重量及平均价格
'''
# 1.要求以属性作为列索引,新建一个df
df = DataFrame({"item": ["萝卜", "白菜", "辣椒", "冬瓜", "白菜", "辣椒", "冬瓜", "白菜"],"color": ["红", "白", "青", "青", "白", "青", "白","白"],"weight": np.random.randint(5, 150, size=8),
"price": np.random.randint(1, 4,size=8)})
print(df)

# 2.对df进行聚合操作,求出颜色为白色的价格总和
print("颜色为白色的价格总和为:%d元" % df.groupby("color")["price"].sum()["白"])

# 3.对df进行聚合操作,求出萝卜的所有重量(包括白萝卜,胡萝卜,青萝卜)以及平均价格
print(df.groupby("item")[["weight", "price"]].sum())
print(df.groupby("item")[["weight", "price"]].apply(sum))
print(df.groupby("item")[["weight", "price"]].apply(max))
# transform和apply都会进行运算,transform将运算出来的结果显示给所有的行
print(df.groupby("item")[["weight", "price"]].transform(sum))

'''6.0高级聚合
可以使用pd.merge()函数将聚合操作的计算结果添加到df的每一行中,使用groupby分组后调用加和等函数
进行计算,然后最后可以调用add_prefix()来修改列名'''
# 可以使用transform和apply实现相同功能

def add_all(item):
    a = 0
    for i in item:
        a += i
    return a
print(df.groupby("item")["price"].apply(add_all))   # add_all == sum



全部评论

相关推荐

10-30 10:16
南京大学 Java
龚至诚:给南大✌️跪了
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务