首页 炼丹房 帖子详情
pandas groupby用法
收藏
快速回复
炼丹房 问答学习资料新手上路 256 0
pandas groupby用法
收藏
快速回复
炼丹房 问答学习资料新手上路 256 0

在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。在Pandas中,上述的数据处理操作主要运用groupby完成。

# 首先生成模拟数据,方便进行操作分析
import pandas as pd
import numpy as np
company=["A","B","C"]

data=pd.DataFrame({
    "company":[company[x] for x in np.random.randint(0,len(company),10)],
    "salary":np.random.randint(5,50,10),
    "age":np.random.randint(15,50,10)})
data

在pandas中,实现分组操作的代码很简单,仅需一行代码,在这里,将上面的数据集按照company字段进行划分.

group = data.groupby("company")
group

# 使用list对其展示,可以发现我们将一个大的dataframe按照组名(这里是company),对其进行了切分
list(group)

0
收藏
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户