首页 > 脚本专栏 > python > Pandas (pivot_table函数)数据透视表

Pandas实现(pivot_table函数)数据透视表方式

2024-09-10 16:26:22 作者：呀～吼

pandas的pivot_table()函数非常强大,主要用于创建数据透视表,重要参数包括index、values、columns和aggfunc,index用于设置行索引,类似于SQL中的group by,values用于进行聚合计算的数据选择,columns参数可设置列层次,非必须

Pandas (pivot_table函数)数据透视表

使用pandas中的pivot_table()实现数据透视表。

语法格式如下：

pd.pivot_table(data,values=None,index=None,
			   columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,
			   margins_name='All')

pd.pivot_table()有四个最重要的参数index、values、columns、aggfunc。

四个最重要参数解析

index：

相当于SQL里的group by用于分组的字段，相当于行索引。
index也是层次字段，要通过透视表获取什么信息就按照相应的顺序设置字段。

pd.pivot_table(data,index=['列名1','列名2'])

values：

相当于SQL里对列进行聚合计算
对需要的计算数据进行筛选

pd.pivot_table(data,index=['列名1','列名2'],values=['计算列名1','计算列名2','计算列名3'])

columns：

columns类似index可以设置列层次字段
它不是一个必要参数，作为一种分割数据的可选方式

pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],columns=['列名3'])

aggfunc：

aggfunc参数可以设置对数据聚合时进行的函数操作。
对于aggfunc参数，操作的是values后面的值，而不是columns后面的值。
分别对values参数中的每一列都进行求和与求平均值。

pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],aggfunc=[np.sum,np.mean])

fill_value：当数据为空时，填充的指定值。fill_value=0

注意：

aggfunc也可以使用dict类型，这样可以指定values中每一列的聚合函数。
如果dict中的内容与values不匹配时，以dict中为准。

table=pd.pivot_table(data,index=['列名1','列名2'],columns=['列名3'],
					values=['计算列名1','计算列名2','计算列名3'],
					aggfunc={'计算列名1':np.mean,'计算列名2':[min, max, np.mean]},fill_value=0)

结果就是’计算列名2’求min,max和mean,'计算列名1’求mean,而’计算列名3’没有显示。

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

Pandas实现(pivot_table函数)数据透视表方式

Pandas (pivot_table函数)数据透视表

四个最重要参数解析

总结

您可能感兴趣的文章: