python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Pandas (pivot_table函数)数据透视表

Pandas实现(pivot_table函数)数据透视表方式

作者:呀~吼

pandas的pivot_table()函数非常强大,主要用于创建数据透视表,重要参数包括index、values、columns和aggfunc,index用于设置行索引,类似于SQL中的group by,values用于进行聚合计算的数据选择,columns参数可设置列层次,非必须

Pandas (pivot_table函数)数据透视表

使用pandas中的pivot_table()实现数据透视表。

语法格式如下:

pd.pivot_table(data,values=None,index=None,
			   columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,
			   margins_name='All')

pd.pivot_table()有四个最重要的参数index、values、columns、aggfunc。

四个最重要参数解析

index

pd.pivot_table(data,index=['列名1','列名2'])

values

pd.pivot_table(data,index=['列名1','列名2'],values=['计算列名1','计算列名2','计算列名3'])

columns

pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],columns=['列名3'])

aggfunc

pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],aggfunc=[np.sum,np.mean])

fill_value:当数据为空时,填充的指定值。fill_value=0 

注意

table=pd.pivot_table(data,index=['列名1','列名2'],columns=['列名3'],
					values=['计算列名1','计算列名2','计算列名3'],
					aggfunc={'计算列名1':np.mean,'计算列名2':[min, max, np.mean]},fill_value=0)

结果就是’计算列名2’求min,max和mean,'计算列名1’求mean,而’计算列名3’没有显示。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:
阅读全文