python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Pandas StyleFrame设置表格样式

Pandas之StyleFrame如何设置表格样式

作者:Thomas_Lean

这篇文章主要介绍了Pandas之StyleFrame如何设置表格样式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

对于Excel样式设置库——StyleFrame

也做简单介绍:

1、安装

pip install StyleFrame

2、基础数据暂时都用data(模拟数据)做测试

from StyleFrame import StyleFrame, Styler
for sheet in data.keys():
    sf = StyleFrame(data[sheet]) #实例化数据对象

sf不同于DataFrame表的df,是不可以预览的。

3、Styler——样式设置对象

详情可前去官网查看: StyleFrame官网

Styler(bg_color=None, bold=False, font=utils.fonts.arial, font_size=12, font_color=None, number_format=utils.number_formats.general, protection=False,
underline=None, border_type=utils.borders.thin, horizontal_alignment=utils.horizontal_alignments.center, vertical_alignment=utils.vertical_alignments.center,
wrap_text=True, shrink_to_fit=True, fill_pattern_type=utils.fill_pattern_types.solid, indent=0, comment_author=None, comment_text=None, text_rotation=0)

解释:

参数说明
bg_color单元格背景色
bold字体加粗与否设置
font字体类型
font_size字体大小
font_color字体颜色
number_format数值格式
protection保护表格不被修改
underline下划线设置
border_type边框线设置
horizontal_alignment水平方向对齐设置
vertical_alignment垂直方向对齐设置
wrap_text是否自动换行
shrink_to_fit是否根据字符长度缩小以适应单元格
fill_pattern_type背景填充模式
indent缩进距离
comment_author批注作者
comment_text批注内容

a)在某一列上使用样式时需要用到如下方法

apply_column_style(cols_to_style,styler_obj,style_header)

实例:

sf.apply_column_style(cols_to_style=["列名",'列名1'],
					  styler_obj=Styler(number_format="0"),
                      style_header=True)

b)在行上使用

apply_style_by_indexes(indexes_to_style,styler_obj,cols_to_style)

实例:

indexes_to_style=sf[sf['列名'] < '10'] # 列名列数值小于10的单元格
#sf.apply_style_by_indexes(indexes_to_style=sf[sf['列名'] < '10'],
        cols_to_style=['列名'],styler_obj=Styler(font_color="#FF0000"))

c)字体大小:font_size\加粗:bold

sf.apply_column_style(cols_to_style=["col_2"], 
                      styler_obj=Styler(font_size=12, bold=True),
                      style_header=True)

d)背景色:bg_colors

sf.apply_column_style(cols_to_style=["col_2"], 
                      styler_obj=Styler(bg_color='red'),
                      style_header=True)

e)对齐方式:horizontal_alignment

general = 'general' #一般
left = 'left' #左对齐
center = 'center' #居中对齐
right = 'right' #右对齐
fill = 'fill' #填满单元格对齐
justify = 'justify' #两端对齐
center_continuous = 'centerContinuous'
distributed = 'distributed' #分散对齐

实例:

sf.apply_column_style(cols_to_style=["col_3"], 
                      styler_obj=Styler(horizontal_alignment="center"),
                      style_header=True)

f)垂直方向对齐:vertical_alignment

top = 'top' #靠上对齐
center = 'center' #靠中对齐
bottom = 'bottom' #靠下对齐
justify = 'justify' #两端对齐
distributed = 'distributed' #分散对齐

实例:

sf.apply_column_style(cols_to_style=["col_3"], 
                      styler_obj=Styler(vertical_alignment="center"),
                      style_header=True)

g)数字显示:number_format

general = 'General' #对应Excel中的常规
general_integer = '0' #不保留小数点 
general_float = '0.00' #保留两位小数点
percent = '0.0%' #百分数
thousands_comma_sep = '#,##0' #千位分隔样式
date = 'DD/MM/YY' #年月日
time_24_hours = 'HH:MM' #小时分钟
time_24_hours_with_seconds = 'HH:MM:SS' #小时分钟秒
time_12_hours = 'h:MM AM/PM' #12小时分钟 上下午区分
time_12_hours_with_seconds = 'h:MM:SS AM/PM' #12小时分钟秒 上下午区分
date_time = 'DD/MM/YY HH:MM' #年月日时分
date_time_with_seconds = 'DD/MM/YY HH:MM:SS' #年月日时分秒

实例:

sf.apply_column_style(cols_to_style=["col_1"], 
                      styler_obj=Styler(number_format="0"),
                      style_header=True)
sf.apply_column_style(cols_to_style=["col_2"], 
                      styler_obj=Styler(number_format="0.000"),
                      style_header=True)
sf.apply_column_style(cols_to_style=["col_3"], 
                      styler_obj=Styler(number_format="0.0%"),
                      style_header=True)

h)条件格式:add_color_scale_conditional_formatting

num = 'num' #根据具体数值
percent = 'percent' #根据百分数
max = 'max' #根据最大值
min = 'min' #根据最小值
formula = 'formula' #根据公式
percentile = 'percentile' #根据分位数

i)设置列宽:set_column_width\set_column_width_dict

sf.set_column_width(columns = ["col_1","col_2","col_3"],width=10)
sf.set_column_width_dict(col_width_dict = {"col_1":10,"col_2":20,"col_3":30})

j)设置行高:set_row_height\set_row_height_dict

最近需要做一些数据汇总,并存储在Excel表格中,又想外观看过去好看一点,那怎么办呢,找到一个StyleFrame库可以很容易的解决这问题。

正对pandas处理合并单元格暂未去测试,下次有空查阅一下资料看看能否解决。

利用pandas存储数据的前提是先组织好数据:

数据格式可以整理成以下格式:

为了方便调用数据存储,封装个类:

import pandas as pd
from StyleFrame import StyleFrame, Styler
class ExcelData(object):
    '''
    Excel操作

    '''
    def __init__(self):
        self.sheet_data = {}

    def addSheet(self, sheetname, DataFrame):
        self.sheet_data[sheetname] = DataFrame

    def readFile(self, filename, sheetnames):
    	'''
    	根据表名读取数据-前提得先知道sheetname
    	'''
        for sheet in sheetnames:
            self.sheet_data[sheet] = pd.read_excel(filename, sheetname=sheet)
        return self.sheet_data

    def readDimFile(self, filename, sheetnames):
    	'''
    	读取文件所有表数据
    	'''
    	data = pd.read_excel(filename, None)
        return data
    def addSumFile(self, public_asin):
        datas = {'合计':[''],
        '=SUM(C4:C'+ str(len(public_asin) + 5)+')':[''],
        '=SUM(D4:D'+ str(len(public_asin) + 5)+')':[''],
        '=IF(C2=0,0,ROUND(D2*100/C2,1))&"%"':[''],
        '=SUM(F4:F'+ str(len(public_asin) + 5)+')':[''],
        '=SUM(G4:G'+ str(len(public_asin) + 5)+')':[''],
        '=IF(F2=0,0,ROUND(G2*100/F2,1))&"%"':[''],
        '=SUM(I4:I'+ str(len(public_asin) + 5)+')':[''],
        '=SUM(J4:J'+ str(len(public_asin) + 5)+')':[''],
        '=IF(I2=0,0,ROUND(J2*100/I2,1))&"%"':[''],
        '=SUM(L4:L'+ str(len(public_asin) + 5)+')':[''],
        '=SUM(M4:M'+ str(len(public_asin) + 5)+')':[''],
        '=IF(L2=0,0,ROUND(M2*100/L2,1))&"%"':[''],
        '=IF(C2=0,0,ROUND((I2-C2)*100/C2,1))&"%"':[''],
        '=IF(D2=0,0,ROUND((J2-D2)*100/D2,1))&"%"':[''],
        '=IF(E2=0,0,ROUND((K2-E2)*100/E2,1))&"%"':[''],
        '=IF(F2=0,0,ROUND((L2-F2)*100/F2,1))&"%"':[''],
        '=IF(G2=0,0,ROUND((M2-G2)*100/G2,1))&"%"':[''],
        '=IF(H2=0,0,ROUND((N2-H2)*100/H2,1))&"%"':['']}
        col_dicts = ['合计', '=SUM(C4:C'+ str(len(public_asin) + 5)+')',
                    '=SUM(D4:D'+ str(len(public_asin) + 5)+')',
                    '=IF(C2=0,0,ROUND(D2*100/C2,1))&"%"',
                    '=SUM(F4:F'+ str(len(public_asin) + 5)+')',
                    '=SUM(G4:G'+ str(len(public_asin) + 5)+')',
                    '=IF(F2=0,0,ROUND(G2*100/F2,1))&"%"',
                    '=SUM(I4:I'+ str(len(public_asin) + 5)+')',
                    '=SUM(J4:J'+ str(len(public_asin) + 5)+')',
                    '=IF(I2=0,0,ROUND(J2*100/I2,1))&"%"',
                    '=SUM(L4:L'+ str(len(public_asin) + 5)+')',
                    '=SUM(M4:M'+ str(len(public_asin) + 5)+')',
                    '=IF(L2=0,0,ROUND(M2*100/L2,1))&"%"',
                    '=IF(C2=0,0,ROUND((I2-C2)*100/C2,1))&"%"',
                    '=IF(D2=0,0,ROUND((J2-D2)*100/D2,1))&"%"',
                    '=IF(E2=0,0,ROUND((K2-E2)*100/E2,1))&"%"',
                    '=IF(F2=0,0,ROUND((L2-F2)*100/F2,1))&"%"',
                    '=IF(G2=0,0,ROUND((M2-G2)*100/G2,1))&"%"',
                    '=IF(H2=0,0,ROUND((N2-H2)*100/H2,1))&"%"']
        DataFrame = pd.DataFrame(data=datas)
        DataFrame = DataFrame.ix[:, col_dicts]
        return DataFrame

    def saveFile(self, filename, sheet_names, cols_dict):
        excel_writer = StyleFrame.ExcelWriter(filename)
        for sheet in sheet_names:
            #如果想在一个sheet表中写入多次数据,那么可以实例化多个sf对象,前提是写到不同的单元格。
            #如,需指定sheet_name为同一个表
            # 以下的sf2的目的是想在已有的数据表头部加一行合计汇总的数据
            #sf2 = StyleFrame(self.addSumFile(self.sheet_data[sheet]['数据列']))
            #sf2.to_excel(excel_writer, sheet_name=sheet, index=False, startcol=1, startrow=1) 
            #排序
            #sort_data = self.sheet_data[sheet].sort_values(by=['排序列'], ascending=[True])
            #sf = StyleFrame(self.sheet_data[sheet])
            sf = StyleFrame(self.sheet_data[sheet])
            key_len = get_maxlen(self.sheet_data[sheet]) # 获取单元格最长字符串
            style_cols = cols_dict[sheet] # 需要设置样式的列名
            for key in self.sheet_data[sheet]:
                if key == '列名':
                    withs = key_len[key]*1.5 # 设置宽度:每个字符的1.5倍
                else:
                    withs = key_len[key]*0.45 if key_len[key] > len(key) else len(key)*0.7
                sf.set_column_width(columns=[key], width=withs) # 设置列宽
            # 设置excel的样式:styler_obj的样式一列只能设置一次,所以重复设置会以后一个为准
            sf.apply_column_style(cols_to_style=style_cols, styler_obj=Styler(font_size=10.5, bg_color='#DDD9C4'), style_header=True)
            # apply_style_by_indexes:指定列添加样式,以下表示'列名'这一列数值小于10的把字体标注为红色
            sf.apply_style_by_indexes(indexes_to_style=sf[sf['列名'] < '10'],cols_to_style=['列名'],styler_obj=Styler(font_color="#FF0000"))
            # 格式化数字类型number_format:
            # general = 'General' #对应Excel中的常规
            # general_integer = '0' #不保留小数点 
            # general_float = '0.00' #保留两位小数点
            # percent = '0.0%' #百分数
            # thousands_comma_sep = '#,##0' #千位分隔样式
            # date = 'DD/MM/YY' #年月日
            # time_24_hours = 'HH:MM' #小时分钟
            # time_24_hours_with_seconds = 'HH:MM:SS' #小时分钟秒
            # time_12_hours = 'h:MM AM/PM' #12小时分钟 上下午区分
            # time_12_hours_with_seconds = 'h:MM:SS AM/PM' #12小时分钟秒 上下午区分
            # date_time = 'DD/MM/YY HH:MM' #年月日时分
            # date_time_with_seconds = 'DD/MM/YY HH:MM:SS' #年月日时分秒
            sf.apply_column_style(cols_to_style=["col_1"], 
                      styler_obj=Styler(number_format="0"),
                      style_header=True)
            sf.apply_column_style(cols_to_style=["col_2"], 
                      styler_obj=Styler(number_format="0.000"),
                      style_header=True)
            sf.apply_column_style(cols_to_style=["col_3"], 
                      styler_obj=Styler(number_format="0.0%"),
                      style_header=True)
            # row_to_add_filters=0 表示第一行加筛选条件,等于1则是第二行加筛选条件
            # startrow表示起始行,2表示第三行开始填充,默认为0,第一行开始
            sf.to_excel(excel_writer=excel_writer, row_to_add_filters=0, sheet_name=sheet, index=False, startrow=2)
        excel_writer.save()

保存excel:传入个sheetnames意在固定字表顺序

def save_excel(datas, path, cols_dict, sheet_names):
    excels = ExcelData()
    for i in range(len(sheet_names)):
        DataFrame = pd.DataFrame(data=datas[sheet_names[i]])
        DataFrame = DataFrame.ix[:, list(cols_dict[str(sheet_names[i])])] # 首列按照list(cols_dict[str(sheet_names[i])])列表顺序排序
        excels.addSheet(sheet_names[i], DataFrame)
    excels.saveFile(path, sheet_names, cols_dict)

获取单元格最长字符串

def get_maxlen(datas):
    b = {}
    for data in datas:
        b[data] = [len(str(d)) for d in datas[data]]
        b[data] = max(b[data])

    return b

样式设置:

sf = StyleFrame(data)
sf.apply_style_by_indexes(indexes_to_style=sf[sf['列名'] < -0.3],
							  cols_to_style=['列名'],
							  styler_obj=Styler(font_color="#FF0000", number_format="0.0%"))

sf[sf[‘列名’] < -0.2]这种无非也就是返回符合指定条件的索引列表,如果是单一的条件,没有多重条件,这种写法可以达到需求,如果想用多重条件,我一开始尝试着:

	sf[sf['列名'] < -0.2 , sf['列名'] > -0.3]
	sf[sf['列名'] < -0.2 and sf['列名'] > -0.3]
	sf[sf['列名'] < -0.2 & sf['列名'] > -0.3]

以上三种写法均会报错。

后面我就想都是传入索引列表,那何不自己先把符合条件的索引先获取,然后再传入就可以了,所以修改后:

val_index_list = []
for idx,vals in enumerate(sheet_data['sheet名']['列名']):
	if vals < -0.2 and  vals > -0.3:
		val_index_list.append(idx)
sf.apply_style_by_indexes(indexes_to_style=val_index_list,
							  cols_to_style=['列名'],
							  styler_obj=Styler(font_color="#FF0000", number_format="0.0%"))

以下来一张结果图:

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:
阅读全文