首页 > 脚本专栏 > python > Pandas StyleFrame设置表格样式

Pandas之StyleFrame如何设置表格样式

2024-07-08 16:51:44 作者：Thomas_Lean

这篇文章主要介绍了Pandas之StyleFrame如何设置表格样式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

对于Excel样式设置库——StyleFrame

也做简单介绍：

1、安装

pip install StyleFrame

2、基础数据暂时都用data（模拟数据）做测试

from StyleFrame import StyleFrame, Styler
for sheet in data.keys():
    sf = StyleFrame(data[sheet]) #实例化数据对象

sf不同于DataFrame表的df，是不可以预览的。

3、Styler——样式设置对象

详情可前去官网查看： StyleFrame官网

Styler(bg_color=None, bold=False, font=utils.fonts.arial, font_size=12, font_color=None, number_format=utils.number_formats.general, protection=False,
underline=None, border_type=utils.borders.thin, horizontal_alignment=utils.horizontal_alignments.center, vertical_alignment=utils.vertical_alignments.center,
wrap_text=True, shrink_to_fit=True, fill_pattern_type=utils.fill_pattern_types.solid, indent=0, comment_author=None, comment_text=None, text_rotation=0)

解释：

参数	说明
bg_color	单元格背景色
bold	字体加粗与否设置
font	字体类型
font_size	字体大小
font_color	字体颜色
number_format	数值格式
protection	保护表格不被修改
underline	下划线设置
border_type	边框线设置
horizontal_alignment	水平方向对齐设置
vertical_alignment	垂直方向对齐设置
wrap_text	是否自动换行
shrink_to_fit	是否根据字符长度缩小以适应单元格
fill_pattern_type	背景填充模式
indent	缩进距离
comment_author	批注作者
comment_text	批注内容

a)在某一列上使用样式时需要用到如下方法

apply_column_style(cols_to_style,styler_obj,style_header)

1、cols_to_style：要设置样式的列名
2、styler_obj：样式对象，即上面设置过的Styler
3、style_header：是否将表头也设置样式

实例：

sf.apply_column_style(cols_to_style=["列名",'列名1'],
					  styler_obj=Styler(number_format="0"),
                      style_header=True)

b)在行上使用

apply_style_by_indexes(indexes_to_style,styler_obj,cols_to_style)

1、indexes_to_style: 要设置样式的行，sf[sf[‘col1’] = 20]表示设置col1列等于20的行
2、styler_obj: 样式对象
3、cols_to_style: 要设置通过indexes_to_style选出那些行对应的哪些列

实例：

indexes_to_style=sf[sf['列名'] < '10'] # 列名列数值小于10的单元格
#sf.apply_style_by_indexes(indexes_to_style=sf[sf['列名'] < '10'],
        cols_to_style=['列名'],styler_obj=Styler(font_color="#FF0000"))

c)字体大小:font_size\加粗：bold

sf.apply_column_style(cols_to_style=["col_2"], 
                      styler_obj=Styler(font_size=12, bold=True),
                      style_header=True)

d)背景色：bg_colors

sf.apply_column_style(cols_to_style=["col_2"], 
                      styler_obj=Styler(bg_color='red'),
                      style_header=True)

e)对齐方式：horizontal_alignment

general = 'general' #一般
left = 'left' #左对齐
center = 'center' #居中对齐
right = 'right' #右对齐
fill = 'fill' #填满单元格对齐
justify = 'justify' #两端对齐
center_continuous = 'centerContinuous'
distributed = 'distributed' #分散对齐

实例：

sf.apply_column_style(cols_to_style=["col_3"], 
                      styler_obj=Styler(horizontal_alignment="center"),
                      style_header=True)

f)垂直方向对齐:vertical_alignment

top = 'top' #靠上对齐
center = 'center' #靠中对齐
bottom = 'bottom' #靠下对齐
justify = 'justify' #两端对齐
distributed = 'distributed' #分散对齐

实例：

sf.apply_column_style(cols_to_style=["col_3"], 
                      styler_obj=Styler(vertical_alignment="center"),
                      style_header=True)

g)数字显示:number_format

general = 'General' #对应Excel中的常规
general_integer = '0' #不保留小数点 
general_float = '0.00' #保留两位小数点
percent = '0.0%' #百分数
thousands_comma_sep = '#,##0' #千位分隔样式
date = 'DD/MM/YY' #年月日
time_24_hours = 'HH:MM' #小时分钟
time_24_hours_with_seconds = 'HH:MM:SS' #小时分钟秒
time_12_hours = 'h:MM AM/PM' #12小时分钟 上下午区分
time_12_hours_with_seconds = 'h:MM:SS AM/PM' #12小时分钟秒 上下午区分
date_time = 'DD/MM/YY HH:MM' #年月日时分
date_time_with_seconds = 'DD/MM/YY HH:MM:SS' #年月日时分秒

实例：

sf.apply_column_style(cols_to_style=["col_1"], 
                      styler_obj=Styler(number_format="0"),
                      style_header=True)
sf.apply_column_style(cols_to_style=["col_2"], 
                      styler_obj=Styler(number_format="0.000"),
                      style_header=True)
sf.apply_column_style(cols_to_style=["col_3"], 
                      styler_obj=Styler(number_format="0.0%"),
                      style_header=True)

h)条件格式:add_color_scale_conditional_formatting

num = 'num' #根据具体数值
percent = 'percent' #根据百分数
max = 'max' #根据最大值
min = 'min' #根据最小值
formula = 'formula' #根据公式
percentile = 'percentile' #根据分位数

i)设置列宽:set_column_width\set_column_width_dict

sf.set_column_width(columns = ["col_1","col_2","col_3"],width=10)
sf.set_column_width_dict(col_width_dict = {"col_1":10,"col_2":20,"col_3":30})

j)设置行高:set_row_height\set_row_height_dict

最近需要做一些数据汇总，并存储在Excel表格中，又想外观看过去好看一点，那怎么办呢，找到一个StyleFrame库可以很容易的解决这问题。

正对pandas处理合并单元格暂未去测试，下次有空查阅一下资料看看能否解决。

利用pandas存储数据的前提是先组织好数据：

数据格式可以整理成以下格式：

数据 = {表名:{‘列名称’:数据(列表格式),…}}
data = {‘test’:{‘name’:[‘小明’,‘小红’,…]}}

为了方便调用数据存储，封装个类：

import pandas as pd
from StyleFrame import StyleFrame, Styler
class ExcelData(object):
    '''
    Excel操作

    '''
    def __init__(self):
        self.sheet_data = {}

    def addSheet(self, sheetname, DataFrame):
        self.sheet_data[sheetname] = DataFrame

    def readFile(self, filename, sheetnames):
    	'''
    	根据表名读取数据-前提得先知道sheetname
    	'''
        for sheet in sheetnames:
            self.sheet_data[sheet] = pd.read_excel(filename, sheetname=sheet)
        return self.sheet_data

    def readDimFile(self, filename, sheetnames):
    	'''
    	读取文件所有表数据
    	'''
    	data = pd.read_excel(filename, None)
        return data
    def addSumFile(self, public_asin):
        datas = {'合计':[''],
        '=SUM(C4:C'+ str(len(public_asin) + 5)+')':[''],
        '=SUM(D4:D'+ str(len(public_asin) + 5)+')':[''],
        '=IF(C2=0,0,ROUND(D2*100/C2,1))&"%"':[''],
        '=SUM(F4:F'+ str(len(public_asin) + 5)+')':[''],
        '=SUM(G4:G'+ str(len(public_asin) + 5)+')':[''],
        '=IF(F2=0,0,ROUND(G2*100/F2,1))&"%"':[''],
        '=SUM(I4:I'+ str(len(public_asin) + 5)+')':[''],
        '=SUM(J4:J'+ str(len(public_asin) + 5)+')':[''],
        '=IF(I2=0,0,ROUND(J2*100/I2,1))&"%"':[''],
        '=SUM(L4:L'+ str(len(public_asin) + 5)+')':[''],
        '=SUM(M4:M'+ str(len(public_asin) + 5)+')':[''],
        '=IF(L2=0,0,ROUND(M2*100/L2,1))&"%"':[''],
        '=IF(C2=0,0,ROUND((I2-C2)*100/C2,1))&"%"':[''],
        '=IF(D2=0,0,ROUND((J2-D2)*100/D2,1))&"%"':[''],
        '=IF(E2=0,0,ROUND((K2-E2)*100/E2,1))&"%"':[''],
        '=IF(F2=0,0,ROUND((L2-F2)*100/F2,1))&"%"':[''],
        '=IF(G2=0,0,ROUND((M2-G2)*100/G2,1))&"%"':[''],
        '=IF(H2=0,0,ROUND((N2-H2)*100/H2,1))&"%"':['']}
        col_dicts = ['合计', '=SUM(C4:C'+ str(len(public_asin) + 5)+')',
                    '=SUM(D4:D'+ str(len(public_asin) + 5)+')',
                    '=IF(C2=0,0,ROUND(D2*100/C2,1))&"%"',
                    '=SUM(F4:F'+ str(len(public_asin) + 5)+')',
                    '=SUM(G4:G'+ str(len(public_asin) + 5)+')',
                    '=IF(F2=0,0,ROUND(G2*100/F2,1))&"%"',
                    '=SUM(I4:I'+ str(len(public_asin) + 5)+')',
                    '=SUM(J4:J'+ str(len(public_asin) + 5)+')',
                    '=IF(I2=0,0,ROUND(J2*100/I2,1))&"%"',
                    '=SUM(L4:L'+ str(len(public_asin) + 5)+')',
                    '=SUM(M4:M'+ str(len(public_asin) + 5)+')',
                    '=IF(L2=0,0,ROUND(M2*100/L2,1))&"%"',
                    '=IF(C2=0,0,ROUND((I2-C2)*100/C2,1))&"%"',
                    '=IF(D2=0,0,ROUND((J2-D2)*100/D2,1))&"%"',
                    '=IF(E2=0,0,ROUND((K2-E2)*100/E2,1))&"%"',
                    '=IF(F2=0,0,ROUND((L2-F2)*100/F2,1))&"%"',
                    '=IF(G2=0,0,ROUND((M2-G2)*100/G2,1))&"%"',
                    '=IF(H2=0,0,ROUND((N2-H2)*100/H2,1))&"%"']
        DataFrame = pd.DataFrame(data=datas)
        DataFrame = DataFrame.ix[:, col_dicts]
        return DataFrame

    def saveFile(self, filename, sheet_names, cols_dict):
        excel_writer = StyleFrame.ExcelWriter(filename)
        for sheet in sheet_names:
            #如果想在一个sheet表中写入多次数据，那么可以实例化多个sf对象，前提是写到不同的单元格。
            #如，需指定sheet_name为同一个表
            # 以下的sf2的目的是想在已有的数据表头部加一行合计汇总的数据
            #sf2 = StyleFrame(self.addSumFile(self.sheet_data[sheet]['数据列']))
            #sf2.to_excel(excel_writer, sheet_name=sheet, index=False, startcol=1, startrow=1) 
            #排序
            #sort_data = self.sheet_data[sheet].sort_values(by=['排序列'], ascending=[True])
            #sf = StyleFrame(self.sheet_data[sheet])
            sf = StyleFrame(self.sheet_data[sheet])
            key_len = get_maxlen(self.sheet_data[sheet]) # 获取单元格最长字符串
            style_cols = cols_dict[sheet] # 需要设置样式的列名
            for key in self.sheet_data[sheet]:
                if key == '列名':
                    withs = key_len[key]*1.5 # 设置宽度:每个字符的1.5倍
                else:
                    withs = key_len[key]*0.45 if key_len[key] > len(key) else len(key)*0.7
                sf.set_column_width(columns=[key], width=withs) # 设置列宽
            # 设置excel的样式:styler_obj的样式一列只能设置一次，所以重复设置会以后一个为准
            sf.apply_column_style(cols_to_style=style_cols, styler_obj=Styler(font_size=10.5, bg_color='#DDD9C4'), style_header=True)
            # apply_style_by_indexes：指定列添加样式，以下表示'列名'这一列数值小于10的把字体标注为红色
            sf.apply_style_by_indexes(indexes_to_style=sf[sf['列名'] < '10'],cols_to_style=['列名'],styler_obj=Styler(font_color="#FF0000"))
            # 格式化数字类型number_format：
            # general = 'General' #对应Excel中的常规
            # general_integer = '0' #不保留小数点 
            # general_float = '0.00' #保留两位小数点
            # percent = '0.0%' #百分数
            # thousands_comma_sep = '#,##0' #千位分隔样式
            # date = 'DD/MM/YY' #年月日
            # time_24_hours = 'HH:MM' #小时分钟
            # time_24_hours_with_seconds = 'HH:MM:SS' #小时分钟秒
            # time_12_hours = 'h:MM AM/PM' #12小时分钟 上下午区分
            # time_12_hours_with_seconds = 'h:MM:SS AM/PM' #12小时分钟秒 上下午区分
            # date_time = 'DD/MM/YY HH:MM' #年月日时分
            # date_time_with_seconds = 'DD/MM/YY HH:MM:SS' #年月日时分秒
            sf.apply_column_style(cols_to_style=["col_1"], 
                      styler_obj=Styler(number_format="0"),
                      style_header=True)
            sf.apply_column_style(cols_to_style=["col_2"], 
                      styler_obj=Styler(number_format="0.000"),
                      style_header=True)
            sf.apply_column_style(cols_to_style=["col_3"], 
                      styler_obj=Styler(number_format="0.0%"),
                      style_header=True)
            # row_to_add_filters=0 表示第一行加筛选条件，等于1则是第二行加筛选条件
            # startrow表示起始行，2表示第三行开始填充，默认为0，第一行开始
            sf.to_excel(excel_writer=excel_writer, row_to_add_filters=0, sheet_name=sheet, index=False, startrow=2)
        excel_writer.save()

保存excel：传入个sheetnames意在固定字表顺序

def save_excel(datas, path, cols_dict, sheet_names):
    excels = ExcelData()
    for i in range(len(sheet_names)):
        DataFrame = pd.DataFrame(data=datas[sheet_names[i]])
        DataFrame = DataFrame.ix[:, list(cols_dict[str(sheet_names[i])])] # 首列按照list(cols_dict[str(sheet_names[i])])列表顺序排序
        excels.addSheet(sheet_names[i], DataFrame)
    excels.saveFile(path, sheet_names, cols_dict)

获取单元格最长字符串

def get_maxlen(datas):
    b = {}
    for data in datas:
        b[data] = [len(str(d)) for d in datas[data]]
        b[data] = max(b[data])

    return b

样式设置：

sf = StyleFrame(data)
sf.apply_style_by_indexes(indexes_to_style=sf[sf['列名'] < -0.3],
							  cols_to_style=['列名'],
							  styler_obj=Styler(font_color="#FF0000", number_format="0.0%"))

sf[sf[‘列名’] < -0.2]这种无非也就是返回符合指定条件的索引列表，如果是单一的条件，没有多重条件，这种写法可以达到需求，如果想用多重条件，我一开始尝试着：

	sf[sf['列名'] < -0.2 , sf['列名'] > -0.3]
	sf[sf['列名'] < -0.2 and sf['列名'] > -0.3]
	sf[sf['列名'] < -0.2 & sf['列名'] > -0.3]

以上三种写法均会报错。

后面我就想都是传入索引列表，那何不自己先把符合条件的索引先获取，然后再传入就可以了，所以修改后：

val_index_list = []
for idx,vals in enumerate(sheet_data['sheet名']['列名']):
	if vals < -0.2 and  vals > -0.3:
		val_index_list.append(idx)
sf.apply_style_by_indexes(indexes_to_style=val_index_list,
							  cols_to_style=['列名'],
							  styler_obj=Styler(font_color="#FF0000", number_format="0.0%"))

以下来一张结果图：

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。