python实现读取Excel内容并展示成json
作者:shigen01
这篇文章主要为大家详细介绍了如何使用python实现读取Excel内容并展示成json功能,文中的示例代码讲解详细,感兴趣的小伙伴可以参考一下
还是先来介绍一下我的背景:昨天突然接到了这样的活,需要用python解析Excel中多个sheet文件的内容,并最终展示成格式化的json。一想,这个我拿手啊,记得shigen之前有一篇这样的文章:如何在终端查看excel内容,岂不是可以直接派上场了。然而事实是我大意了,我没有考虑到excel中存在的部分单元格是函数计算出来的情况。为了更好的说明问题,我先来模拟一个表格看看:

表格中的数据全都是我用程序生成的,可参考文章:一个脚本,实现随机数据生成自由
那我们依旧用之前的程序读取会怎么样子呢?

发现很正常,但昨天就是不行,是我多疑了?我一看,昨天的文件是xlsm格式的,意思也就是现在的文件是带有宏的。那到时候继续用那个文件试试吧。
现在,我们来实现读取文件并选取指定的范围展示成json的格式。先来看看实现的效果吧:


发现基本是符合预期的,那现在看看代码吧,主要的依赖库可以直接先安装:
pip3 install numpy xlwings
直接执行一下的代码即可,具体的代码、函数调用可参考代码中的注释和文档:
# -*- encoding: utf-8 -*-
__date__ = '2023/12/23 12:04:32'
import json
import numpy as np
import xlwings as xw
def get_sheet_matrix(file_path: str, sheet_name: str, start_cell: str, end_cell: str) ->np.ndarray:
"""
从指定的 Excel 文件中获取指定工作表、区域的数据,并返回一个 NumPy 矩阵。
Args:
file_path (str): Excel 文件的路径。
sheet_name (str): 要读取数据的工作表名称。
start_cell (str): 起始单元格的位置,例如 'A1'。
end_cell (str): 结束单元格的位置,例如 'C3'。
Returns:
numpy.ndarray: 包含指定区域数据的二维数组矩阵。
Raises:
FileNotFoundError: 如果文件路径不存在或无法访问。
ValueError: 如果起始单元格或结束单元格的位置格式不正确。
Example:
# 示例用法
file_path = 'path/to/file.xlsx'
sheet_name = 'Sheet1'
start_cell = 'A1'
end_cell = 'C3'
matrix = get_sheet_matrix(file_path, sheet_name, start_cell, end_cell)
print(matrix)
"""
app = xw.App(visible=False)
workbook = app.books.open(file_path)
sheet = workbook.sheets[sheet_name]
# 获取指定区域的值并构建二维列表
values = sheet.range(start_cell, end_cell).value
# 将二维列表转换为 NumPy 矩阵
matrix = np.array(values)
workbook.close()
app.quit()
return matrix
def matrix_to_json(matrix: np.ndarray) -> str:
"""
将矩阵数据转换为 JSON 格式。
Args:
matrix: 二维 NumPy 数组,包含表头和数据。
Returns:
JSON 格式的字符串。
"""
headers = matrix[0]
data = matrix[1:]
json_data = []
for row in data:
item = {}
for i in range(len(headers)):
item[headers[i]] = row[i]
json_data.append(item)
json_str = json.dumps(json_data, indent=2, ensure_ascii=False)
return json_str
if __name__ == '__main__':
# 此处必须写绝对路径
file_path = '/Users/zzzz/Downloads/demo.xlsm'
sheet_name = 'Sheet1'
start_cell = 'A1'
end_cell = 'D11'
matrix = get_sheet_matrix(file_path, sheet_name, start_cell, end_cell)
print(matrix)
print(matrix_to_json(matrix))
到此这篇关于python实现读取Excel内容并展示成json的文章就介绍到这了,更多相关python读取Excel内容内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
