python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > python xlrd 读取 Excel

使用 Python 的第三方库 xlrd 读取 Excel 文件的详细过程

作者:睿思达DBA_WGX

文章主要介绍了如何使用Python的第三方库xlrd读取Excel文件,包括安装xlrd库、打开Excel工作表、读取单个单元格和多个单元格的信息等内容,感兴趣的朋友跟随小编一起看看吧

使用 Python 的第三方库 xlrd 读取 Excel 文件

一、安装 xlrd 库

xlrd是读Excel的库,xlrd是第三方库,因此需要先安装才能使用。在Windows命令行窗口输入如下命令安装 xlrd库:

C:\Users\Administrator>pip install xlrd
Collecting xlrd
  Downloading xlrd-2.0.2-py2.py3-none-any.whl.metadata (3.5 kB)
Downloading xlrd-2.0.2-py2.py3-none-any.whl (96 kB)
Installing collected packages: xlrd
Successfully installed xlrd-2.0.2
[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip

pip包进行更新:

C:\Users\Administrator>python.exe -m pip install --upgrade pip
Requirement already satisfied: pip in c:\users\administrator\appdata\local\programs\python\python313\lib\site-packages (25.2)
Collecting pip
  Downloading pip-25.3-py3-none-any.whl.metadata (4.7 kB)
Downloading pip-25.3-py3-none-any.whl (1.8 MB)
   ---------------------------------------- 1.8/1.8 MB 4.6 MB/s  0:00:00
Installing collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 25.2
    Uninstalling pip-25.2:
      Successfully uninstalled pip-25.2
Successfully installed pip-25.3

由于所安装的第三方库默认是在国外的服务器上,所以可能会出现安装速度比较慢的情况。此时可以尝试使用国内镜像源的方式进行安装。国内镜像源网址如下:

清华大学:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http:/mirrors.aliyun.com/pypi/simple

镜像源使用方式:在使用pip时添加参数-i https://pypi.tuna.tsinghua.edu.cn/simple

例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple xlrd

二、使用 xlrd 库读取 Excel 文件

1、打开 Excel 工作表

理解工作簿、工作表、单元格区域、单元格等概念。

import xlrd
# 使用 open_workbook 加载磁盘中的Excel文件
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
# 执行以上代码时程序报如下错误:
  File "C:/Users/Administrator/AppData/Local/Programs/Python/Python313/aa.py", line 2, in <module>
    excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python313\Lib\site-packages\xlrd\__init__.py", line 170, in open_workbook
    raise XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+'; not supported')
xlrd.biffh.XLRDError: Excel xlsx file; not supported

在 CSDN 搜索,给出的原因如下:通常是由于当前 Python 中的 xlrd 版本过高,高版本下删除了对应的 .xlsx 读取方法,或者 xlrd 更新到了 2.0.1 版本,只支持 .xls 文件。

解决方法为:重装指定版本的 xlrd。在命令行中先卸载现有的 xlrd,再安装指定版本的 xlrd。

C:\Users\Administrator>pip uninstall xlrd
Found existing installation: xlrd 2.0.2
Uninstalling xlrd-2.0.2:
  Would remove:
    c:\users\administrator\appdata\local\programs\python\python313\lib\site-packages\xlrd-2.0.2.dist-info\*
    c:\users\administrator\appdata\local\programs\python\python313\lib\site-packages\xlrd\*
    c:\users\administrator\appdata\local\programs\python\python313\scripts\runxlrd.py
Proceed (Y/n)? y
  Successfully uninstalled xlrd-2.0.2
C:\Users\Administrator>pip install xlrd==1.2.0
Collecting xlrd==1.2.0
  Downloading xlrd-1.2.0-py2.py3-none-any.whl.metadata (1.3 kB)
Downloading xlrd-1.2.0-py2.py3-none-any.whl (103 kB)
Installing collected packages: xlrd
Successfully installed xlrd-1.2.0

重新编写代码,加载 Excel 文件,获取工作表中的数据。

加载 Excel 文件,查看对象类型。代码如下:

import xlrd
# 使用 open_workbook 加载磁盘中的Excel文件
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
print(type(excelbook))
print(excelbook)
程序运行结果为:
<class 'xlrd.book.Book'>
<xlrd.book.Book object at 0x00000215C84C7B60>

获取工作表对象信息。代码如下:

import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
# 按照工作表的序号获取第一个工作表对象信息
sht1=excelbook.sheet_by_index(0)  
# 按照工作表的名称获取工作表对象信息
sht2=excelbook.sheet_by_name("总资产")
# 获取所有的工作表信息,保存到一个列表中。
shts=excelbook.sheets()
# 获取列表中的第二个元素,即第二个工作表对象信息
sht3=shts[1]
print(type(sht1))
print(sht1)
print(sht2)
print(type(shts))
print(shts)
print(sht3)
程序运行结果为:
<class 'xlrd.sheet.Sheet'>
<xlrd.sheet.Sheet object at 0x000001A8AB867E00>
<xlrd.sheet.Sheet object at 0x000001A8AB867E00>
<class 'list'>
[<xlrd.sheet.Sheet object at 0x000001A8AB867E00>, <xlrd.sheet.Sheet object at 0x000001A8AB94C2D0>]
<xlrd.sheet.Sheet object at 0x000001A8AB94C2D0>
2、读取单个单元格的信息

获取单元格数据有两种方式:一是使用cell_value函数直接返回单元格的数据,该函数传递两个参数:单元格数值所在的行号和列号。另一种是使用cell函数,该函数仍然需要传递两个参数:行号和列号,但该函数返回的是一个单元格对象,需要使用该对象的value属性返回单元格中的数据。

常用的单元格数据类型包含如下几种:

0:empty——空

1:string——文本

2:number——数值

3:date——日期

4:boolean——逻辑值

5:error——错误

6:blank——空格

例如:

import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
# 获取第一个工作表对象信息
sht1=excelbook.sheets()[0]
# 获取第3行第2列的单元格的内容
x=sht1.cell(2,1).value
print(x)
print(type(x))
# 获取第3行第6列的单元格的内容
x=sht1.cell_value(2,5)
print(x)
print(type(x))
程序运行结果为:
家具
<class 'str'>
700.0
<class 'float'>
3、读取多个单元格的信息

使用工作表的nrows属性可以获取工作表总的有效行数,ncols属性可以获取工作表总的有效列数。

import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
rows=excelbook.sheets()[0].nrows
cols=excelbook.sheets()[0].ncols
print(rows)
print(cols)
程序运行结果为:
7
9

使用row(n)函数可以获取第n行数据,使用col(n)函数可以获取第n列数据。

import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
row=excelbook.sheets()[0].row(2)
print(row)
print(type(row))
print("==="*20)
print(row[1])
print(type(row[1]))
print("==="*20)
col=excelbook.sheets()[0].col(3)
print(col)
print(type(col))
程序运行结果为:
[number:2.0, text:'家具', text:'JJ2020021492', text:'目录柜', text:'50斗', number:700.0, text:'经济与管理学院办公室', text:'10号教学楼2楼10206', xldate:33329.0]
<class 'list'>
============================================================
text:'家具'
<class 'xlrd.sheet.Cell'>
============================================================
[text:'名称', text:'期刊架', text:'目录柜', text:'双面书桌', text:'双面书桌', text:'双面书桌', text:'双面书桌']
<class 'list'>

row(n)函数与 col(n)函数获取到的数据是一个列表,列表中元素的数据类型为<class 'xlrd.sheet.Cell'>,这是xlrd中的cell对象。也就是每一个列表元素表示的是一个单元格对象,单元格对象有value属性。因此,可以遍历列表获得每一个单元格对象,再通过value属性获取每一个单元格的值。

代码如下:

import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
rows=excelbook.sheets()[0].nrows
for row_id in range(rows):
    for cell in excelbook.sheets()[0].row(row_id):
        print(cell.value,end="   ")
    print("")
程序运行结果为:
序号   类别   编号   名称   型号   价值   领用单位   存放地   入库日期   
1.0   家具   JJ2020019977   期刊架   D型   590.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
2.0   家具   JJ2020021492   目录柜   50斗   700.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
3.0   家具   JJ2020023833   双面书桌   双面   410.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
4.0   家具   JJ2020023834   双面书桌   双面   410.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
5.0   家具   JJ2020023835   双面书桌   双面   410.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
6.0   家具   JJ2020023836   双面书桌   双面   410.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   

到此这篇关于使用 Python 的第三方库 xlrd 读取 Excel 文件的详细过程的文章就介绍到这了,更多相关python xlrd 读取 Excel内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文