使用Python第三方库xlrd读取Excel中的数据的流程步骤
作者:ReadLife
1. 安装 xlrd 库
Python 读取 Excel 中的数据主要用到 xlrd 第三方库。xlrd 其实就是两个单词的简化拼接,我们可以把它拆开来看,xl 代表 excel, rd 代表 read, 合并起来就是 xlrd, 意思就是读 excel 的第三方库。 这种命名风格也正是我们推荐使用的,要做到 “顾名思义”,不要使用晦涩难懂,与所实现的功能毫无关联的名称。 OK, 废话不多说了,下面我们就着手安装 xlrd 库,pip 命令如下:
pip install xlrd==1.2.0 -i https://mirrors.aliyun.com/pypi/simple
值得注意的是,我在安装 xlrd 库的时候,指定了 xlrd 的版本,即 xlrd==1.2.0
, 这也是在实践中积累的经验哦,因为不指定版本总是会有各种状况,为了确保不出错,大家尽量按照我这样安装吧。否则,出错可别找我哦!
2. 使用 xlrd 库
2.1 打开 Excel 工作表对象
(咳咳,战术咳嗽!) 首先,我们先梳理一下思路,把概念搞清楚。什么概念呢?就是大家知道什么是工作簿,什么是工作表,什么是单元格吗? 平时我们说的 Excel 工作表文件,其实严格来说它是个工作簿。然后打开工作簿,里面有多个 Sheet, 我们把这个称作 ”工作表“。之后,我们的数据是放在单元格里面的。 下面,让我们再用图片的形式展示,一起要分清概念。
工作簿:
工作表:
单元格:
好的,那么使用 xlrd 读取 Excel 表中的数据的时候也应按照:工作簿 -> 工作表 -> 单元格,这样的过程去读取数据的。 那么,打开工作对象的代码如下:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 三种方式获取工作表 # worksheet = workbook.sheet_by_index(0) # worksheet = workbook.sheets()[0] worksheet = workbook.sheet_by_name('Sheet1')
代码解析:
- 首先导入安装的第三方库 xlrd.
- 之后,使用 xlrd 库下的方法 open_workbook(), 打开一个工作簿,方法里的参数为工作簿的路径。
- 最后,根据拿到的工作簿对象,指定获取的工作表。当然了,获取工作表的方法有三种,分别是根据索引和根据工作表名称获取,索引是从0开始的。只要使用一种方式即可,这里我推荐使用根据工作表名称获取。
2.2 读取单个单元格数据
那么我们在上一小节打开了工作表对象之后,下面就要获取表里的单元格数据了呀!如何获取单元格数据呢?请看下面的代码:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 获取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 获取单元格数据的两种方式 # cell_value = worksheet.cell(0, 0).value cell_value = worksheet.cell_value(0, 0) print(cell_value)
代码解析: 获取单元格数据的方法也很简单。这里提供了两种方法,都可以获取单元格数据,大家只要根据自己习惯,掌握一种即可。例如,我这里使用的是 cell_value() 方法,方法里传递的是单元格的索引。单元格的索引是二维的,第一个参数是所在行,第二个参数是所在列。需要注意的是,所有的索引都是从 0 开始计数的。
2.3 读取多个单元格数据
上一小节中,我们使用了 cell_value() 方法获取单个单元格数据,但是这种方式未免效率过于低下了,现在我们想一次性获取整行或者整列的数据,该如何去做呢 ?请看下面的代码:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 获取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 获取第一行所有单元格数据 row_value = workbookt.row(0) # 获取第一列所有单元格数据 col_value = workbook.col(0)
代码解析: 与 2.2 小节不同的是,我们通过调用方法 row() 和 col() 分别获取某行和某列所有单元格数据,row() 和 col() 内传入的参数为索引,索引从 0 开始计数。例如,row(0) 表示获取第一行所有单元格数据,row(1) 表示获取第二行所有单元格数据。 那么我们运行上面的代码段,运行结果如下所示:
[text:'班级', text:'学号', text:'姓名', text:'成绩'] # row(0) 的结果值
[text:'班级'] # col(0) 的结果值
通过观察运行结果,我们发现运行的结果都是以列表的形式展示的。值得注意的是,列表的数值并不是字典格式,尽管这和 Python 中字典格式完全一样,实际上列表中元素的类型应该是 <class 'xlrd.sheet.Cell'>
, 这是 xlrd 中的 cell 对象,即单元格对象。单元格对象有 value 属性,因此我们可以通过遍历列表获得每一个 cell 对象,然后通过 value 属性取出每一个 cell 的值。 改造后的代码如下所示:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 获取工作表 worksheet = workbook.sheet_by_name('Sheet1') for i in worksheet.row(0): print(i.value) # 获取单元格数据 for i in worksheet.col(0): print(i.value) # 获取单元格数据
2.4 读取所有单元格数据
在上一小节中,我们学习了获取多个单元格数据,也就是整行或整列获取数据,这样获取数据的粒度更大,效率自然也更高。那么如果说,我想获取 Sheet 表中所有的数据又该怎么做呢? 要想获取 Sheet 表中所有单元格数据,就得知道 Sheet 表有多少行以及多少列。这样,我们根据行数和列数,才能获取 Sheet 表所有数据啊。xlrd 中 worksheet 对象有两个属性 nrows 和 ncols, 它们分别表示当前的 Sheet 表的行数和列数。 获取所有单元格数据的代码如下所示:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 获取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 根据行获取所有单元格数据 for row in range(worksheet.nrows): for i in worksheet.row(row): print(i.value) # 根据列获取单元格数据 for col in range(worksheet.ncols): for i in worksheet.col(col): print(i.value)
代码解析: 上面的代码中,输出的结果应该都是所有单元格数据,只不过分别从行和列的角度出发获取单元格数据。其实,还可以用 cell_value() 方法结合 nrows 和 ncols 属性获取所有单元格数据,这种方法留给大家自己去尝试吧!
3. 总结
通过上面的学习,相信大家对 xlrd 第三方库的安装以及使用第三方库读取 Excel 中的数据的方法有了一定的掌握。
到此这篇关于使用Python第三方库xlrd读取Excel中的数据的流程步骤的文章就介绍到这了,更多相关Python xlrd读取Excel数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!