Python3读取UTF-8文件及统计文件行数的方法
作者:皮蛋
这篇文章主要介绍了Python3读取UTF-8文件及统计文件行数的方法,涉及Python读取指定编码文件的相关技巧,需要的朋友可以参考下
本文实例讲述了Python3读取UTF-8文件及统计文件行数的方法。分享给大家供大家参考。具体实现方法如下:
''''' Created on Dec 21, 2012 Python 读取UTF-8文件 统计文件的行数目 @author: liury_lab ''' # -*- coding: utf-8 -*- import codecs # 对较小的文件,最简单的方法是将文件读入一个行列表中, # 然后计算列表的长度即可 count = len(codecs.open('d:/FreakOut.cpp', 'rU', 'utf-8').readlines()) print(count) # 对较大的文件,可循环计数 count = -1 for count, line in enumerate(codecs.open('d:/FreakOut.cpp', 'rU', 'utf-8')): pass count += 1 print(count) # 对于像windows结束标记有'\n'的,还可以有如下办法: count = 0 the_file = codecs.open('d:/FreakOut.cpp', 'rb', 'utf-8') while (True): buffer = the_file.read(8192*1024) if not buffer: break count += buffer.count('\n') count += 1 the_file.close() print(count)
希望本文所述对大家的Python程序设计有所帮助。