使用Pandas如何读取多个分隔方式的文件
作者:末世灯光
这篇文章主要介绍了使用Pandas如何读取多个分隔方式的文件问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
用Pandas读取多个分隔方式的文件
如果你的文本文件的第一行数据是使用逗号分隔的,而其余行是使用 tab 分隔的
你需要在 Pandas 中使用 read_csv 函数,并使用正则表达式指定多个分隔符。
1,2,3,4,5,6 a b c d e f z x c v b n
以下是如何使用 Pandas 读取该文件的代码:
import pandas as pd # 读取文本文件,使用正则表达式指定多个分隔符,并将第一行作为列名 df = pd.read_csv('data.txt', sep=r'[,\t]', engine='python', header=0) # 打印数据框 print(df)
输出结果应为:
1 2 3 4 5 6
0 a b c d e f
1 z x c v b n
这里的 sep 参数使用了正则表达式 [,\t]
,表示分隔符可以是逗号或者 tab。
engine 参数指定了解析器的引擎,这里我们选择了 Python 自带的解析器。
最后,header=0 参数告诉 Pandas 使用第一行作为列名。
Pandas读取TXT,txt中数据以空格间隔
可以使用pandas的read_csv函数来读取TXT文件中的数据。
在调用read_csv函数时,可以使用sep参数指定数据之间的分隔符。
例如:
如果TXT文件中的数据以空格间隔,则可以使用sep=' '调用read_csv函数。
下面是一个例子
import pandas as pd # 读取TXT文件中的数据 df = pd.read_csv('data.txt', sep=' ') # 显示前5行数据 df.head()
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。