如何将DataFrame数据写入csv文件及读取
作者:geerduo
在Python中进行数据处理时,经常会用到CSV文件的读写操作,当需要将list数据保存到CSV文件时,可以使用内置的csv模块,若data是一个list,saveData函数能够将list中每个元素存储在CSV文件的一行,但需要注意的是,默认情况下读取出的CSV数据类型为str
一、saveData函数
import csv def saveData(filePath, data): with open(filePath, 'w+', newline='') as f: writer = csv.writer(f) for row in data: writer.writerow(row)
如果data是一个list,saveData函数会将list中的每个元素保存在csv文件中的一行。
但是存在一个问题:
csv文件中保存的数据如果直接读取出来是str类型,需要进行转换
二、将DataFrame写入csv文件
情况1
将list写入csv文件
init_configs = [] for i, cluster in enumerate(clusters): init_configs.append([f"cluster {i}:"]) for _, row in cluster.iterrows(): config = row.tolist() init_configs.append(config) saveData('filePath', init_configs)
config = row.tolist()会将df中每一行数据都转变为list,然后append到init_configs中,通过调用saveData函数可以将每一行数据表示的list都写到csv文件中的一行。
这种情况生成的csv文件中每一行的各个元素之间都是用逗号隔开。
情况2
将嵌套list写入csv文件
init_configs = [] for i, cluster in enumerate(clusters): init_configs.append([f"cluster {i}:"]) for _, row in cluster.iterrows(): config = row.tolist() init_configs.append([config]) saveData('filePath', init_configs)
这种情况下init_configs中每个元素是一个二维list,由于CSV 文件是一种纯文本格式,它无法直接存储列表或其他复杂的数据结构。
当尝试将 [[1, 2, 3, 4, 5]]
这个二维嵌套list写入CSV文件时,它会被自动转换为字符串形式。
如下:
三、读取csv文件
情况1
如果按照上面的方法1写csv文件,可以按照如下方式将内容读出来:
import pandas as pd with open(filePath, 'r') as f: lines = f.readlines() filtered_lines = [line for line in lines if not line.startswith('cluster')] configs = [] for line in filtered_lines: config = [int(x) for x in line.strip().split(',')] configs.append(config) df = pd.DataFrame(configs)
可以用列表表达式的方式将csv文件中每一行的数据转为一个list。
情况2
如果将整个list当作字符串写到了csv文件中,可以按照如下方式将内容正确地读出来:
import pandas as pd import ast with open(filePath, 'r') as f: lines = f.readlines() filtered_lines = [line for line in lines if not line.startswith('cluster')] configs = [] for line in filtered_lines: config = ast.literal_eval(eval(line)) configs.append(config) df = pd.DataFrame(configs)
通过config = ast.literal_eval(eval(line))可以将变为字符串的list还原成原本的数据形式。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。