python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > DataFrame数据写入csv文件及读取

如何将DataFrame数据写入csv文件及读取

作者:geerduo

在Python中进行数据处理时,经常会用到CSV文件的读写操作,当需要将list数据保存到CSV文件时,可以使用内置的csv模块,若data是一个list,saveData函数能够将list中每个元素存储在CSV文件的一行,但需要注意的是,默认情况下读取出的CSV数据类型为str

一、saveData函数

import csv
 
def saveData(filePath, data):
 
    with open(filePath, 'w+', newline='') as f:
        writer = csv.writer(f)
        for row in data:
            writer.writerow(row)

如果data是一个list,saveData函数会将list中的每个元素保存在csv文件中的一行。

但是存在一个问题:

csv文件中保存的数据如果直接读取出来是str类型,需要进行转换

二、将DataFrame写入csv文件

情况1

将list写入csv文件

init_configs = []
for i, cluster in enumerate(clusters):
    init_configs.append([f"cluster {i}:"])
    for _, row in cluster.iterrows():
        config = row.tolist()
        init_configs.append(config)
 
saveData('filePath', init_configs)

config = row.tolist()会将df中每一行数据都转变为list,然后append到init_configs中,通过调用saveData函数可以将每一行数据表示的list都写到csv文件中的一行。

这种情况生成的csv文件中每一行的各个元素之间都是用逗号隔开。

情况2

将嵌套list写入csv文件

init_configs = []
for i, cluster in enumerate(clusters):
    init_configs.append([f"cluster {i}:"])
    for _, row in cluster.iterrows():
        config = row.tolist()
        init_configs.append([config])
 
saveData('filePath', init_configs)

这种情况下init_configs中每个元素是一个二维list,由于CSV 文件是一种纯文本格式,它无法直接存储列表或其他复杂的数据结构。

当尝试将 [[1, 2, 3, 4, 5]] 这个二维嵌套list写入CSV文件时,它会被自动转换为字符串形式。

如下:

三、读取csv文件

情况1

如果按照上面的方法1写csv文件,可以按照如下方式将内容读出来:

import pandas as pd
 
with open(filePath, 'r') as f:
    lines = f.readlines()
 
filtered_lines = [line for line in lines if not line.startswith('cluster')]
 
configs = []
for line in filtered_lines:
    config = [int(x) for x in line.strip().split(',')]
    configs.append(config)
 
df = pd.DataFrame(configs)

可以用列表表达式的方式将csv文件中每一行的数据转为一个list。

情况2

如果将整个list当作字符串写到了csv文件中,可以按照如下方式将内容正确地读出来:

import pandas as pd
import ast
 
with open(filePath, 'r') as f:
    lines = f.readlines()
 
filtered_lines = [line for line in lines if not line.startswith('cluster')]
 
configs = []
for line in filtered_lines:
    config = ast.literal_eval(eval(line))
    configs.append(config)
 
df = pd.DataFrame(configs)

通过config = ast.literal_eval(eval(line))可以将变为字符串的list还原成原本的数据形式。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:
阅读全文