python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > python json格式解析与转换

python之json格式解析与转换方式

作者:煮雨小筑

使用Python的内置json库可以实现JSON和Python对象的互相转换,有效的JSON格式字符串是指使用双引号、键唯一且没有尾随逗号的字符串,json.loads()用于将JSON字符串转换为Python对象,json.dumps()则将Python对象转化为JSON字符串

python json格式解析与转换 

使用Python标准库: json 实现json格式字符串与Python对象的互转。

但注意,只有有效的json格式字符串才能够转换为Python对象。

OK,问题来了,什么叫有效的json格式字符串?

1、json格式字符串转python类型

主要用到两个函数:

import json

# json格式的字符串  可解析为python列表
json_data_list = '[{"name": ["Alice", "Bob"], "age": [25, 30]}]'
# json格式的字符串  可解析为python字典
json_data_dict = '{"name": ["Alice", "Bob"], "age": [25, 30]}'

# 解析json格式的字符串
parse_json_data_list = json.loads(json_data_list)
parse_json_data_dict = json.loads(json_data_dict)

print(f'json_data_list的类型为: {type(json_data_list)}; parse_json_data_list的类型为: {type(parse_json_data_list)}')
print(f'json_data_dict的类型为: {type(json_data_dict)}; parse_json_data_dict的类型为: {type(parse_json_data_dict)}')

# 转为python类型之后,比如转为python字典,我们就可以使用dict相关方法进行数据的提取等操作

如读取txt文件中存储的字符串形式的json数据,如下图

import json

# open函数返回一个文件对象,并将其赋给f
with open(r'test_json.txt', 'r') as f:
    json_content = json.load(f)
    print(json_content)
    print(type(json_content))

2、python对象转为json格式字符串

主要用到两个函数:

import json

# python对象
data_list = [1, 2, 3]
data_dict = {"name": ["Alice", "Bob"], "age": [25, 30]}

# 转为json对象
json_data_list = json.dumps(data_list)
json_data_dict = json.dumps(data_dict)

print(f'data_list的类型为: {type(data_list)}; json_data_list的类型为: {type(json_data_list)}')
print(f'data_dict的类型为: {type(data_dict)}; json_data_dict的类型为: {type(json_data_dict)}')

import json

data_dict = {"name": ["Alice", "Bob"], "age": [25, 30]}

# 创建一个test_json.json文件(w: 文件不存在则创建)
with open(r'test_json.json', 'w') as f:
    # indent: 该参数用来控制缩进 用来美化json使其有清晰的层次结构
    json.dump(data_dict, f, indent=4)

3、json转DataFrame

直接使用pd.read_json函数读取json格式字符串、json文件,然后转为DataFrame

import pandas as pd
from io import StringIO
 
# 读取JSON数据为DataFrame对象
json_data = '{"name": ["Alice", "Bob"], "age": [25, 30]}'
# read_json 函数通常期望接收一个文件路径或文件对象,而不是字符串,
# 所以这里使用了StringIO 来将字符串json_data 转换成一个类似文件的对象,这样read_json 就可以从中读取数据
df = pd.read_json(StringIO(json_data))
df

或直接读取json文件

import pandas as pd

data = pd.read_json(r'test_json.json')
data

4、DataFrame转json

import pandas as pd

data = pd.DataFrame(
    {
        'value': range(10),
        'time': pd.date_range('2024-01-01', freq='D', periods=10),
        'flag': list('abcdefghij')
    }
)

data.to_json('test_to_json.json', indent=4)
# data.to_json('test_to_json.json', indent=4, date_unit='s') date_unit='s'可将时间戳转换为以秒为单位的时间戳

部分输出结果如下,

同时可以使用orient(其参数可以取:split、records、index、columns、values、table)参数改变输出数据结构,大家可以尝试一下各个参数取值出来的效果,下面展示orient='records'的输出效果。

import pandas as pd

data = pd.DataFrame(
    {
        'value': range(10),
        'time': pd.date_range('2024-01-01', freq='D', periods=10),
        'flag': list('abcdefghij')
    }
)

data.to_json('test_to_json.json', indent=4, orient='records')

部分输出结果如下,输出是一个 JSON 对象数组,其中每个对象对应 DataFrame 的一行。

同时注意到,时间格式在转为json之后,变成了时间戳,怎么保留原来的时间格式呢?

那就需要在转为json之前,先把时间格式转为字符串格式,再转为json

import pandas as pd
 
data = pd.DataFrame(
    {
        'value': range(10),
        'time': pd.date_range('2024-01-01', freq='D', periods=10),
        'flag': list('abcdefghij')
    }
)
 
data['time'] = data['time'].astype(str)
 
data.to_json('test_to_json.json', indent=4, orient='records')

部分输出结果为,

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:
阅读全文