在Python中使用pandas展平嵌套的JSON数组及其父数组,可以通过以下步骤实现:
import pandas as pd
import json
from pandas.io.json import json_normalize
data = '''
{
"id": 1,
"name": "John",
"emails": [
{"email": "john@example.com", "type": "personal"},
{"email": "john@gmail.com", "type": "work"}
],
"phone_numbers": [
{"number": "123456789", "type": "home"},
{"number": "987654321", "type": "mobile"}
]
}
'''
parsed_data = json.loads(data)
json_normalize()
函数将嵌套的JSON展平为扁平化的DataFrame:df = pd.json_normalize(parsed_data)
record_path
参数指定要展平的数组路径:df = pd.json_normalize(parsed_data, record_path=['emails', 'phone_numbers'])
通过上述步骤,你将获得一个展平的DataFrame,其中包含嵌套JSON数组及其父数组的所有属性和值。
总结:
展平嵌套的JSON数组及其父数组是使用pandas在Python中处理JSON数据的常见需求。使用json_normalize()
函数可以方便地实现这一目标。可以通过指定record_path
参数来选择要展平的数组路径。pandas是一个功能强大的数据分析库,在处理结构化数据和进行数据转换时非常有用。
腾讯云相关产品和产品介绍链接地址:
请注意,以上链接是为了提供参考,并不涉及提到的其他云计算品牌商。
领取专属 10元无门槛券
手把手带您无忧上云