我正在尝试使用dask bag首先读取嵌套的大json文件,然后将其扁平为dask dataframe,然后将其保存为csv。然而,在扁平化过程中,我遇到了一个非类型错误"TypeError:' nonetype‘object is not subscriptable“。'early_termination': False,
'platform
我需要使用Dask读取几个json.gz文件。我试图通过使用dask.bag.read_text(文件名).map(json.loads)来实现这一点,但输出是一个嵌套列表(文件包含字典列表),而我只想获得字典列表。import json import dask.bag as db
dict_list = [{'id'
我正在尝试创建一组类方法来读取.JSON文件的特定部分,但在将信息从一个方法传递到另一个方法时遇到了问题,在这种情况下,我试图将dask.bag从'read_files‘方法传递到'split_to_requests我不确定我的错误在哪里,但是在“test_split_requests”测试中运行单元测试失败。我在代码的底部添加了测试。import json from