我需要在pandas中使用一些*.nc文件,并且我正在努力进行转换。下面是DataSet DS1: <xarray.Dataset>Coordinates:使用 DS1.to_dataframe() 我得到了错误: NotImplementedError: > 1 ndim Categorical are not supported at this time
使用解决方案here效率不高,原因是在每个i,j处花费时间将"dsloc“转换为"dataframe”(请查看下面的代码)。**可以从here下载示例NetCDF文件** import pandas as pdimport time
#Generate some coordinatescoords_data = [{'lat': 68.04, 'lon': 15.20, 'stid'
PySD将Vensim (系统动力学建模包)中的模型转换为python,并允许用户用比Vensim更复杂的例程替换各种方程。我正在运行一个具有多种下标的模型,这会创建一个不寻常的输出格式。输出被读入数据帧,其订阅元素的单个值最终为xarray.DataArrays。我想知道如何获取xarray.DataArrays的一列(最后是一个系列),并将其转换为二维数组,第二维空间是下标的数量。请记住,这是一个说明问题的任意示例)import num
我正在尝试对xarray执行一些分析,然后用结果填充pandasdataframe。数据帧的列是独立的,所以我认为使用dask delayed进行并行化应该是微不足道的,但无法弄清楚如何实现。下面是未并行化的版本: from time import sleepimport pandas as pd return xarray1.where(x
我想在存储在netCDF文件中的数据上运行这个计算,该文件扩展到51 at -目前我一直在用xarray.open_dataset打开文件并使用块(我的理解是这个打开的文件实际上是一个dask数组,因此一次只将数据块加载到内存中然而,我似乎无法利用这种懒散的加载,因为为了运行我的计算,我必须将xarray数据转换为熊猫数据--我的理解是,此时所有的数据都被加载到内存中(这很糟糕)。因此,我想长话短说,我的问题是:如果没有任何中间步骤将整个数据加载到内存中,我如何才能从xarray数据集获