我正在尝试解压缩一个文件,但是在运行以下代码时我得到了这个错误:
import pickle
import pandas as pd
import numpy
unpickled_df = pd.read_pickle("./ToyData.pickle")
unpickled_df
或
import pickle
# load : get the data from file
data = pickle.load(open('ToyData.pickle', "rb"))
错误输出:
AttributeError
我想从我的熊猫数据中创建一个多路应急表,并将其存储在xarray中。在我看来,使用和应该足够简单,但我在熊猫v1.1.5中得到了"TypeError:无法将'intervalint64‘解释为数据类型’“。(v1.0.1给出"ValueError:所有数组必须相同长度“)。
In [1]: import numpy as np
...: import pandas as pd
...: pd.__version__
Out[1]: '1.1.5'
In [2]: import xarray as xr
...: xr.__versio
我从这个网站获得了示例代码:
我想知道为什么示例程序不能在我的计算机上使用xarray-0.15.0或xarray-0.15.1。
原始代码在下面
import cartopy.crs as ccrs
import cartopy.feature as cfeature
import matplotlib.pyplot as plt
import numpy as np
import xarray as xr
import metpy.calc as mpcalc
from metpy.cbook import get_test_data
from metpy.interpolate imp
这个问题很简单,但我在网上找不到答案。我有一个Dataset,我只想给它添加一个命名的DataArray。就像dataset.add({"new_array": new_data_array})一样。我知道merge、update和concatenate,但我的理解是merge用于合并两个或更多的Dataset,concatenate用于连接两个或更多的DataArray以形成另一个DataArray,而我还没有完全理解update。我已经尝试过dataset.update({"new_array": new_data_array}),但是我得到了以下错误。
I
我已经安装了PyMc3,但是import pymc3 as pm失败了。以下是错误消息:
WARNING (theano.configdefaults): g++ not available, if using conda: `conda install m2w64-toolchain`
C:\Users\miallana\AppData\Local\Programs\Python\Python39\lib\site-packages\theano\configdefaults.py:560: UserWarning: DeprecationWarning: there is no c++ c
我最近更新了我的xarray,但现在在导入它时遇到一个错误: $ python3
Python 3.8.10 (default, Jun 2 2021, 10:49:15)
[GCC 9.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>import xarray
No protocol specified
>>> 这是什么意思?它是否与对其他东西的依赖有关?我使用p
我想根据特定的组对xarray数据集进行下采样,所以我使用groupby来选择组,然后在每个组中抽取10%的样本。我正在使用下面的代码,但是我得到了IndexError: index 1330 is out of bounds for axis 0 with size 1330,这表明我的函数正在返回一个空数组,但是subset绝对有非零维。
我当时使用的是squeeze=True,我认为这将允许提供新的维度,但这并没有帮助,所以我将其改为squeeze=False。
你知道会发生什么事吗?谢谢!
# Set random seed for reproducibility
np.random.
我想将沿两个坐标之间的横断面线的横截面数据保存为netCDF文件。 我遵循的是Metpy's Cross Section Analysis中描述的示例代码 以下是添加了remove crs命令的修改后的代码: import cartopy.crs as ccrs
import cartopy.feature as cfeature
import matplotlib.pyplot as plt
import numpy as np
import xarray as xr
import metpy.calc as mpcalc
from metpy.interpolate import
我正在寻找使用xarray.open_mfdataset()读取远程zarr存储 我要买一台zarr.errors.GroupNotFoundError: group not found at path ''。在底部回溯。 import xarray as xr
import s3fs
fs = s3fs.S3FileSystem(anon=True)
uri = "s3://era5-pds/zarr/2020/12/data/eastward_wind_at_10_metres.zarr"
file = s3fs.S3Map(uri, s3=fs)
ds
我对尝试并行化我的python代码非常陌生。我正在尝试对xarray执行一些分析,然后用结果填充pandas dataframe。数据帧的列是独立的,所以我认为使用dask delayed进行并行化应该是微不足道的,但无法弄清楚如何实现。我的xarray非常大,所以这个循环需要一段时间,而且占用的内存也很大。它也可以被时间分块,如果这样更容易的话(这可能有助于记忆)! 下面是未并行化的版本: from time import sleep
import time
import pandas as pd
import dask.dataframe as dd
data1 = np.random
`sst_gradient = xr.Dataset({'sst_gradient':(['lat','lon','time'],sst_gradient)},/error in this line
coords={'lat':(selected_sst.lat.values),
'lon':(selected_sst.lon.values),
'
我正在使用xarray.DataArray向应用一个函数。它适用于某些NetCDF,而与其他在维度、坐标等方面似乎相当的NetCDF失败。但是,在代码工作的NetCDF与代码失败的NetCDF之间肯定有一些不同,希望有人在看到代码和关于下面列出的文件的一些元数据之后,能够评论问题所在。
我正在运行的执行计算的代码如下:
# open the precipitation NetCDF as an xarray DataSet object
dataset = xr.open_dataset(kwrgs['netcdf_precip'])
# get the precipitat
假设我有一个按(x,y,time)索引的数据集:
import xarray as xr, pandas as pd, numpy as np
x = np.linspace(-110, -90, 5)
y = np.linspace(23, 30, 5)
time = pd.date_range('1990-01-01', '2100-12-01', freq='MS')
da = xr.DataArray(
np.random.random(size=(5, 5, len(time))),
dims=['x'