我们正在尝试构建一个web应用程序--Dashboard--在DJango上显示不同的交互式图表(包括单击回调、获取新数据等),并使用Bokeh +Holoview+ Datashader。由于数据非常大,并且可能有10+ 100万个点,所以我们使用的是datashader。import holoviews as hvfrom dask import dataframe as dd
from bokeh
我正在使用Bokeh后端学习HoloViews,并且正在用iPython/Jupyter显示熊猫数组的选定列(实际上它是一个xarray数据集,但是用DataFrame来显示这个问题会更简单)。我的代码基本上是基于HoloViews dashboard docs的。import holoviews as hvimport numpy as np
hv.extension('bokeh
我有一个计算,希望熊猫的数据作为输入。我想在存储在netCDF文件中的数据上运行这个计算,该文件扩展到51 at -目前我一直在用xarray.open_dataset打开文件并使用块(我的理解是这个打开的文件实际上是一个dask数组,因此一次只将数据块加载到内存中然而,我似乎无法利用这种懒散的加载,因为为了运行我的计算,我必须将xarray数据转换为熊猫数据--我的理解是,此时所有的数据都被加载到内存中(这很糟糕)