我已经考虑过使用treelite,所以我必须将模型导入树脂树并生成一个共享库(windows的.dll文件)。请看附件中的代码(在Linux下执行,所以我尝试使用gcc工具链并生成一个'.so‘文件…… 当我试图调用‘cuml.fil.fil.TreeliteModel’函数时,我得到了异常“'export_lib(with real data, you would likely load in cuDF format to start)
X_train_<e
我想了解Dask对象的有效内存管理过程。我已经设置了一个Dask GPU集群,并且我能够执行跨该集群运行的任务。然而,使用dask对象,特别是当我运行计算函数时,在GPU上运行的进程会随着使用越来越多的内存而快速增长,很快我就会收到“内存不足错误”。 我想知道如何在使用完dask对象后释放它们。在下面的示例中,在计算函数之后,我如何释放该对象。我运行了几次以下代码。内存在它运行的进程中不断增长。import cupy as cp
im
我正试图使用dask_cudf对一个非常大的数据集(150,000,000+记录)进行预处理,以便进行多类xgboost培训,并且无法对类列(dtype is string)进行编码。我试着使用“替换”函数,但是错误消息说这两个dtype必须匹配。我试过使用dask_ml.LabelEncoder,但它说cudf中不支持字符串数组。我尝试过以各种方式使用compute(),但是我一直遇到内存不足的错误(我假设是因为cudf dataframe上的操作需