cudf支持get_dummies吗？

文章/答案/技术大牛

发布

1回答

、

cudf支持熊猫get_dummies吗？

浏览 5提问于2019-11-13得票数 2

1回答

IIUC我可以使用BlazingSQL语法查询、连接、聚合和使用CuDF，但我也可以使用dask_cudf将数据读入CuDF，并使用python/dataframe语法执行所有相同的操作。使用dask的好处之一是它可以对分区进行操作，这样就可以对大于GPU内存的数据集进行操作，而BlazingSQL仅限于适用于GPU的数据集，这是正确的吗？编辑：谈到了dask_cudf，但是实际的被存档了，说dask支持现在在cudf本身中。如果知道如何利用dask来使用<

浏览 1提问于2020-01-18得票数 3

回答已采纳

1回答

错误:找不到满足dask要求的版本(来自版本: none)

、、、、

描述了bug---------------------------------------------------------------import dask在CUDF的github页面上存档。解决方案我尝试过

浏览 18提问于2020-10-28得票数 4

回答已采纳

1回答

如何用rapids.ai实现图形处理器中两个DataFrame之间的矩阵点积

、、

我正在使用CUDF，它是Nvidia的rapids ML套件的一部分。使用这个套件，我如何在两个DataFrame之间做一个点积？a = cudf.DataFrame([[0.1, 0.2, 0.3, 0.4], [0.1, 0.2, 0.3, 0.4]])a.T.dot(b) # It doesn't work, cudf doesn't supprot .dot 例如，我如何在上面的数据帧上执行点积？

浏览 15提问于2020-03-30得票数 0

1回答

从Dask到CuDF数据的转换

、、、、

有什么功能可以将dask-cudf dataframe转换为Cudf dataframe吗?就像cudf的from_cudf到from_cudf一样.dgdf = dask_cudf.from_cudf(df，npartitions=2)

浏览 8提问于2022-08-15得票数 0

1回答

TypeError：“BlockManager”对象不可迭代

、、、、

我正在尝试合并一个cudf数据帧和一个geopandas数据帧。df.merge(parishes[['NAME_3', 'area']], left_on='Parish', right_on='NAME_3').drop(columns=['NAME_3'])&#

浏览 23提问于2021-05-27得票数 1

1回答

TypeError:字段元组的第一个元素既不是元组也不是str，具有cuDF.DataFrame.apply(func，axis)。

、、

下面的代码是实现 return np.histogram(row, bins=5,range=(1,10)) import cudf as dfIt [139](file:///opt&#

浏览 17提问于2022-05-20得票数 1

1回答

使用CuDF* apply_chunks时出现异常-使用了不受支持的NumPy函数'numpy.ones_like‘或使用了不受支持的函数*

、、、

我试图在Numba的jit优化代码中使用numpy，但是当我尝试像numpy.ones_like这样的标准numpy操作时，我得到了错误，尽管numba文档提到该操作是受支持的。 return cudf_df.apply_chunks(calc_method, incols=['a', 'b'], outc

浏览 50提问于2020-02-13得票数 0

2回答

cudf在centos7上的安装问题

、、

我在文件中添加了以下两个通道：以及以下一揽子计划：安装工作持续了几个小时，在试图查找不兼容的包时，它似乎处于某种循环状态由于我们在GPU /w上不容易获得交互式shell，所以我在非GPU机器上尝试conda环境更新，一旦安装，我将在GPU机器上尝试cudf包。EDIT1:这就是我在没有tensorflow和tensorflow集线器的情况下所做的工作 channels:

浏览 5提问于2022-03-15得票数 1

回答已采纳

1回答

dask_cudf数据格式中的标签编码

、、、、

我正试图使用dask_cudf对一个非常大的数据集(150,000,000+记录)进行预处理，以便进行多类xgboost培训，并且无法对类列(dtype is string)进行编码。我试过使用dask_ml.LabelEncoder，但它说cudf中不支持字符串数组。我尝试过以各种方式使用compute()，但是我一直遇到内存不足的错误(我假设是因为cudf dataframe上的操作需要一个更小的数据集)。我尝试手动排列它们，但是dask_cudf似乎不支持使用‘does’参数进行重

浏览 14提问于2022-07-01得票数 0

2回答

如何使用cudf删除带有NA的列？

、、

熊猫： data = data.dropna(axis = 'columns') 我正在尝试使用cudf dataframe执行类似的操作，但apis不提供此功能。我的解决方案是转换为pandas df，执行上述命令，然后重新转换为cudf。有没有更好的解决方案？

浏览 12提问于2019-05-31得票数 1

回答已采纳

1回答

我试图从conda的源代码安装cudf，我不能使用cmake来安装它。

、、、、

It fails with the following output: Change Dir: /home/CUDF/cudf/cpp/build/CMakeFiles/CMakeTmp/ -x cu -c /home/CUDF/cudf/cpp/build/CMakeFiles/CMakeTmp/main.cu -o CMakeFiles

浏览 2提问于2020-07-24得票数 0

回答已采纳

1回答

那么dask_cudf操作呢？

、、、

如何在大型数据集dask_cudf上运行dask_cuML (例如逻辑回归)？例如，有人知道在dask_cudf数据帧上运行逻辑回归的步骤吗？关于我的cudf和cuml逻辑函数：cudf.core.dataframe.DataFrame logreg = cuml.Log

浏览 1提问于2020-02-06得票数 0

3回答

如何使用pip安装cudf？

、、

我想在我的图形处理器上加速pandas，所以我决定使用cudf库。请推荐其他库(如果有)。Collecting cudf-cuda92 ERROR: Could not find a version thatsatisfies the requirement cudf-cuda92 (from version

浏览 76提问于2019-09-12得票数 3

1回答

如何在Python中使用带前缀的str.get_dummies？

、、

pd.get_dummies()支持prefix (ref)。如何将prefix与以下内容一起使用？dummies = data_df['genres_names'].str.get_dummies() get_dummies(prefix='genre')抛出一个错误： TypeError: get_dummies

浏览 23提问于2019-02-20得票数 2

3回答

文本/字符串的cuDF

、

我是cuDF的新手，可能还不了解构造的目的，所以这是一个非常通用的问题。我有一个主要包含字符串列的数据集，我希望使用apply_rows来执行字符串的处理，但是，我意识到这可能只适用于数字数据。下面是我在大多数网站中引用的一个例子： import cudfnelem = 3 kwargs=dict(kwa

浏览 48提问于2020-03-30得票数 1

2回答

下载了GPU驱动程序(cuda，cudf等)，但它无法工作

、、、

有人知道怎么解决这个问题吗？我一直在为这一步奋斗，很少有months..Appreciate它！cudf import core, datasets File "/home/user/miniconda3/lib/python3.6/site-packages/cudf/core/__init_/site-packages/cudf/core/column/__init__.

浏览 2提问于2020-07-01得票数 1

1回答

cuDF -不利用GPU核心

、、、

下面是用cuDF编写的python代码，以加速这个过程。但与我的4核心本地机器cpu相比，我没有看到任何速度上的差异。h.append(p) t_df = cudf.DataFrame.from_pandas

浏览 1提问于2020-04-21得票数 0

1回答

cuDF图形处理器利用率低

我比较了在Xeon CPU (Pandas)和RTX 2080 (CUDF)上运行这些查询的性能。对于100k行的数据帧，GPU更快，但不是很快。我的问题是，我可以做些什么来加速cuDF任务并实现高GPU利用率？例如，对于CPU用例，我可以在8个CPU核心上并行运行其中的8个查询。NUM_ELEMENTS = 100000 df['value1'] = cp.random.sample(NUM_ELEMENTS) df['value2有没有办法在cuDF<

浏览 26提问于2020-12-29得票数 0

1回答

如何在colab中方便地使用急流

、、、、

当我在逗号库中使用follows.But ( cudf )时，我执行命令，因为这个命令通常需要20分钟左右，所以每次使用cudf都要等待。没有人知道如何在没有此命令的情况下轻松地使用cudf和colab吗？

浏览 6提问于2022-08-06得票数 2

点击加载更多