有没有一种方法可以将colorsys.rgb_to_hsv应用于pandas数据帧？_有没有一种方法可以过滤成数据帧？_有没有一种简单的方法可以将内容从<pre>标签转移到pandas数据帧中？ - 腾讯云开发者社区

、、、

我的代码首先尝试将RGB值除以255，以获得0-1之间的值，然后尝试为colorsys.rgb_to_hsv创建变量，这些变量将以正确列中的值为目标。显示： import colorsysimport numpy as np for x in df[['R', 'G'

浏览 31提问于2021-02-11得票数 0

1回答

PySpark数据帧Pandas UDF返回空数据帧

、、、

我正在尝试按照groupby('Key').apply(UDF)方法将pandas_udf应用于我的PySpark数据帧以进行一些过滤。为了使用pandas_udf，我定义了一个输出schema，并在列Number上有一个条件。作为一个例子，这里的简化思想是我只希望返回具有奇数Number的行的ID。这就带来了一个问题，有时在一个组中没有奇怪的Number，因此UDF只返回一个空的数据帧，这与为Number返回一个

浏览 2提问于2020-05-18得票数 3

1回答

根据细胞的相对值给熊猫中的细胞着色

、、

我想要给(python) pandas数据帧的单元格着色，根据它们的值是在此列中数据的前5%，前10%，...，最后10%，最后5%。根据这篇文章的Coloring Cells in Pandas，一个人可以定义一个函数，然后将其应用于数据帧。如果你想在一个固定的范围内给单元格上色，这是很好的。因此我的问题是:有没有一种聪明的方法来给前5%，10%，...每列中的数据</

浏览 9提问于2019-04-20得票数 0

回答已采纳

1回答

火花放电-稠密-秩系法

、、、

是否有一种方法可以将密集级别的应用于火花放电数据帧中，但是在查找领带时，根据第一个外观对领带进行排序吗？同样的，在Pandas rank(method='first')

浏览 4提问于2021-11-11得票数 0

回答已采纳

1回答

将函数应用于pandas数据帧中的组

、、、

我正在尝试将简单的函数应用于pandas中的组。我有此数据帧，我可以按type分组 df = pandas.DataFrame({"id": ["a", "b", "c", "d"], "v": [1,2,3,4], "type": ["X", "Y这不起作用，因为apply是以元素为单位的，而type

浏览 0提问于2013-08-09得票数 10

回答已采纳

3回答

pandas:将数据帧拆分为多个csvs

、

我有一个大文件，导入到Pandas中的单个数据帧中。我使用pandas根据数据帧中的行数将文件拆分成多个段。例如: 10行:文件1获取0:4文件2获取5:9 有没有一种方法可以做到这一点，而不必创建更多的数据帧？

浏览 0提问于2017-11-22得票数 2

2回答

如何使用应用于每行多个切片的函数来转换pandas中的DataFrame？

、

我想将函数f应用于pandas DataFrame的每一行中的许多切片。例如，DataFrame df将如下所示：因此，我有一个2行乘49列的数据帧，并且我的函数需要应用于两行中7个数据点的每个后续切片，以便结果数据帧看起来与输入数据帧相同。所以我想创建一个循环或其他

浏览 9提问于2014-11-16得票数 1

1回答

将文本预处理函数应用于scala spark中的dataframe列

、、

我想创建一个函数来处理我在处理文本数据时遇到的问题。我熟悉Python和pandas数据帧，我通常认为解决问题的过程是使用一个函数，然后使用pandas apply方法将该函数应用于列中的所有元素。问题是我不知道如何在这个方法中放入多个替换。我需要对三个独立的数据帧进行大约20次替换，所以用这种方法解决这个问题需要60行代码。有没有一种方法<em

浏览 9提问于2019-12-26得票数 0

回答已采纳

1回答

在Dask中使用尚未实现的Pandas函数

、、、、

我相信在使用Dask数据帧时，我在Dask教程中看到了一个关于如何使用Dask框架中尚未实现的Pandas函数的建议，但我似乎看错了地方。例如，我想使用Pandas函数'ewm‘。作为一种变通方法，我将Dask数据帧转换为Pandas数据帧，在Pandas数据帧上运行ewm，然后将它们转换回Dask，以便以后进行更多内

浏览 10提问于2019-06-02得票数 1

回答已采纳

1回答

如何在Python中将.astype()方法应用于数据帧？

、、

我想使用.astype方法将数据帧(pandas)中的多个列转换为"category“类型。通常，问题是如何将方法(.astype)应用于数据帧？我知道如何将方法应用于数据帧中的列，但是，将其应用于数据帧并不成功，即使使用for循环也是如此，因为for循环返回一个序

浏览 9提问于2020-07-07得票数 1

回答已采纳

1回答

Pyspark管道在pandas数据帧上的应用

、、、

我有一个pyspark管道(包含估算和一个机器学习模型)和一个pandas数据帧。我是否可以在不将其转换为Pyspark dataframe的情况下将管道应用于此pandas数据帧？如果不可能，我如何有效地使用pyspark管道来生成对pandas数据帧的预测？

浏览 3提问于2021-09-13得票数 1

1回答

使用pyspark直接从hdfs加载pandas的大数据

、

我直接从数据库中获取数据，大约有5-1200万的数据。当我尝试将其转换为pandas数据帧以进行分析时。由于音量太大，它总是崩溃。但这是作为csv读取，然后转换为数据帧，否则我将直接从数据库获取。有没有一种有效的方法可以在很短的时间内将这些数据加载为pandas数据帧

浏览 7提问于2020-06-22得票数 0

3回答

将python迭代器输出转换为pandas数据帧的最快方法

、

我有一个生成器，它返回未知数量的数据行，我希望将这些数据转换为索引的pandas数据帧。据我所知，最快的方法是将CSV写入磁盘，然后通过'read_csv‘解析回来。我不能创建预置大小的dataframe，因为我不知道将返回多少行。有没有一种方法可以将迭代器输出转换为pandas数据帧</em

浏览 1提问于2017-03-24得票数 12

1回答

基于dask的时间序列模板匹配

、、

我希望对时间序列使用模板匹配，并且我希望能够将其移植到非常大的数据集。目标是在相对较长的时间序列中寻找许多相对较短的一维模式。关于如何在Dask中做到这一点，有什么建议吗？

浏览 2提问于2019-10-18得票数 0

1回答

Python - Pandas* -导入Excel文件、遍历每行、添加新值以及添加到dataframe*

、、、、

我有一个Excel文件，其中包含项目代码和需要导入的抽象字段，这样我就可以在摘要上运行一个简单的文本摘要生成器，然后添加到数据帧中。我的Excel数据集如下所示： [Proj_Number] | [Abstract] JJF-123 | Diabetes is a serious chronic condition一旦我导入了数据，我想要应用我的文本摘要生成器并得到如下结果： [Proj_Number] | [Abstract] [Ab_k

浏览 17提问于2019-06-08得票数 1

回答已采纳

2回答

截断pandas数据帧中的行数

、

有没有一种方法可以限制pandas数据帧中的行数，或者这是通过索引来实现的，例如： LIMIT = 1000 df = df[:LIMIT] 我问这个的原因是我可能有百万行的数据帧，我想确保这个调用尽可能高效，因为我将调用它。

浏览 38提问于2018-12-22得票数 1

回答已采纳

1回答

数据帧上的spark GROUPED_MAP udf是否并行运行？

、、、

我正在尝试应用一个PandasUDFType.GROUPED_MAP函数，该函数将一个数据帧作为输入，并产生一个数据帧作为输出。当我执行sdf.groupby(key).apply(pandas_udf)时，它是基于可用资源将函数并行应用于多个组，还是按顺序将函数应用于一个组后另一个组？我还没有更改spark的任何默认设置。如果我想在组上并行执行udf，我还可以采用哪些替代方法？

浏览 41提问于2020-08-11得票数 0

1回答

Dask Dataframe大于延迟数字

有没有一种方法可以做到这一点，但将阈值作为延迟数字？import daskimport dask.dataframe as dd ddf = dd.from_pandas(df, npartitions=2) ddf[ddf['something'] >= thr

浏览 17提问于2020-02-13得票数 1

回答已采纳

1回答

将字典转换为表以便在Orangewidget中输出

、、、、

有没有一种简单的方法可以将对象的字典转换为从一个Widget到另一个Widget传输数据所需的表？我有一个带有值列表的测量点字典，并想将它们从我自己的Widget传输到一个“数据表Widget”。我尝试将字典转换为pandas数据帧，然后使用以下代码将数据帧转换为表。我可以在PyCharm中执行代码而不会出现错误，但是当我在Orange中启动它

浏览 8提问于2018-07-27得票数 0

1回答

对pandas中的单列进行固定百分比的混洗

、、、、

我正在尝试将pandas中的单列以固定的百分比进行混洗。总迭代次数= 30)在每次迭代中使用Sklearn utils shuffle函数。但它不会改变原始数据帧。有没有办法将此操作应用于原始数据帧？或者还有其他方法吗？谢谢。

浏览 23提问于2020-11-10得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云