腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有没有
一种
方法
可以
将
colorsys.rgb_to_hsv
应用于
pandas
数据
帧
?
、
、
、
我的代码首先尝试
将
RGB值除以255,以获得0-1之间的值,然后尝试为
colorsys.rgb_to_hsv
创建变量,这些变量将以正确列中的值为目标。显示: import colorsysimport numpy as np for x in df[['R', 'G'
浏览 31
提问于2021-02-11
得票数 0
1
回答
PySpark
数据
帧
Pandas
UDF返回空
数据
帧
、
、
、
我正在尝试按照groupby('Key').apply(UDF)
方法
将
pandas
_udf
应用于
我的PySpark
数据
帧
以进行一些过滤。为了使用
pandas
_udf,我定义了一个输出schema,并在列Number上有一个条件。作为一个例子,这里的简化思想是我只希望返回具有奇数Number的行的ID。这就带来了一个问题,有时在一个组中没有奇怪的Number,因此UDF只返回一个空的
数据
帧
,这与为Number返回一个
浏览 2
提问于2020-05-18
得票数 3
1
回答
根据细胞的相对值给熊猫中的细胞着色
、
、
我想要给(python)
pandas
数据
帧
的单元格着色,根据它们的值是在此列中
数据
的前5%,前10%,...,最后10%,最后5%。根据这篇文章的Coloring Cells in
Pandas
,一个人
可以
定义一个函数,然后将其
应用于
数据
帧
。 如果你想在一个固定的范围内给单元格上色,这是很好的。因此我的问题是:
有没有
一种
聪明的
方法
来给前5%,10%,...每列中的
数据</
浏览 9
提问于2019-04-20
得票数 0
回答已采纳
1
回答
火花放电-稠密-秩系法
、
、
、
是否有
一种
方法
可以
将
密集级别的
应用于
火花放电
数据
帧
中,但是在查找领带时,根据第一个外观对领带进行排序吗? 同样的,在
Pandas
rank(method='first')
浏览 4
提问于2021-11-11
得票数 0
回答已采纳
1
回答
将
函数
应用于
pandas
数据
帧
中的组
、
、
、
我正在尝试
将
简单的函数
应用于
pandas
中的组。我有此
数据
帧
,我
可以
按type分组 df =
pandas
.DataFrame({"id": ["a", "b", "c", "d"], "v": [1,2,3,4], "type": ["X", "Y这不起作用,因为apply是以元素为单位的,而type
浏览 0
提问于2013-08-09
得票数 10
回答已采纳
3
回答
pandas
:
将
数据
帧
拆分为多个csvs
、
我有一个大文件,导入到
Pandas
中的单个
数据
帧
中。我使用
pandas
根据
数据
帧
中的行数
将
文件拆分成多个段。例如: 10行:文件1获取0:4文件2获取5:9
有没有
一种
方法
可以
做到这一点,而不必创建更多的
数据
帧
?
浏览 0
提问于2017-11-22
得票数 2
2
回答
如何使用
应用于
每行多个切片的函数来转换
pandas
中的DataFrame?
、
我想将函数f
应用于
pandas
DataFrame的每一行中的许多切片。例如,DataFrame df将如下所示:因此,我有一个2行乘49列的
数据
帧
,并且我的函数需要
应用于
两行中7个
数据
点的每个后续切片,以便结果
数据
帧
看起来与输入
数据
帧
相同。所以我想创建一个循环或其他
浏览 9
提问于2014-11-16
得票数 1
1
回答
将
文本预处理函数
应用于
scala spark中的dataframe列
、
、
我想创建一个函数来处理我在处理文本
数据
时遇到的问题。我熟悉Python和
pandas
数据
帧
,我通常认为解决问题的过程是使用一个函数,然后使用
pandas
apply
方法
将该函数
应用于
列中的所有元素。问题是我不知道如何在这个
方法
中放入多个替换。我需要对三个独立的
数据
帧
进行大约20次替换,所以用这种
方法
解决这个问题需要60行代码。
有没有
一种
方法
<em
浏览 9
提问于2019-12-26
得票数 0
回答已采纳
1
回答
在Dask中使用尚未实现的
Pandas
函数
、
、
、
、
我相信在使用Dask
数据
帧
时,我在Dask教程中看到了一个关于如何使用Dask框架中尚未实现的
Pandas
函数的建议,但我似乎看错了地方。例如,我想使用
Pandas
函数'ewm‘。作为
一种
变通
方法
,我
将
Dask
数据
帧
转换为
Pandas
数据
帧
,在
Pandas
数据
帧
上运行ewm,然后将它们转换回Dask,以便以后进行更多内
浏览 10
提问于2019-06-02
得票数 1
回答已采纳
1
回答
如何在Python中将.astype()
方法
应用于
数据
帧
?
、
、
我想使用.astype
方法
将
数据
帧
(
pandas
)中的多个列转换为"category“类型。通常,问题是如何
将
方法
(.astype)
应用于
数据
帧
?我知道如何
将
方法
应用于
数据
帧
中的列,但是,将其
应用于
数据
帧
并不成功,即使使用for循环也是如此,因为for循环返回一个序
浏览 9
提问于2020-07-07
得票数 1
回答已采纳
1
回答
Pyspark管道在
pandas
数据
帧
上的应用
、
、
、
我有一个pyspark管道(包含估算和一个机器学习模型)和一个
pandas
数据
帧
。我是否
可以
在不将其转换为Pyspark dataframe的情况下
将
管道
应用于
此
pandas
数据
帧
?如果不可能,我如何有效地使用pyspark管道来生成对
pandas
数据
帧
的预测?
浏览 3
提问于2021-09-13
得票数 1
1
回答
使用pyspark直接从hdfs加载
pandas
的大
数据
、
我直接从
数据
库中获取
数据
,大约有5-1200万的
数据
。当我尝试将其转换为
pandas
数据
帧
以进行分析时。由于音量太大,它总是崩溃。但这是作为csv读取,然后转换为
数据
帧
,否则我
将
直接从
数据
库获取。
有没有
一种
有效的
方法
可以
在很短的时间内
将
这些
数据
加载为
pandas
数据
帧
浏览 7
提问于2020-06-22
得票数 0
3
回答
将
python迭代器输出转换为
pandas
数据
帧
的最快
方法
、
我有一个生成器,它返回未知数量的
数据
行,我希望
将
这些
数据
转换为索引的
pandas
数据
帧
。据我所知,最快的
方法
是
将
CSV写入磁盘,然后通过'read_csv‘解析回来。我不能创建预置大小的dataframe,因为我不知道
将
返回多少行。
有没有
一种
方法
可以
将
迭代器输出转换为
pandas
数据
帧</em
浏览 1
提问于2017-03-24
得票数 12
1
回答
基于dask的时间序列模板匹配
、
、
我希望对时间序列使用模板匹配,并且我希望能够将其移植到非常大的
数据
集。目标是在相对较长的时间序列中寻找许多相对较短的一维模式。关于如何在Dask中做到这一点,有什么建议吗?
浏览 2
提问于2019-10-18
得票数 0
1
回答
Python -
Pandas
-导入Excel文件、遍历每行、添加新值以及添加到dataframe
、
、
、
、
我有一个Excel文件,其中包含项目代码和需要导入的抽象字段,这样我就
可以
在摘要上运行一个简单的文本摘要生成器,然后添加到
数据
帧
中。我的Excel
数据
集如下所示: [Proj_Number] | [Abstract] JJF-123 | Diabetes is a serious chronic condition一旦我导入了
数据
,我想要应用我的文本摘要生成器并得到如下结果: [Proj_Number] | [Abstract] [Ab_k
浏览 17
提问于2019-06-08
得票数 1
回答已采纳
2
回答
截断
pandas
数据
帧
中的行数
、
有没有
一种
方法
可以
限制
pandas
数据
帧
中的行数,或者这是通过索引来实现的,例如: LIMIT = 1000 df = df[:LIMIT] 我问这个的原因是我可能有百万行的
数据
帧
,我想确保这个调用尽可能高效,因为我
将
调用它。
浏览 38
提问于2018-12-22
得票数 1
回答已采纳
1
回答
数据
帧
上的spark GROUPED_MAP udf是否并行运行?
、
、
、
我正在尝试应用一个PandasUDFType.GROUPED_MAP函数,该函数
将
一个
数据
帧
作为输入,并产生一个
数据
帧
作为输出。当我执行sdf.groupby(key).apply(
pandas
_udf)时,它是基于可用资源
将
函数并行
应用于
多个组,还是按顺序
将
函数
应用于
一个组后另一个组?我还没有更改spark的任何默认设置。如果我想在组上并行执行udf,我还
可以
采用哪些替代
方法
?
浏览 41
提问于2020-08-11
得票数 0
1
回答
Dask Dataframe大于延迟数字
有没有
一种
方法
可以
做到这一点,但
将
阈值作为延迟数字?import daskimport dask.dataframe as dd ddf = dd.from_
pandas
(df, npartitions=2) ddf[ddf['something'] >= thr
浏览 17
提问于2020-02-13
得票数 1
回答已采纳
1
回答
将
字典转换为表以便在Orangewidget中输出
、
、
、
、
有没有
一种
简单的
方法
可以
将对象的字典转换为从一个Widget到另一个Widget传输
数据
所需的表? 我有一个带有值列表的测量点字典,并想将它们从我自己的Widget传输到一个“
数据
表Widget”。我尝试
将
字典转换为
pandas
数据
帧
,然后使用以下代码
将
数据
帧
转换为表。我
可以
在PyCharm中执行代码而不会出现错误,但是当我在Orange中启动它
浏览 8
提问于2018-07-27
得票数 0
1
回答
对
pandas
中的单列进行固定百分比的混洗
、
、
、
、
我正在尝试
将
pandas
中的单列以固定的百分比进行混洗。总迭代次数= 30)在每次迭代中使用Sklearn utils shuffle函数。但它不会改变原始
数据
帧
。
有没有
办法将此操作
应用于
原始
数据
帧
?或者还有其他
方法
吗?谢谢。
浏览 23
提问于2020-11-10
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何从Pandas迁移到Spark?这8个问答解决你所有疑问
这样做能让你的 pandas 循环加快 71803 倍
pandas数据可视化快速入门1简单图
Python数据可视化之pandas入门
Pandas 初学者代码优化指南
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券