腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
提取
python
pandas
Dataframe
中
单个
列
中
包含
的
分组
、
、
、
这里有一个类似下图
的
excel文件: ? 在使用pd.read_excel()之后,我有了一个数据帧,如下所示: pd.
DataFrame
({'Accessory Description':['GROUP1','item1', 'item2',但是,我想要操作数据帧,使其显示如下: pd.
DataFrame
({'Group':['Group1','Group1','Group1'
浏览 28
提问于2021-10-20
得票数 0
回答已采纳
1
回答
PySpark:带有标量
Pandas
的
无效returnType
、
、
我正在尝试从
pandas
_udf返回一个特定
的
结构。它在一个集群上工作,但在另一个集群上失败。我尝试在组上运行udf,这需要返回类型为数据框架。from pyspark.sql.functions import
pandas
_udfimport numpy as np oneCar.loc[1:, 'Lati
浏览 2
提问于2018-03-26
得票数 5
回答已采纳
1
回答
在多个轴上
的
groupby()上
的
Pandas
- cumsum()
、
我是新来熊猫
的
。我有一个赛马结果
的
数据集。* 100 df['HorseWinPercentage'] = df.groupby('Horse')['HorseWinPercentage2'].shift(+1) 然而,当我需要对多个轴进行
分组
时例如,我要为特定骑师骑特定驯马师
的
马群(‘Jockey’,‘Trainer’)创建一个获胜百分比。然后我需要知道每个单独
的
行(比赛)
的
百分比变化。])['JTWinPercen
浏览 16
提问于2019-09-25
得票数 1
1
回答
熊猫:根据当前索引
分组
列
、
我有一个熊猫数据框架,我想将其数据
分组
为
列
组。
列
的
名称总是"day_replicate“。因此,我正在尝试定义一个函数,该函数只将
列
分组
为几天。def group(a: pd.
DataFrame
): def get_day(
浏览 4
提问于2022-11-23
得票数 0
1
回答
Pandas
DataFrames:
提取
信息和折叠
列
、
、
我有一个
pandas
DataFrame
,它
包含
列
中
的
信息,我想将其
提取
到新
列
中
。最好从视觉上解释: df = pd.
DataFrame
({'Number Type 1':[1,2,np.nan], 'Number Type 2':[np.nan该表显示了
包含
Number Type 1和NumberType 2
列<
浏览 15
提问于2019-02-27
得票数 1
回答已采纳
1
回答
具有字典值
的
DataFrame
groupby
列
、
我有一个
包含
字典
列
的
dataframe
。我需要按字典值按
列
分组
。例如, { "values":{{} } ] df = pd.<em
浏览 2
提问于2021-02-08
得票数 0
回答已采纳
1
回答
如何使用数据帧在函数
中
编写sklearn.SimpleImputer?
、
、
、
、
most_frequent')df_titanic['age'] 我想把它写在一个函数
中
,np.array(simple_imputer_func(df_titanic['age'], SimpleImputer, 'most_frequent')) 有没有一种方法,我可以把它们写在一个函数
中
,然后给函数指定要选择
的
浏览 2
提问于2021-01-25
得票数 0
3
回答
在
Pandas
DataFrame
上迭代以
提取
数据
我有一个
DataFrame
,它在
列
中
包含
小时间隔,在行
中
包含
员工ID。我想迭代每一
列
(每小时间隔),并仅当该
列
包含
数字1 (1表示在该小时内可用,0表示不可用)时才将其
提取
到列表
中
。我已经尝试了iterrow()和iteritems(),但这两种方法都没有给出我想要从这个
DataFrame
中看到
的
东西这是一个新列表,名为 可用= 0800、0900、1
浏览 22
提问于2021-05-18
得票数 0
回答已采纳
3
回答
在不使用RDD
的
情况下,如何摆脱
中
的
行包装对象?
、
、
、
、
spark.sql("SELECT temperature FROM washingflat")我只对普通
的
(未包装
的
)整数值感兴趣。到目前为止,我对
dataframe
所做
的
尝试总是返回包装我感兴趣
的
值
的
Row对象。 有没有一种不使用RDD来获取标量内容
的
方法?
浏览 1
提问于2016-11-01
得票数 4
回答已采纳
1
回答
将火花数据转换为
Pandas
/R数据
的
要求
、
、
、
、
我在查Hadoop
的
故事。这种转换是如何工作
的
?集合()是否发生在转换之前? 另外,我需要在每个从节点上安装
Python
和R以使转换工作?我很难找到这方面的文件。
浏览 4
提问于2015-06-22
得票数 6
回答已采纳
2
回答
从熊猫
DataFrame
中
提取
一行时保存dtype
、
、
、
、
从一个
DataFrame
(例如使用.loc或.iloc)中
提取
单个
pandas
行
DataFrame
会产生
pandas
Series。但是,在处理
DataFrame
中
的
异构数据时(即
DataFrame
的
列
并不都是相同
的
dtype),这会导致行
中
不同
列
的
所有值被强制转换为
单个
dtype,因为S
浏览 2
提问于2020-06-29
得票数 0
1
回答
聚合空
DataFrame
时保留
列
、
、
我在
python
2.7.9
的
pandas
0.18.0
中
工作。获取一个示例
DataFrame
并按几列
分组
,然后对不同
的
列
求和以得到结果,如下所示:>>&
浏览 10
提问于2016-07-29
得票数 4
6
回答
如何在非唯一
列
中
按日期对
pandas
DataFrame
条目进行
分组
、
Pandas
DataFrame
包含
名为"date"
的
列
,该
列
包含
非唯一
的
datetime值。我可以使用以下命令对此帧
中
的
线条进行
分组
:但是,这将按datetime值拆分数据。我想按“日期”
列
中
存储
的
年份对这些数据进行
分组
。展示了如何
浏览 1
提问于2012-07-09
得票数 94
回答已采纳
2
回答
从
pandas
Dataframe
中
提取
在特定
列
中
具有特定值
的
所有行
、
、
我是
Python
/
Pandas
的
新手,正在努力从pd.
Dataframe
中
提取
正确
的
数据。我实际拥有的是一个
包含
3
列
的
Dataframe
:1 a TRUE3c TRUE5 k FALSE 我想要做<e
浏览 1
提问于2013-07-02
得票数 11
回答已采纳
2
回答
Pandas
将文本文件转换为CSV
、
、
我
的
文本文件
包含
5
列
,由不相等
的
空格分隔。当我将其转换为CSV文件时,所有这5
列
都在Excel文件
中
的
单个
列
中
。代码: import
pandas
as pd
dataframe
1 = pd.read_csv("C:\HARI_BKUP\
PYTHON
_SELF_Learning\Funct_Noise_Corners_2p0_A.txt&quo
浏览 24
提问于2021-04-27
得票数 2
回答已采纳
1
回答
在创建新
列
时自动替换索引
、
、
我目前正在按日期(DD/MM/YY)索引
的
Pandas
DataFrame
上做一些练习。目前
的
做法要求我按年
分组
,以获得平均年值。因此,我试图创建一个新
列
,其中只
包含
从
DataFrame
索引中
提取
的
年份。我写
的
代码是:data.groupby("year&quo
浏览 0
提问于2018-11-02
得票数 1
回答已采纳
1
回答
在
python
中将子类转换为维度
、
、
、
我在
python
和
pandas
库
中
查找了有关
python
中表
的
旋转,但还没有找到如何将行
中
的
子类
分组
到新维度
中
的
方法。例如,我有n
列
,具有长度、质量、体积、压力、时间等特征,行表示对象A1、A1、A2、A3、A4、A4。我想用
Python
语言创建具有维度
的
4D数组--特征、日期和“
单个
”对象(A1、A2、A3、A4)。因此,rows子类被重新<e
浏览 13
提问于2021-03-12
得票数 0
1
回答
减少复杂熊猫重索引任务
的
内存使用
、
我有一只大熊猫
的
数据(1300万行),其中
包含
了各种项目的数据,每一个项目都有不同月份
的
观测结果。项目因相应行数(即有观测数据
的
月份)而不同,月份可能是连续
的
,也可能不是连续
的
。:对于每个项,将该项
的
第一个观察行
的
填充观察转发到指定
的
最大日期。并且生成正确
的
输出,但是当我尝试在完整数据集上执行操作时(1300万行,通过重新索引扩展了大量数据),内存
的
使用就失去了控制(用20 of
的
浏览 2
提问于2013-11-01
得票数 3
1
回答
我有单元素数组。我如何将它们转换成元素本身?
、
、
、
使用records =
pandas
.read_json(path)将JSON文档导入到熊猫数据
中
,其中path是JSON文档
的
预定义路径,我发现生成
的
dataframe
“记录”
的
某些
列
的
内容并不像预期
的
那样只是字符串相反,这样
的
列
中
的
每个“单元”都是一个数组,
包含
一个元素--感兴趣
的
字符串。这使得使用布尔索引来选择
列<
浏览 3
提问于2014-03-26
得票数 1
回答已采纳
2
回答
按
单个
列
对多
列
进行
分组
--
Pandas
Dataframe
、
、
我试图将B、和C
列
的
平均值按
列
A
分组
。我不知道如何使用groupby函数来完成这个任务:pd.
DataFrame
({'B' : df.groupby(['A'])['B'].mean()}).reset_index()A
浏览 2
提问于2017-08-11
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(三):DataFrame
在Pandas中通过时间频率来汇总数据的三种常用方法
干货:手把手教你用Python读写CSV、JSON、Excel及解析HTML
10,二维dataframe——类excel操作
常用模块之Numpy与Pandas
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券