腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
PYSPARK
中
的
Pivot
和
Cumcount
、
、
、
、
我有这个
pyspark
数据帧: Borough, Neighborhood, Count, Row_NumberB, MID, 10, 2BR,Neighborhood_2, Count_2, Neighborhood_3, Count_3BR, EV, 1, WB, 4, MID, 5 这是我能想到
的
:df.groupBy('Borough').
pivot
('Neighborhood')
浏览 17
提问于2020-04-27
得票数 0
1
回答
在Python熊猫上传播数据?
、
、
我正在尝试重新格式化/扩展我
的
数据从键,值列到宽格式:'id': [0,1,2,3,4,5,6,7],'value': ['zzuz', 44, 'DE', 55,
浏览 4
提问于2021-08-21
得票数 0
回答已采纳
1
回答
Python按数据分组,从列到新数据帧
中
的
行。
、
、
你好,伟大
的
Python程序员,你能帮我解决这个问题吗?我正在尝试从Items列
中
获取数据,将它们放在单独
的
列
中
,以便执行关联规则,目的应该是获得一个新
的
数据框架,其列是客户在同一天共同购买
的
项目。数据现在看起来像: 非常感谢!我希望收到你
的
评论
浏览 2
提问于2022-02-16
得票数 0
1
回答
如何将熊猫
的
聚合列表分割成多个列
、
、
、
、
我想为这个熊猫
的
每一行创建“名称”列表
中
每一项
的
单独列。'name‘列表有1-10个条目,我只希望列
的
标题是"1“、"2”、"3“等等。这是我
的
原始数据 这是我想要
的
数据:
浏览 3
提问于2022-04-20
得票数 1
回答已采纳
2
回答
基于组中值数
的
枢轴数据库,而不是完整
的
枢轴。
、
、
在下面的示例
中
,
pivot
将位于id列上,而value是value列。但是,我想要(3)通用id列,因为每种类型通常只有1-3个id,而不是普通
的
枢轴(每个id都是它们自己
的
列)(在我
的
真实数据集中有几千个)。 我试着在熊猫中使用枢轴
和
枢轴表函数。有没有更直截了当
的
解决方案?是否有一个术语来形容我想要达到
的
目标?
浏览 0
提问于2019-05-20
得票数 1
回答已采纳
1
回答
表,具有不同
的
列长度。
、
现在,我需要用特定
的
固定列数创建这样
的
表。我
的
代码应该有下一个逻辑: 第一个解决方案是创建另一个列表并将值放入列表
中
。最后,我可以规范列表
的
长度(例如,使用一些值,比如NaN),并从这些列表
中
浏览 0
提问于2014-07-10
得票数 0
回答已采纳
2
回答
Python :具有重复值
的
多个列
的
Pandas数据透视表
、
、
、
、
有一个包含列名、学校
和
标记
的
pandas dataframme name school marks tom HBS 55mark HBS 28lewis HBS 88 如何转置
和
转换成这样 name school marks_1 marksmarks_3 mark HBS 28 19 lew
浏览 119
提问于2021-11-23
得票数 2
回答已采纳
1
回答
如何根据重复
的
值创建数据
、
、
、
我有一个DataFrame,类似这样
的
东西:7 2 19 3 511 3 713 4 615 4 8现在,我想在重复值"a“
和
"b”
的
基础上创建一个新<e
浏览 5
提问于2022-07-22
得票数 1
1
回答
在df.
pivot
Python
中
自定义列名
、
、
我想按下面的方式来分析一个dataframe df,其中Id作为索引,Value作为值,以及自定义
的
[x0, x1, x2]列。,'x2'], values = 'Value') 6665 from pandas.core.reshape.
pivot
import
浏览 3
提问于2021-11-17
得票数 2
回答已采纳
1
回答
如何从一个dataframe
中
的
列中提取特定值,并将其附加到另一个dataframe
中
的
列?
、
、
df1
和
df2。column2':[1,2,3,4,5] df2 = ['columnA', 'columnB', 'columnC'] (empty except for these column names) 我想从df1
中
的
column1
中
获取等于'a‘
的
所有值,并将它们放入df2
的
'columnA’
中
。然后对“b”执行相同
的
操作,并将它们放入“colum
浏览 59
提问于2020-08-27
得票数 0
回答已采纳
2
回答
内插DataFrame列并根据
PySpark
或Pandas
中
的
另一列进行排序
、
、
、
、
给定下面的DataFrame,我们需要从示例
中
插入my_column值,并将它们作为单独
的
列使用,然后按照属于每个some_id列
的
int_column值按降序排序。|null |如您所见,对于id_1,int_column
中
的
最低数在DataFrame
的
末尾是1,它属于some_id列
中
的
xx4,下一个值是3、4<e
浏览 1
提问于2018-04-27
得票数 2
回答已采纳
1
回答
火花矩阵变换
、
、
、
、
让我们假设在
PySpark
中有以下数据:customer1 | product1 | 0.2343customer2 | product3 | 0.3123可以有几个客户产品组合,但每一个组合都是独特
的
。我想以最有效
的
方式存档以下结果:cu
浏览 0
提问于2019-09-16
得票数 1
回答已采纳
1
回答
Pandas:不确定这是一个轴心还是堆栈,或者是否有一个内置
的
函数
、
、
我有一个包含两列
的
dataframe,并尝试对它们进行透视: arr = pd.DataFrame([[0,0],[0,1],[0,2],[1,4],[1,5],[1,6]]) arr.
pivot
(columns=0) 这并没有给出我想要
的
输出,它是列2
的
值列表,对应于列1
中
的
每个唯一值,如下所示: output = pd.DataFrame([[0,1,2,3],[1,4,5,6]]) 我相信熊猫对此有一个功能
浏览 12
提问于2021-07-25
得票数 1
回答已采纳
1
回答
按数据帧
中
的
列分组绘制直线图
、
、
、
、
我有一个csv文件,其中包含数据,我将这些信息按月份分组,然后使用累计值来计算这个月
的
运行总数。sort_remaining=True).sort_values('months')在EXCEL
中
输出示例,但是我
的
DF看起来与1000行相同:现在,我想绘制一个图表,对月份进行分组,并绘制每个值,因此,基本上,我将绘制12行图表,显示值如何随着时间
浏览 1
提问于2018-04-20
得票数 1
回答已采纳
1
回答
将具有相同ID
的
行拆分为不同
的
列python
、
我希望有一个具有相同id号
的
重复值
的
数据帧。但是我想把重复
的
行分成列。16690019,4.0],[16510069 3.7]]print(df) 结果数据帧将具有n_k ( id行
的
n重复
的
id得到一个单独
的
列,当它没有重复
的
id时,它在新
的
列
中
得到0。
浏览 7
提问于2019-04-17
得票数 3
1
回答
如何将分类列值转换为不同
的
列名?
、
、
、
我不知道如何处理这个问题,因为我是熊猫
的
初学者。a 3 4 b 56 c 78 c 9 我想把它变成一个数据帧或者像这样
的
矩阵: cola colb colc1 2 5 8 2 3 6 9 我应该如何在Python
中
实现这一点?
浏览 28
提问于2020-12-12
得票数 1
回答已采纳
1
回答
如何合并同一数据帧
中
的
两行
、
我有一个包含两行
的
数据框。这两行
的
"ID“列
中
的
值是相同
的
。如何创建新
的
数据框并将两行
中
的
所有值放入一行,但放在单独
的
列
中
?例如,如果在输入数据框
中
,两行都有一个名为"Amount“
的
列,则新数据框应包含一行,其中包含两个不同
的
列: Amount_1
和
Amount_2。groupby不起作用,因为我不希望所有信息都在同一列<e
浏览 13
提问于2019-05-03
得票数 0
1
回答
我怎样才能按不同
的
层次聚合,然后在内部加入火种呢?
、
、
我是新来
的
火花,我有一个数据处理数据。我想根据人
的
身份,但根据不同
的
属性,例如商店类型,
和
教育水平分组。%%sparkfrom functools import reduce df = spark.sql("SELECT * FROM
浏览 3
提问于2021-12-08
得票数 0
回答已采纳
1
回答
PySpark
中
的
群累积计数
、
在潘达斯,我可以这样做:count_num = count_id.replace(0, '').astype(str)df['id'] += count_num 1 | joe | 2 | jane |--------------
浏览 0
提问于2019-04-10
得票数 0
回答已采纳
1
回答
我在理解如何正确地旋转带有熊猫
的
数据帧时遇到了问题。
、
、
、
15:33:21.812381 1 E F G 有没有什么方法可以使用pd.
pivot
浏览 21
提问于2019-01-31
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券