腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
通过
使用
pandas
提取
和
分组
列
来
汇总
数据
帧
、
、
我想总结一个csv文件中的
列
。相当多地
提取
列
数据
,并将其与相关评级
和
计数相匹配。 另外,你知道我应该如何匹配预期的
数据
帧
和
网站图像吗?
浏览 17
提问于2019-01-22
得票数 0
4
回答
Pandas
-按一
列
分组
,按另一
列
排序,从第三
列
获取值
、
、
、
我想以
pandas
数据
帧
为例,按一
列
对其进行
分组
,按另一
列
对其进行排序,并从第三
列
中
提取
第一个元素并填充原始
数据
帧
。 这是我最初的df。我会按col_1
分组
,按col_2 (升序)排序,从col_3中取出第一个元素,然后用结果填充col_4。我可以
通过
group
和
transform
来
完成
分组
和
排序,但如何<em
浏览 120
提问于2019-06-01
得票数 2
回答已采纳
1
回答
如何
使用
dplyr
汇总
分组
数据
中的级数(n级)?
、
在
分组
之后,我想
使用
dplyr中的
汇总
函数来
提取
数据
帧
中每个变量的层数。以下是
数据
帧
的副本: x=c("A","A","A","A","A","B","B","B","B","C","C","C","D&q
浏览 5
提问于2017-12-22
得票数 1
1
回答
不带group by的两列计数频率
、
我有一个包含3
列
的
数据
集: Category、Country
和
Count (它总是1-实际上是非常无用的)。我想要实现的是类似于这里的黄色
列
:我可以用python做一个简单的group by,但这不是我想要的,因为我想保留
数据
的各个行,不同于下面的图像(对它们进行
分组
):我只想得到基于两
列
的频率,而不是
分组
,你有什么想法吗?我想过
使用
for循环进行迭代,但我做不到,因为我是python的初学者,所以我非常感谢您
浏览 7
提问于2019-11-20
得票数 0
回答已采纳
1
回答
在回归中
使用
group by在python中定义x
和
y值
、
、
是否可以将
数据
分组
(用于定义x
和
y变量),以便直接在regPlot (或任何其他海运功能)中运行回归?我找不到这样的内置功能。例如,在一
列
中,我有一个分类变量" C ",然后我试图
使用
每个C类别的中位数来拟合回归线(具有x
和
y)。有什么功能可以这样做吗?
浏览 18
提问于2019-02-26
得票数 1
回答已采纳
1
回答
基于切片
和
选择的熊猫索引
、
、
、
、
问:假设您有一个具有m
列
的
pandas
数据
帧
(df.shape == (nxm))。我想
通过
切片
和
选择
列
来
提取
列
的子集,如下所示:df1 = df.iloc[:,[a,b,c:d]]。这个是可能的吗?在这个例子中,结果应该在df1中实例化一个
数据
帧
,其中包含
数据
帧
df的
列
a、b
和
c到d。
浏览 15
提问于2021-09-13
得票数 0
回答已采纳
1
回答
使用
pull -R时删除输出中的级别属性
、
我正在
使用
dplyr查找一
列
中的最大观测值。我
通过
管道传输
数据
帧
,按感兴趣的
列
分组
,
使用
n()
汇总
以找到每个组的观测值,从组中筛选出最大观测值,然后
提取
列
值。这将返回我正在查找的值,并列出该
列
中的所有级别。它看起来像这样:# Levels: level values... 我怎么才能让它只返回我想要的值而不是级别呢?
浏览 17
提问于2020-05-18
得票数 1
回答已采纳
1
回答
动态
汇总
和重命名PySpark中的聚合
列
、
、
、
、
我有一个PySpark
数据
帧
(Df),其中包含50+
列
,其中包含一些动态
列
,这些
列
可能存在也可能不存在,但它们存在于一个单独的列表(Reqd_col)中。我想对列表(Reqd_col)中存在的PySpark data frame(df)中的那些
列
进行
汇总
(按固定
列
‘region’
分组
)
和
汇总
总和或计数,
汇总
列
的名称应与
列
的原始名称相同,而不是Py
浏览 24
提问于2021-09-08
得票数 0
1
回答
如何将timestamp
列
分组
为每小时,并聚合
pandas
数据
帧
中的行
、
我有一个包含每分钟
数据
的
数据
帧
,它还包含一个date
列
,用于以时间戳格式跟踪日期。from datetime import datetime import numpy
浏览 7
提问于2019-08-14
得票数 1
回答已采纳
1
回答
从oracle
提取
数据
到python
pandas
dataframe的速度非常慢。
、
、
我正在尝试
使用
cx_Oracle模块从Oracle
数据
库中
提取
数据
并将其放入
Pandas
数据
帧
中。
使用
fetchall()函数时,如下所示cursor.arraysize = 1000rows = results.fetchall()
提取
速度与
使用
R O
浏览 3
提问于2016-07-06
得票数 3
1
回答
来自变量的r组
数据
帧
、
、
我希望设置将
数据
帧
分组
为变量的
列
,然后根据该
列
对
数据
框架进行
分组
和
汇总
,即var <- colnames(mtcars)[10]这样,我就可以简单地更改var并
使用
第二行而无需更改任何内容。
浏览 6
提问于2016-09-09
得票数 0
回答已采纳
2
回答
如何为
分组
中的每一
列
创建多个
汇总
统计信息?
、
、
使用
groupby().agg()可以计算指定
列
的
汇总
统计信息。但是,如果我想为每组
数据
帧
的每一
列
计算“min”、“max”
和
“mean”,该怎么办?有没有办法让
pandas
自动为每个列名附加一个前缀?我不想枚举agg()函数中的每个基本列名。
浏览 8
提问于2021-07-20
得票数 0
1
回答
获取
数据
框中位数的最佳方法是什么
、
、
、
我有一个Python
数据
框,其中有两
列
: Type
和
Value。我需要所有时间的中位数,缓存未命中,tx-start,...,上下文切换所有
数据
类型都是Object,如何获取时间为浮点型,其余为整型? 1:
浏览 2
提问于2020-07-27
得票数 0
1
回答
按sklearn.model_selection.GroupShuffleSplit
分组
数据
、
、
、
我在CSV中有一个
数据
集,标题为我希望
通过
对product_type或任何其他
列
中的
数据
进行
分组
来
创建测试
和
训练
数据
集。还要确保相同的
数据
在测试
和</
浏览 1
提问于2018-01-18
得票数 0
1
回答
按日期绘制
分组
数据
、
我正在尝试绘制一些
pandas
数据
帧
列
的计数,按日期
分组
:
数据
是正确的,但是我指定的data.index.day不适合绘图:有没有一种方法可以指定我想按Python Date对象
分组
,或者我这样做是完全错误的?我应该单独
提取
它们吗?
浏览 1
提问于2013-05-03
得票数 2
回答已采纳
1
回答
groupby后的
列
总数百分比
、
尝试
汇总
pandas
数据
帧
,并根据原始df的groupby结果计算"percent of total“
列
。Wetland Hardwoods4 778952.154436 Dikes and LeveesMixed Wetland Hardwoods 610332.066649 我想为
浏览 15
提问于2019-07-19
得票数 0
回答已采纳
1
回答
为什么股票代码
和
日期不同?
、
、
这是我
使用
Python的早期尝试。我正在从雅虎获得股票
数据
,但我可以看到股票代码,日期
列
标题低于高,低,开盘收盘价。import numpy as npimport
pandas
_datareader as pdr py.init_notebook_mode
浏览 3
提问于2020-04-08
得票数 2
2
回答
Pandas
将一个
列
与多个
列
关联按
列
的范围
分组
、
、
、
假设我有一个类似于下面的
数据
帧
(实际
数据
帧
有数百万个观测值),我如何获得信号
列
和
返回
列
列表之间的相关性,然后按Signal_Up
列
进行
分组
?我尝试了
pandas
corrwith函数,但它没有给出signal_up
列
的相关
分组
df[['Net_return_at_t_plus1', 'Net_return_at_t_plus5','
浏览 46
提问于2020-03-20
得票数 0
回答已采纳
2
回答
Pandas
groupby抛出: TypeError:不可散
列
类型:'numpy.ndarray‘
、
、
、
我有一个
数据
帧
,如图所示: --------------------------------------------------------------------------- TypeError/_libs/properties.pyx in
pandas
._libs.hashtable.Py
浏览 30
提问于2019-07-06
得票数 2
回答已采纳
1
回答
group_by()
和
summarise()错误
、
、
我想
通过
函数group_by()
和
friend_count ()制作一个
数据
帧
,其中包含来自另一个
数据
帧
'pf‘的
汇总
变量的平均值
和
中位数。但是当我尝试这个命令时,结果如下所示,显示了整个friend_count
列
的平均值
和
中位数,而不是按年龄
分组
。 请帮帮我!
浏览 4
提问于2018-07-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在Pandas中通过时间频率来汇总数据的三种常用方法
如何只用一行代码让 Pandas 加速四倍?
Python使用pandas使数据可视化笔记
如何只用一行代码让Pandas加速四倍?
pandas系列学习(五):数据连接
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券