腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8743)
视频
沙龙
1
回答
Pandas
一次
缩放
多个
列
,
并
使用
groupby
()
进行
逆变换
、
、
、
、
B 554.0 395.0我可以
使用
以下代码行的MinMaxScaler对一个
列
执行此操作,但我希望对
多个
列
执行此操作 X_data.columns = list(X_data.columns.levels[1]) sca
浏览 5
提问于2019-10-30
得票数 1
1
回答
列
中的重复行- python/
pandas
、
、
、
、
我最近开始
使用
python和现在的
pandas
来读取excel文件。我有点纠结于一个问题,我没有找到任何类似的例子。 假设我有来自不同机器的不同分钟的数据。发生的情况是,一台机器有
多个
信息。import
pandas
df ?
浏览 14
提问于2021-11-03
得票数 0
2
回答
Pandas
agg应用具有
多个
参数的函数
、
、
、
如何将函数应用于需要来自
groupby
数据帧的
多个
列
的参数
并
返回两个
缩放
器值的
pandas
groupby
。 下面是可重复的示例。最后一行获取f_value import
pandas
as pdfrom statsmodels.formula.api import olsg
浏览 81
提问于2020-08-18
得票数 2
回答已采纳
2
回答
在Python
Pandas
中,如何
使用
like R dplyr mutate_each
、
、
、
在Python
Pandas
中,我想通过对
多个
列
执行
多个
聚合函数来添加
列
,比如R mutate_each。例如,Python
Pandas
能否实现与以下R脚本相同的处理?iris %>% mutate_each(funs(min, max, mean), starts_with("Sepal")) 然而,我能够实现与
使用
Pandas
的变异体相同的处理。如下面的代码所
浏览 3
提问于2017-10-18
得票数 5
2
回答
调查所得地块分组资料
、
、
我有一个有兴趣变量的数据(分类,这里是Yes,No等等)和一个分组变量(见下文):import numpy as np 'Response':np.random.choice(['Yes','No','Other', np.nan], 100)}) 由此,我想检索
并
绘制条形图中每组累积的
浏览 5
提问于2019-03-02
得票数 1
回答已采纳
1
回答
熊猫群和小数位数
、
我正在尝试
groupby
一个
pandas
DataFrame,并从一个
列
中计算分位数和聚合。下面是一个示例DataFrame:import numpy as np 'id', np.nan, 'v2'], }) 我
浏览 4
提问于2022-05-17
得票数 0
0
回答
使用
dask实现与基本
pandas
示例相同的单遍数据转换
、
、
我正在尝试理解如何帮助我在一个巨大的数据集上
进行
数据转换。我需要执行的任务如下面的
pandas
示例所示。import
pandas
as pd pdf = pd.DataFrame({'ID': ['A', 'B', 'C', 'D', 'A', 'B', 'B', 'B', 'C'],pdf['ANY1'] = pdf[v
浏览 0
提问于2016-07-07
得票数 1
1
回答
从
GroupBy
中选择框图的
列
、
我有一个数据集,我想按某个字段分组,然后绘制单个
列
的一个或
多个
箱图。我尝试
进行
一次
分组,然后依次选择每一
列
,但boxplot似乎无论如何都绘制所有
列
。下面是一个例子:import matplotlib.pyplot as plt animals = pd.DataFrame({'kind': ['cat',grouped = animals.
groupby
('
浏览 2
提问于2019-08-24
得票数 2
1
回答
Pyspark提高多
列
操作的性能
、
我已经写了一个在分组数据上执行标准
缩放
的类。#calculate stats here by doing a
groupby
and then do a join return reduce(lambda df_with_stats__tempNames__(), df_with_stats)[df.columns] 这个想法是将均值和方差保存在
列
中,
并
简单地对我想要
缩放
的
列
进行
减法/除法。所以基本上这是一个对一
列
的算术运算
浏览 21
提问于2020-10-02
得票数 0
回答已采纳
2
回答
从
Pandas
数据过滤数据
、
、
背景:我尝试
使用
csv文件中的数据来提出问题
并
根据数据得出结论。这些数据是来自巴西一家诊所的病人访问记录,包括额外的病人数据,以及病人是否是一个无迹象的人。pt_id, 'Ages' : ages, 在这里,我对数据
进行
了排序patientslen(num_uniq
浏览 0
提问于2018-06-27
得票数 2
2
回答
基于另一个dataframe的Python
Pandas
群
、
、
我想根据df1中
列
的子集对df2
进行
分组。我知道如何按df1中已经存在的
多个
列
进行
分组,比如df1.
groupby
(['col1', 'col2']),我知道如何
使用
相同的索引(如df1.
groupby
(df2['col1']) )对不同的系列
进行
分组有什么直接的方法来做像 >>> df1.
groupby
(df[['col1
浏览 2
提问于2021-11-29
得票数 2
回答已采纳
1
回答
部分数据的最小最大
缩放
率
、
、
20.85367 LGT FT 9.853674 LGT FT
浏览 17
提问于2020-10-05
得票数 2
回答已采纳
0
回答
Pandas
agg函数,具有对多
列
的操作
、
、
、
如果我们可以
使用
pandas
.core.
groupby
.DataFrameGroupBy.agg函数对多
列
进行
算术运算,我很感兴趣。例如:import
pandas
as pd df['C'] =[0, 0, 2, 2, 5] print(df.
groupby
('C').mean()[0] - d
浏览 3
提问于2017-12-09
得票数 0
1
回答
熊猫0.23群变不回期望值
、
、
对于以下数据中的每个Name,我都试图找到从一个Time到下一个Amount
列
的百分比变化:创建数据Code的代码:df['pct_change'] = df.
groupby
(['Name'])['Amount'].pct_change() 这似乎没有按名称
进行
分组,因为这与我没有
使用</e
浏览 1
提问于2018-06-28
得票数 14
回答已采纳
1
回答
熊猫群返回多索引和另外两个集合
、
如果按一个
列
分组,
并
使用
as_index=False,这种行为在熊猫身上是可以预料的。但是,当我
使用
.agg时,as_index似乎不再像预期的那样运行。简而言之,这似乎并不重要。# importsimport numpy as np np.random.seed(834) df['lett
浏览 2
提问于2020-10-11
得票数 0
回答已采纳
1
回答
如何在熊猫数据帧中添加或合并两行
、
、
、
我对熊猫很陌生,这是我的数据框架。AAPL 10 20.0 TECHAMZN 15 10.0 TECHop数据框架应按技术分组,按数量和权重之和,TECH 25 30.0
浏览 5
提问于2022-03-23
得票数 0
2
回答
熊猫按栏大小之和分组
、
、
、
我有
多个
巨大的tsv文件,我试图处理
使用
熊猫。我想按'col3‘和'col5’分组。我试过这个:df = pd.read_csv('filename.txt', sep = "\t")到目前为止,它运行良好,
并
输出如下输出: FG14 1 no nn1
浏览 4
提问于2015-03-26
得票数 3
回答已采纳
1
回答
Python很难在
GroupBy
之后变平
、
、
我有一个3
列
的数据,日期,时间和
使用
。时间间隔为15分钟(有些间隔可能/将丢失)。日期
列
列出了每月中的每天(可能有超过一个月)。 其目标是每月按小时对
使用
量
进行
汇总。我能够用
groupby
来完成这个任务,但是它创建了一个多索引系列。当我尝试在
groupby
的末尾添加"reset_index()“时,我会得到一个错误,因为我
使用
同一
列
两次(一个月
一次
,白天
一次
)。我有一种感觉,我需
浏览 0
提问于2021-06-09
得票数 0
回答已采纳
2
回答
使用
[
groupby
]时中间
列
的Python
Pandas
排序
、
我正在
使用
python
pandas
,
并
希望根据下表的中间
列
对输出
进行
排序(我已经显示了我正在获得的输出和我想要获得的输出)。我在
pandas
中
使用
groupby
函数来获得输出,但是它是按计数列排序的(参见下面的输出表),而我想要按YOB
列
排序(请参见所需的输出表)。 另外,我如何计算每个国家的平均出生年份?import
pandas
as pd xlpath= "C:/Users/U
浏览 20
提问于2019-10-14
得票数 0
回答已采纳
1
回答
使用
多
列
抛出ValueError遍历数据帧
、
、
、
、
我正在尝试申请一个
Pandas
数据帧内的循环,以便
一次
访问两
列
。我的这段代码可以很好地处理单个
列
。但是当应用于
多个
列
时,它会抛出:"ValueError :要解包的值太多(预期为2)“<code>A0</code> 小问题是列名太大且无法控制,因为此数据帧具有多标头
列
,因此在合并后我尝试基于
列
1和
列
2对
列
3执行
groupby
,如果<e
浏览 16
提问于2021-06-14
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas 2.0 vs Polars:速度的全面对比
在Pandas中通过时间频率来汇总数据的三种常用方法
Pandas与SQL的数据操作语句对照
利用Python Pandas库从DataFrame中提取最新日期
Pandas分组与聚合(一)
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券