腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Pandas
,
将自
定义
函数
应用于
按
字符串
索引
分组
的
数据
python
、
pandas
、
apply
我有想要按城市和日期
分组
的
数据
(单独
的
列),并使用其余列计算新值。更具体地说,其他列是
按
种族统计
的
6场比赛的人数。因此,我有8列,两个
分组
的
列和6个我想要总结
的
列。我想通过计算每个城市日
的
熵来总结它们。 但是,城市和日期是
字符串
,我
的
熵
函数
不喜欢这样。当
分组
列为int64时,它会起作用。我尝试将city和day列转换为虚拟变量,但错误仍然存在。借
浏览 4
提问于2019-05-08
得票数 1
回答已采纳
2
回答
是否有R
函数
/方法可让您
将自
定义
函数
应用于
分组
数据
框
的
每组?
r
、
group-by
、
apply
在R中,我尝试
将自
定义
函数
应用于
数据
帧
的
每个单独
的
组(
按
特定列
分组
)
函数
本身被设计为接收整个
数据
帧
的
子集(一组)并返回修改后
的
数据
帧。理想情况下,我希望最终输出是具有相同组合组
的
单个
数据
帧,但在绑定回整个
数据
帧之前,每个组都由
函数
修改。employ.data <- da
浏览 1
提问于2019-12-13
得票数 0
4
回答
熊猫:
按
自
定义
功能
分组
数据
python
、
pandas
、
dataframe
、
pandas-groupby
我有一组
字符串
。我想
按
字符串
的
长度
分组
。这件事可以用5 ff0 aaa(length:
浏览 12
提问于2020-05-18
得票数 1
2
回答
函数
在熊猫
数据
群第二列中
的
应用
python
、
pandas
、
dataframe
在熊猫
的
数据
中,一个
函数
可以用来对它
的
索引
进行
分组
。我希望
定义
一个
应用于
列
的
函数
。我希望
按
两列
分组
,但我需要将第二列
按
任意
函数
foo
分组
如何将foo
定义
为将第二
浏览 4
提问于2016-10-25
得票数 8
回答已采纳
1
回答
如果我有多个group by字段,如何从Dask DataFrameGroupBy中获取所有组?
python
、
dataframe
、
dask
如何从
分组
数据
框中获取Dask中
的
所有唯一组?假设我们有以下代码:我必须遍历所有组并处理组内
的
数据
。我
的
想法是获得所有唯一
的
值组合,然后遍历集合并调用。对于他们中
的
每一个人。这不会很快,但希望能起作用..在Spark/Scal
浏览 3
提问于2018-02-20
得票数 4
1
回答
包
的
帮助
索引
页可自
定义
吗?
r
、
roxygen2
help()
函数
允许我们看到一个包含包中所有
函数
的
索引
:如果包非常大,帮助页
将自
动
按
字母顺序细分,并按首字母链接到每个部分(如stats)。较小
的
包将所有功能
按
字母顺序排列在一起。我正在使用roxygen2,并且希望能够根据它们
的
@family对
函数
进行
分组
。
浏览 1
提问于2021-02-22
得票数 2
回答已采纳
1
回答
将
函数
应用于
Dask中
的
分组
数据
帧:如何在
函数
中指定
分组
Dataframe作为参数?
python
、
pandas
、
dask
我有一个
按
索引
(first_name)
分组
的
first_name。) return [i for i, x in enumerate(matches) if x] 对于测试entities
数据
框架,可以像往常一样应用该
函数
注意,DF
函数
中
的<
浏览 0
提问于2018-03-19
得票数 21
回答已采纳
1
回答
使用PySpark并行化自
定义
函数
python
、
pyspark
我熟悉使用UDF
将自
定义
函数
逐行
应用于
DataFrame。但是,我想知道如何
将自
定义
函数
并行
应用于
我
的
DataFrame
的
不同子集。下面是一个简化
的
例子:import
pandas
as pd dummy_data = pd.DataFrame({'id':np.random.choice(['a',
浏览 1
提问于2018-07-20
得票数 2
2
回答
以
数据
帧
的
形式返回聚合值
python
、
pandas
我有一个
按
两列
分组
的
pandas
DataFrame和一个自
定义
函数
,该
函数
从每个
分组
的
行集计算值
的
元组。我正在尝试收集
数据
帧中
的
结果,并使用原始
的
组
索引
进行
索引
。当我使用apply()时,我得到了一个带有正确
索引
的
Series,但是值是以元组
的
形式出现
的
。
浏览 1
提问于2017-02-27
得票数 0
回答已采纳
1
回答
如何将具有多个参数
的
自
定义
函数
应用于
每组
数据
帧,并在Scala Spark中合并生成
的
数据
帧?
scala
、
dataframe
、
apache-spark
、
group-by
、
user-defined-functions
我有一个自
定义
函数
,如下所示,它返回不同
的
数据
帧作为输出 def customizedfun(data : DataFrame, param1 : Boolean, param2 : string)我想把这个
函数
应用到每一组 df.groupBy("type") 然后将来自每个type
的
输出
数据
帧附加到一个
数据
帧中。这与
将自
定义
函数
应用于
分组
<
浏览 21
提问于2021-04-12
得票数 1
回答已采纳
3
回答
Pandas
: df.groupby()对于大
数据
集来说太慢了。有什么替代方法吗?
python
、
pandas
、
grouping
、
bigdata
我有一个有380万行和一列
的
pandas
.DataFrame,我尝试
按
索引
对它们进行
分组
。df = df.groupby(df.index).sum()<class '
pandas
.core.frame.DataFrame&
浏览 1
提问于2017-06-23
得票数 15
1
回答
如何利用熊猫从群中选择一组
数据
python
、
pandas
、
group-by
我有一个具有多级
索引
(公司,年份)
的
数据
,
按
平均值
分组
,如下所示:ABC 2018 3000LOL 2018 1200我想选择属于"LOL“
的
数据
,我想要
的
结果是: company year mean salary我尝试在dataframe上使用.filter<e
浏览 1
提问于2020-04-07
得票数 1
回答已采纳
2
回答
熊猫
数据
组不移除
分组
密钥
python
、
pandas
、
group-by
、
pandas-groupby
根据这个例子,我首先创建一个
数据
框架:现在,让我们
按
标有"A“
的
列
分组
,并根据其值将其他两列相加:这样做是合理
的
,
按
"A“
分组
并产生:A a
浏览 0
提问于2018-01-17
得票数 1
回答已采纳
1
回答
如何将返回
pandas
数据
帧
的
函数
应用于
一系列输入,以便返回单个
数据
帧?
python
、
pandas
、
stock
、
alpha-vantage
我在Python语言中使用
Pandas
,它返回一个alpha_vantage
数据
框表。 我已经编写了一个
函数
,如下所示,它接受一个股票名称,重置
数据
帧
的
索引
并将其重命名。如何将此
函数
应用于
几个输入,以便为它们返回单独
的
数据
帧?目前,我必须手动完成此操作,并为每个输入单独运行该
函数
。 如果我用股票列表创建一个
pandas
序列,并将
函数
应用于
该序列,
浏览 18
提问于2021-02-07
得票数 0
回答已采纳
1
回答
如何
按
平均群集值按排序顺序枚举群集?
pandas
、
scikit-learn
我已经创建了一个用于集群
的
函数
,该
函数
应用于
各种
数据
格式和列。我希望有一个一致
的
集群排序,
按
平均值排序。例如,以下集群
的
排序是可以
的
:1: 2.0对于下面的集群是不合适
的
:1: 1.6它应该是1: 1.6将所选列
分组
为群集
的
函数
如下robust_scale def g
浏览 6
提问于2022-02-19
得票数 0
1
回答
为什么股票代码和日期不同?
python
、
pandas
、
date
这是我使用Python
的
早期尝试。我正在从雅虎获得股票
数据
,但我可以看到股票代码,日期列标题低于高,低,开盘收盘价。import numpy as npimport
pandas
_datareader as pdr py.init_notebook_mode
浏览 3
提问于2020-04-08
得票数 2
6
回答
如何在非唯一列中
按
日期对
pandas
DataFrame条目进行
分组
python
、
pandas
Pandas
DataFrame包含名为"date"
的
列,该列包含非唯一
的
datetime值。我可以使用以下命令对此帧中
的
线条进行
分组
:但是,这将
按
datetime值拆分
数据
。我想
按
“日期”列中存储
的
年份对这些
数据
进行
分组
。展示了如何在将时间戳用作
索引
的
情况下
按
浏览 1
提问于2012-07-09
得票数 94
回答已采纳
2
回答
计算
数据
帧序列
分组
中
的
唯一百分比变化
python
、
pandas
、
dataframe
我正在尝试计算一个百分比变化版本,其中公式是(b-a)/(b+a) (如果a和b都是0,那么它应该返回0)import randomgroup = [random.choice(['a', 'b', 'c',
浏览 33
提问于2019-10-31
得票数 1
2
回答
在Python中转换
pandas
数据
帧
python
、
python-3.x
、
pandas
我需要
将自
定义
转换
应用于
数据
帧,如下所示: import
pandas
as pd 'value': ['a'], 'measure': ['b', 'c'], 'value': ['a
浏览 26
提问于2020-07-17
得票数 2
回答已采纳
2
回答
如何利用dask高效并行化时间序列预测?
python
、
parallel-processing
、
time-series
、
forecasting
、
dask
我正在尝试使用dask并行处理python中
的
时间序列预测。
数据
的
格式是,每个时间序列都是一列,它们有一个月日期
的
共同
索引
。我有一个自
定义
预测
函数
,它返回带有拟合值和预测值
的
时间序列对象。我想要将这个
函数
应用于
dataframe
的
所有列(所有时间序列),并返回一个新
的
dataframe,并将所有这些序列上传到DB。(lambda df: df.apply(forecast_func
浏览 0
提问于2018-03-21
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas分组与聚合(一)
pandas系列学习(三):DataFrame
使用Pandas&NumPy进行数据清洗的6大常用方法
Python数据分析之pandas(六)
pandas指南:做更高效的数据科学家
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券