腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
scala
DataFrame
中
查找
单行
中
不同
列
的
最大值
、
、
、
我试图找出
scala
dataframe
中
单行
中
不同
列
的
最大值
。
dataframe
中
可用
的
数据如下所示。VALUE":9.7825}]|[{"TIME":1569560531009,"VALUE":1.7825}]|[{"TIME":1569560531010,"VALUE":3.7825}
浏览 38
提问于2019-10-16
得票数 0
2
回答
Spark DataFrames
中
的
argmax :如何检索具有
最大值
的
行
、
给定一个Spark
DataFrame
df,我想在某个数值
列
'values'中找到
最大值
,并获得达到该值
的
行。我当然可以这样做:# since I hope I get this done with
DataFrame
pandas.Series/
DataFrame
和numpy.array
的
argmax/id
浏览 0
提问于2016-08-07
得票数 15
回答已采纳
2
回答
使用
单行
命令
查找
dataframe
中
列
中所有值
的
基数。
、
、
如何使用
单行
命令来
查找
数据帧
中
列
中所有值
的
基数?只使用熊猫。我有一
列
由
不同
字符串组成
的
数据,我希望计算该
列
中
每个值出现
的
次数。示例 df = pd.
DataFrame
({'Animal':['cat', 'dog', 'bird', 'dog', 'bird',
浏览 3
提问于2022-09-22
得票数 0
1
回答
基于
dataframe
列
的
Elasticsearch和Spark动态索引创建
、
、
、
名称可以
在
单个数据name
中
具有
不同
的
值。当我使用spark (
scala
)将数据写入elasticsearch时,我希望根据
列
"name“
的
值将数据写入
不同
的
索引。
dataframe
.saveToEs("index-name")
dataframe
.saveToEs(col("&quo
浏览 8
提问于2020-01-11
得票数 1
回答已采纳
2
回答
如何添加
最大值
的
新
列
?
、
、
我有一个包含2
列
tag和value
的
数据帧。我试着像下面这样做,但是它不起作用。val df2 = df.withColumn("max",max($"value")) 如何将max
列
添加到数据集中?
浏览 37
提问于2018-05-31
得票数 2
回答已采纳
3
回答
Python
Dataframe
根据其中一
列
中
的
最大值
选择行
、
我有一个python格式
的
dataframe
(多行,2
列
)。我想根据
列
2
中
的
最大值
,用
列
1
中
的
唯一值修改DF (如果有帮助,
列
2将按升序排序)。我可能会写一个循环,但我更喜欢
单行
或两行
的
解决方案。14200 10200 30400 0 400
浏览 1
提问于2017-03-28
得票数 5
1
回答
如何使用
Scala
查找
DataFrame
中
存在
的
空数总数
、
、
我正在寻找
Scala
中
的
一个命令,以
在
DataFrame
中
的
所有
列
中
查找
空值之和。你能告诉我同样
的
scala
命令吗?
浏览 4
提问于2022-10-22
得票数 0
2
回答
熊猫:对于包含多个整数和字符串列
的
数据框架,是否有一种方法可以指定max()函数所查看
的
列
?
、
Dataframe
: 当我按CountryA和Country B分组并使用max()时,它会在给我
的
年份
列
中
查找
最大值
:maxMonth =countryUnits.groupby(['CountryA','CountryB']).max()当前输出
的
7行图像我需要做什么才能让它在Unit
浏览 3
提问于2021-07-31
得票数 1
回答已采纳
1
回答
在
单个
Dataframe
中
对
不同
列
的
多个操作
、
、
、
、
在
单个
Dataframe
中
对
不同
列
的
多个操作PNO VAL1 VAL2 VAL3 VAL4 CNT30000 24 96 52 25 1 我想要创建一个结果
dataframe
,它将对
不同
的
<e
浏览 0
提问于2018-09-07
得票数 0
回答已采纳
1
回答
R:创建
列
,显示到/自达到另一
列
的
最大值
以来
的
天数?
、
、
我有一个具有重复度量
的
数据集:嵌套在参与者
中
的
度量(ID)嵌套在组
中
。
在
组水平上测量一个变量G(范围为0-100) .我想创建一个新
列
,显示: G
的
最大值
在编码为0
的
组
中
达到
最大值
的
第一天。每次测量(
在
同一组
中
)
在
达到
最大值
的
日期之前或之后发生了多少天。例如:
在
最
浏览 2
提问于2020-06-22
得票数 0
2
回答
在
指定
的
列
数
中
,
查找
每行
中
前3个
最大值
的
列
、
我希望
在
我
的
DataFrame
中找到每一行
的
3个
最大值
,但只从某些
列
中
查找
(即我
的
DataFrame
中
总共有10
列
,但我希望它在计算
最大值
时只考虑6
列
)。当找到3个最大
的
时, 我想在现有的
DataFrame
中
创建三个新
列
,名为“Top 1”、“Top 2”和“Top 3”。我
浏览 0
提问于2021-05-25
得票数 0
4
回答
使用Java创建一个简单
的
1行星火
DataFrame
、
、
在
Scala
中
,我可以从内存
中
的
字符串创建一个
单行
DataFrame
,如下所示:val df = sqlContext.sparkContext.parallelizejsonValues).toDF("fizz")当df.show()运行时,它会输出:| fizz|| buzz|--现在我
浏览 0
提问于2016-10-10
得票数 9
回答已采纳
4
回答
如何使用collect作为key,col作为value,以map
的
形式收集spark数据帧
我正在寻找一种整洁
的
方法来找到每一
列
的
最大值
,并收集
在
地图中作为{col name:max value of col}。下面是我
在
一个玩具示例中所取得
的
进展。
在
我
的
完整数据中有数百
列
,所以手动转换每一
列
是不可行
的
。
scala
> import spark.implicits._
scala
&
浏览 49
提问于2020-06-12
得票数 0
回答已采纳
1
回答
如何获取
单行
中
多
列
的
最大值
?
、
、
尝试
在
单行
中
获取月数列
的
最大值
最好用laravel做
浏览 8
提问于2019-11-03
得票数 1
回答已采纳
1
回答
自动
查找
非NaN值及其对应
的
索引点
、
、
根据与正当值(而不是NaNs)相对应
的
索引号,自动
查找
不同
点处
的
值,因为根据我对初始数据设置
的
函数,整个数据中将有许多NaNs。我有一个图形(名为‘
DataFrame
’),我挑选了整个(743个初始行)
中
相对最小/
最大值
的
特定点,并能够将这些最小/
最大值
的
索引点放入数组
中
,并将它们添加到‘
DataFrame
’数据帧('closemin
浏览 0
提问于2019-03-11
得票数 2
7
回答
如何在spark
的
数据
中
“负选择”
列
、
、
、
这个df有"A“、"B”和"C“
列
。现在假设我有一个Array,它包含这个df
列
的
名称:我想以这样
的
方式来做一个df.select(),这样我就可以指定哪些
列
不能选择。例如:假设我不想选择
列
"B“。我试过了但这不起作用,因
浏览 21
提问于2015-07-15
得票数 22
回答已采纳
2
回答
基于值动态调用数据帧函数
、
我有一个场景,我需要根据值从
dataframe
进行动态函数调用。
scala
> var feature="\"max\""
scala
> val someDF = Seq( |(64, "mouse"), | ).toDF("number",
浏览 17
提问于2020-12-02
得票数 0
回答已采纳
3
回答
Apache火花中describe()和summary()
的
区别
看来他们俩
的
目的是一样
的
。我没有找到任何
不同
之处(如果有的话)。
浏览 0
提问于2019-06-03
得票数 2
回答已采纳
1
回答
IndexError:升级后布尔数组不再匹配
、
、
我让代码
在
for循环中运行。对于循环
的
每次迭代,我找到
DataFrame
中
该行
的
最大值
,然后创建一个
列
索引列表,该值出现在该列表
中
(因为它有时可能出现多次),最后获取该列表
的
max(),以给出包含
最大值
的
行
的
最高
列
索引。之后(我想这就是原因),我
的
"peaklist“创建现在失败了,IndexError显示”布尔索引
在
浏览 17
提问于2021-04-19
得票数 0
回答已采纳
4
回答
如何在
单行
数据
中
获取与n个
最大值
对应
的
列
?
、
、
、
我有这样
的
数据0 2 4 3 1 6 50 6 5 4 我如何才能实现这个最有效
的
(w.r.t. )内存
的
使用,执行时间和与dask并行
的
能力)?性能@stark (
dataframe
with 500
浏览 3
提问于2019-11-25
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券