腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
将不
等于
的
Spark
数据
帧
与
比较
列
的
列表
进行
比较
、
、
我目前正在尝试
比较
两个
数据
帧
,看看在pyspark中字段是如何不匹配
的
。我已经能够手动编写它,但我希望能够传递一个字段
列表
,以确保
帧
在字段上不匹配。
数据
帧
是相同
的
。= temp_team_sat_incremental.team_sat_hash)) 但是现在我需要能够获取我
的
列表
(hash_field),并且能够确保一个或多个字段彼此不相等。
浏览 11
提问于2019-04-29
得票数 0
回答已采纳
2
回答
比较
两个
数据
帧
并将结果存储在另一个
数据
帧
中
、
、
、
、
我有两个这样
的
数据
帧
:第一个有一
列
720行(dataframe A),第二个有10
列
720行(Dataframe B)。
数据
帧
仅包含数值。我尝试这样
比较
它们:我想遍历
数据
帧
B
的
每一
列
,并将该
列
的
每个单元(行)
与
数据
帧
A中
的
相应行
进行
比较
。(
浏览 0
提问于2020-10-09
得票数 0
2
回答
PySpark -将单个整数
列表
与
列表
列
进行
比较
、
、
我正在尝试检查
spark
dataframe (具有
列表
的
列
)中
的
哪些条目包含来自给定
列表
的
最大数量
的
值。我想出
的
最好
的
方法是使用rdd.foreach()遍历
数据
帧
,并使用python
的
set1.intersection(set2)将给定
的
列表
与
每个条目
进行
比较
。我
浏览 19
提问于2018-02-01
得票数 2
回答已采纳
2
回答
根据列名名值在pandas中设置dataframe子集
、
、
我在熊猫中有一个
数据
帧
,我需要拆分。它比这个大得多,但这里有一个示例: ID A B c 2 2 我有一个
列表
:keep_list = ['ID','A']和另一个
列表
:recode_list= ['ID','B'] 我希望按
列
标题将
数据
帧
拆分为两个
数据
帧
:一个
数据
帧
包
浏览 18
提问于2020-04-30
得票数 2
回答已采纳
1
回答
如果与
数据
帧
中
的
给定
列表
相同,则分配标签值
、
、
、
、
假设我
的
数据
帧
在这里, ? 在将
数据
帧
中
的
列
与我拥有的
列表
进行
比较
时,如果该
列
中
的
行具有相同
的
值,我希望对它们
进行
标记。例如,
与
'Name‘和my ' list '(ex) list= Y,B
进行
比较
因此在'Name‘
列
中,Y
浏览 14
提问于2020-01-23
得票数 2
回答已采纳
2
回答
将
数据
帧
的
一行
与
相应
的
行
进行
比较
,并将
数据
存储在两个单独
的
列
中
、
、
我有一个
数据
帧
,看起来像这样:0 511832 53382有了这些
数据
,我想创建另一个
数据
帧
,它将包含2
列
,即X和Y,并保存一行
与
另一行
的
比较
。,将Rule ID
列
中
的
第一个值,即51183
与
第二行中
的
第二个值,即50014
进行
比较
。因此51183存储在X
列</em
浏览 20
提问于2019-08-12
得票数 2
回答已采纳
1
回答
比较
Pyspark
数据
帧
的
值(
列表
)
、
、
我想对list_id
列
中
的
两个df1 df2
数据
帧
进行
比较
: df1 = | list_id||[1, 2, 3]||[------++------------+|[12, 13, 14]|+------------+ 期望
的
结果是10, 11] ||
浏览 9
提问于2019-10-01
得票数 0
回答已采纳
1
回答
如果
列表
中
的
元素作为字符串
的
一部分出现,则将该元素作为新
的
列
条目返回
、
我有一个包含几个条目的
列表
:
数据
如下所示: val df =
spark
.sparkContext.parallelize,其中
的
值是
列表
中
的
元素(如果元素出现在消息
列
中)。<listelement>*
的
正则表达式
进行
比较
,但也无法实现。连接也是一种可能性(甚至更多
浏览 2
提问于2018-02-05
得票数 0
回答已采纳
1
回答
只
比较
dataframe中
的
两行
、
、
、
我有一个带有
列
focus_duration
的
数据
帧
,我想逐个
比较
这个
数据
对,这意味着第0行和第1行,第2行和第3行,第4行和第5行,等等。如果第一个整数大于第二个整数,则在新
的
列
中写入1。如果小于,则写入-1,如果
等于
0,则写入-1。我尝试创建一个
列表
,并将一个元素
与
另一个元素
进行
比较
。但是这样
比较
元素2和元素3,元素3和元素4,这是我不想要<e
浏览 20
提问于2020-02-14
得票数 0
回答已采纳
4
回答
比较
两种
数据
火花
、
、
、
、
我试图
比较
两个
列
数相同
的
两个
数据
帧
,即在两个
数据
帧
中有4
列
以id作为键
列
df2 =
spark
.read.csv("/path/to/data2.csv") 现在我想将新
列
附加到DF2,即colu
浏览 7
提问于2020-02-18
得票数 7
回答已采纳
1
回答
单元测试中
的
Spark
Dataframe
比较
以检查功能
、
、
、
、
我已经创建了一些方法来将
数据
帧
转换为所需
的
格式,并根据错误规则过滤多个错误检查和更新
数据
帧
。 我是一个在intelliJ上用scala编写单元测试
的
新手。我必须编写单元测试来将实际
数据
帧
与
预期结果
进行
比较
。 下面是我为
数据
帧
的
pivot功能编写
的
单元测试用例。类似地,我必须将获得
的
数据
集<em
浏览 4
提问于2021-09-13
得票数 1
1
回答
比较
来自两个不同
数据
帧
pandas
的
列
、
、
我正在向AD查询机器
列表
。我用pandas按上次登录日期过滤这个
列表
。当我处理完这些
数据
时,我在一个
数据
帧
中有一
列
。我
浏览 1
提问于2019-08-06
得票数 1
1
回答
将
列表
与
pyspark
列
中
的
每个元素
进行
比较
、
、
、
、
我有一个
列表
minhash_sig = '112','223',我想找到这个
列表
和pyspark
列
中
的
每个元素之间
的
jaccard相似性。不幸
的
是,我不能这么做。我尝试使用array_intersect和array_union来
进行
比较
。但是,当我收到消息Resolved attribute missing时,这是行不通
的
。这是我到目前为止创建
的
火花放电
数据
格
浏览 5
提问于2021-08-28
得票数 1
回答已采纳
1
回答
比较
两个考拉
数据
帧
以
进行
测试
Pandas有一个包含assert_frames_equal
的
测试模块。考拉也有类似的东西吗? 我正在编写一系列到考拉
数据
帧
的
转换测试。首先,由于我
的
测试csv文件只有几行(<10行),我考虑只使用pandas。不幸
的
是,这些文件非常宽(接近200
列
),并且具有在
spark
读取文件时指定
的
各种
数据
类型。由于熊猫
的
类型规范
与
考拉
的
类型规范非常不同,除了我们已经
浏览 27
提问于2020-12-12
得票数 0
回答已采纳
2
回答
返回
数据
帧
中最接近用户定义数字
的
行
、
、
我有一个用户定义
的
数字,我想将其
与
数据
帧
的
某一
列
进行
比较
。 我想返回一个
数据
帧
的
行,其中包含(在df
的
某一
列
中,比如说df.num)
与
给定数字x最接近
的
5个数字。对于没有循环
的
最佳方法
的
任何建议,我们
将不
胜感激。
浏览 2
提问于2013-07-20
得票数 19
1
回答
使用函数
比较
pandas
数据
框
列
并返回
列表
、
、
、
我有一个熊猫
数据
帧
,看起来像这样: Name A_x B_x C_x A_y B_y C_ycd yza 2 def456 zab 1 NaNef zab 3 jkl012 abc 3 jkl012 我现在要做
的
是将
列
A_x
与
A_y、B_x
与
B_y以及C_x
与
C_y
进行
比较
。我希望有一个函数,如果
比较
列
中
的
值不匹配,则返回
浏览 27
提问于2021-03-30
得票数 1
回答已采纳
2
回答
基于Pandas
数据
帧
中
的
几个变量计算概率
、
、
、
我对Python和Pandas还很陌生,所以请耐心听我说……def survivability(total_pass_df, column, value): su
浏览 2
提问于2017-01-08
得票数 1
3
回答
同时迭代多个
数据
帧
行
、
、
我有16个不同
的
数据
帧
,具有相同
的
行数/
列
数,另外2个具有相同形状
的
独立
数据
帧
,我正在使用它们
与
16个
数据
帧
值
进行
比较
。我需要同时遍历所有
数据
帧
,并将所有行值
与
单独
的
数据
帧
进行
比较
,然后创建另一个具有如下结果<e
浏览 20
提问于2020-03-28
得票数 0
2
回答
获取
数据
框
列表
并按变量分组,并将该变量用作字典
的
关键字
、
、
、
我对python编程
比较
陌生。我有一个熊猫
数据
帧
列表
,所有
数据
帧
的
列
都是'Year‘。我尝试按该
列
进行
分组,并转换为字典,其中字典键是变量' year‘,值是该年
的
数据
帧
列表
。这在python中是可能
的
吗?我试过这个: grouped_dict = list_of_csv_files.groupby(by =
浏览 24
提问于2019-04-15
得票数 0
回答已采纳
2
回答
R中具有硬编码值
的
数值匹配/提取
难以理解R中
的
数字匹配/索引。如果我遇到了创建
数据
文件
的
情况,如:x <- seq(from = 0, to = 5, by = 0.10)我想
比较
一下我
的
y
列
的
硬编码值-numeric(0) 尽管如此,如果我将其
与
数据</e
浏览 0
提问于2018-03-12
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券