腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
连接
具有
多个
相似
值
和
多个
键
/
scala
的
数据
帧
scala
、
apache-spark-sql
前两个表是我想要
连接
的
源表。第三个表是我想要
的
。 我尝试使用外部
连接
并使用
键
"ID“
和
"date”,但结果与本例中
的
结果不同。问题是,每个表中
的
一些def_
值
具有
相同
的
日期,我希望将它们放在同一行中。
浏览 12
提问于2019-03-21
得票数 0
回答已采纳
3
回答
字符串列包含通过spark
scala
进行精确匹配
的
单词
scala
、
apache-spark
、
apache-spark-sql
我有两个
数据
帧
,第一个
数据
帧
包含实际
数据
(从CSV文件读取),第二个
数据
帧
包含一个
具有
多个
关键字
的
列。即下面的Dataframe-1外观
相似
(我们必须搜索
的
地方):
数据
帧
-2:我想要
的
输出:我在这里使用spark
scala
。我想要一个与dataframe-1中
的</
浏览 1
提问于2021-02-12
得票数 0
1
回答
如何
将pyspark
的
多个
列(它们是
具有
相同
键
的
字典)分解成行
dictionary
、
pyspark
、
explode
数据
帧
有
多个
字典格式
的
列--它们
具有
相同
的
键
。我
如何
才能将它们分解成行,而不必使用任何
连接
来保持
键
不受任何列
的
影响?需要爆炸
的
列是pct_ci_tr,pct_ci_rn,pct_ci_ttv
和
pct_ci_comm
浏览 3
提问于2022-06-21
得票数 0
回答已采纳
1
回答
通过
连接
比较两个pyspark
数据
帧
python
、
dataframe
、
join
、
pyspark
我有两个pyspark
数据
帧
,它们
的
行数不同。我试图通过在
多个
键
上
连接
这两个
数据
帧
来比较所有列中
的
值
,这样我就可以找到这些列中
具有
不同
值
的
记录
和
具有
相同
值
的
记录。df1 and df2 on multiple keys same=df1.join(df2, on=['id'
浏览 14
提问于2021-02-13
得票数 0
2
回答
Spark SQL过滤
多个
相似
字段
apache-spark
、
apache-spark-sql
有没有更好
的
方法在spark
数据
帧
上编写
多个
条件
的
过滤器,这些条件在本质上是
相似
的。 假设df是
具有
时间戳列t1、t2、t3、t4
的
spark
数据
帧
。current_date()-expr("INTERVAL 30 DAYS")) || col("t4").lt(current_date()-expr("INTERVAL 30 DAYS"))) 有没有更好
浏览 43
提问于2019-01-19
得票数 0
1
回答
将不同时间戳格式
的
多个
数据
帧
堆叠到一个时间戳中
python
、
pandas
、
dataframe
、
datetime
、
strptime
我有
多个
数据
帧
,每个
数据
帧
的
数据
从1分钟到1440分钟(一天)不等,.Each
数据
帧
相似
,列相同,长度相同。时间列
值
为hhmm格式。假设df_A有第一天
的
数据
,也就是2021-05-06,它是这样
的
。 >df_A02.2359 第二天
的</em
浏览 17
提问于2021-07-20
得票数 0
回答已采纳
1
回答
Linq 2 SQL并行处理
c#
、
multithreading
、
linq-to-sql
、
parallel-processing
我有一个长期运行
的
任务,它受益于多线程。由于需要实体
的
单个实例,因此很难为每个线程使用
多个
datacontext。有没有一种推荐
的
方法来实现这种情况?一些附加信息:任务是
浏览 0
提问于2012-12-13
得票数 0
回答已采纳
0
回答
如何
将函数应用于
多个
pandas
数据
帧
python
、
function
、
pandas
、
dataframe
我有
多个
数据
帧
:它们
具有
相同类型
的
数据
,但来自无法
连接
的
不同描述符组。现在,我需要对每个
数据
帧
手动应用相同
的
函数。
如何
将同一函数应用于
多个
数据
帧
?
浏览 4
提问于2016-07-07
得票数 5
回答已采纳
1
回答
为x、y坐标
和
时间戳创建熊猫
数据
多索引
python
、
pandas
、
dataframe
、
multi-index
我被困在为熊猫
数据
创建
多个
索引
的
知识中。我
的
数据
是一张有230 x 640
的
图像。我添加了一个带有时间戳
的
列,现在我想创建一个
具有
x、y坐标
和
时间戳
的
Multiindex。我也需要时间戳作为索引,因为我用不同
的
时间戳
连接
多个
帧
,但是
具有
相同
的
帧
宽和高度。 有办法创建这样
的
索引
浏览 1
提问于2020-02-19
得票数 1
回答已采纳
2
回答
如何
从有序字典中创建
数据
帧
?
ordereddict
我有一个有序
的
字典,它有4个
键
和
多个
值
。我尝试像这样创建
数据
帧
print('\ndf is ',df)OrderedDict([('Product', 'DASXZSDASXZS')
浏览 22
提问于2021-05-21
得票数 0
回答已采纳
1
回答
非SQL (Cassandra)用户
数据
建模
cassandra
、
nosql
如何
在Cassandra?中建模用户
数据
具有
相同密钥结构
的
多个
表(每个组件一个),偶尔需要在分区
键
上“
连接
”?我们有与客户关联
的
各种
数据
和
元
数据
,这些
数据
和
元
数据
目前保存在单独
的
表中
浏览 0
提问于2018-05-16
得票数 8
2
回答
如何
基于部分字符串匹配来
连接
两个
数据
帧
?
python
、
pandas
、
string-matching
我有两个
数据
帧
,并希望基于三个字段A、B
和
C来
连接
它们。但是,A
和
B是数值,我希望它们在我
的
join/merge中完全匹配,但C是一个字符串
值
,我希望至少80%匹配(
相似
性),即如果A
和
B在两个
数据
帧
中
具有
相同
的
值
,并且第一个
数据
帧
中
的
C
值
为abcde,第二个<em
浏览 9
提问于2018-07-28
得票数 0
1
回答
如何
在clover dx中使用pivot组件
clover
、
cloveretl
无法使用pivot组件,请举例说明
如何
在三叶草等中使用pivot
和
串联组件
浏览 20
提问于2020-01-26
得票数 0
2
回答
Python Pandas -
连接
具有
不同行数
和
列数
的
两个
数据
框
python
、
pandas
、
data-science
、
data-analysis
我有两个不同行号
和
列
的
数据
帧
。这两个表都有几个公共列,包括"Customer ID“。这两个表
的
大小分别为11697行×15列
和
385839行×6列。客户ID可能在第二个表中重复。我想要
连接
这两个表,并想用客户ID合并
相似
的列。
如何
检查是否存在
具有
一个ID
的
多个
条目,以及
如何
将其合并到一个结果中?当我使用上述代码时,下面是
数据
浏览 2
提问于2019-06-15
得票数 1
1
回答
Python Pandas动态读取
具有
不同列大小
的
多个
标题行
的
Excel工作表
python
、
pandas
我有一个excel表格,我正试图将其作为
数据
帧
读取。工作表
具有
多个
标题行,每个标题行可以
具有
不同数量
的
列。有些列是
相似
的,但并不总是如此。有没有一种方法可以将行分割成单独
的
数据
帧
?例如,
数据
将是:1 1 1 1A B C D E2 2 2 2 2A B C理想
的
输出应该是三个独立
的
浏览 0
提问于2018-11-03
得票数 0
1
回答
如何
在python中将for-循环生成
的
字典列表转换为
数据
python
、
python-3.x
、
dataframe
、
dictionary
、
for-loop
如果循环生成
多个
列表,并且每个列表都
具有
相似
的“
键
”名称,并且希望将类似的“
键
”名称作为列名
和
值
,则应该将
多个
字典分配给dataframe中
的
value列。例:[{'name':'kumar','job':'Plumber'},{'name':'Rajesh','job
浏览 5
提问于2022-06-30
得票数 -1
回答已采纳
2
回答
连接
数据
帧
-一个
具有
多索引列,另一个不
具有
多索引列
python
、
pandas
、
join
、
multi-index
我正在尝试
连接
两个
数据
帧
-一个
具有
多个
索引列,另一个
具有
单个列名。它们有
相似
的索引。我得到以下警告:"UserWarning:合并不同级别可能会产生意想不到
的
结果(3个级别在左侧,1个级别在右侧)“arrays = [['bar', 'bar', 'baz', 'baz',index) df2 = pd.DataFrame(np.random.randn
浏览 0
提问于2017-04-05
得票数 10
回答已采纳
1
回答
从
多个
dataframe获取
具有
相同名称
的
特定列
的
平均值,并将其放入列表
python
、
python-3.x
、
pandas
、
dataframe
我有
多个
具有
相同列名
的
数据
帧
。
如何
从所有
数据
帧
中获取特定列
的
平均值(假设我希望得到
的
列名是
相似
的),并将它们放入列表中?
浏览 7
提问于2022-06-12
得票数 0
回答已采纳
2
回答
使用find函数,
如何
在C++上使用multimap查找
键
的
最后一个匹配项(而不是第一个匹配项)?
c++
我有一个
具有
多个
相似
键
的
多图集。它是经过排序
的
,我需要首先获得
值
的
最后一次出现。
浏览 0
提问于2021-03-01
得票数 2
1
回答
Scala
Spark :在Spark中有没有datafu.pig.sampling.SampleByKey
的
替代品?
scala
、
apache-spark
、
apache-spark-sql
、
apache-pig
SampleByKey
的
采样方法是将
键
转换为散列,从中派生一个双精度
值
,然后根据提供
的
概率对其进行测试。密钥派生
的
双精度
值
在0到1之间均匀分布,代码为。
具有
相同
键
的
所有行都以这种方式进行采样。我有一个Dataframe,它是通过对
多个
dataframe执行联合操作而形成
的
(它们都有相同
的
模式)。我感兴趣
的
是,每个单独
的
数据
<em
浏览 0
提问于2020-06-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
通过这10个教程学习Maya的基础知识(二)
2018年数据科学前15名的Scala库
pandas系列学习(五):数据连接
解读 JavaScript 之深入探索 WebSockets和HTTP/2
scala面向对象编程
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券