腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
按
字符
/
因子
值
合并
两个
数据
集
;
保留
较小
的
数据
集
、
、
、
我有一个
数据
集
A,其中有一列
字符
值
(
因子
),每个
值
出现多次。我也有一个被清理
的
集合(A')
的
副本(更少
的
变量和obs)。我现在尝试做
的
是以一种只
保留
较小
集合A‘
的
行(记录)
的
方式
合并
它们。我已经尝试了右连接,但我遇到了问题,因为我是在
字符
值
上操作。vec2) names(Group_
浏览 5
提问于2019-07-25
得票数 1
1
回答
根据R中
的
日期将
数据
帧A和B
合并
在一起,但如果它们重叠,则
保留
A中
的
值
、
、
我想
合并
两个
不同长度
的
导入
数据
集
,如果
两个
数据
集
都有
值
,则
保留
B中
的
值
。
数据
集
A包含1970 - 2016年
的
每日
数据
,
数据
集
B包含1980年至2016年
的
每日
数据
。
合并
后
的
数据
浏览 0
提问于2017-04-05
得票数 0
1
回答
合并
数据
集
的
列时,它们有不同
的
行数
我需要“
合并
”
两个
大小不等
的
不同data.frames,但是使用相同
的
唯一标识符(ID),并且我希望
保留
较大data.frame
的
行
的
#。更重要
的
是,我希望对每个唯一ID对data.framework 1(较大
的
变量)中
的
变量x
的
值
进行求和,以便在data.framework 3(
合并
数据
集
)中,变量x
的
每个观
浏览 6
提问于2014-03-07
得票数 1
1
回答
在mapreduce中将文本文件
的
记录与同一文件中
的
所有其他记录连接起来
、
本文在“权衡示例”小节中描述了一种方法(第一种方法),即每条记录都与输入文件
的
所有其他记录连接。我想知道如果不在一个映射器中传递整个输入文件,在mapreduce中怎么可能做到这一点。
浏览 3
提问于2012-12-23
得票数 1
回答已采纳
0
回答
在R中
按
一个列名
合并
数据
集
时,如何删除重复
的
列名?
按
一个列名
合并
两个
数据
集
:这段代码将
保留
两个
数据
集中
的
所有变量,如果存在重复
的
变量名,例如,dataset1和dataset2都有" ID ",则mergeAll将具有ID.x (表示dataset1中
的
ID )和ID.y (表示datase
浏览 3
提问于2018-07-20
得票数 0
1
回答
按
ID
合并
两个
SAS
数据
集
、
、
我想
合并
两个
具有相同ID
的
sas
数据
集
,但总是有一些错误。我检查了
两个
数据
集中
的
变量baseid都是
字符
,因此我尝试使用相同
的
代码来调整这
两个
数据
集
的
id格式,如下所示 data a; baseidtemp = put(baseid,12); rename baseidtemp
浏览 11
提问于2020-08-21
得票数 0
1
回答
将
两个
数据
集
与python
合并
、
第一次
数据
集
: dim(d)=(70856886 12),第二次
数据
集
: dim(e)=(354 6)
两个
数据
集
都有公共变量,这是主题,我想
按
主题
合并
这
两个
数据
集
,我使用了python
的
代码:data=pd.merge(d, e, on='subject') 当我这样做
的
时候,我
浏览 5
提问于2022-03-17
得票数 -1
4
回答
SAS
合并
不同
的
列
我有
两个
数据
集
,我想
按
城市
合并
。问题是一个
数据
集
只有一个名称,例如:“本特利”,“卡罗琳”等。但是另一个
数据
集
有例如“本特利
的
城镇”,“卡罗琳
的
村庄”等。有没有使用子
字符
串
合并
它们
的
方法?
浏览 0
提问于2013-01-15
得票数 1
2
回答
比较2个
数据
集
,以便仅
保留
使用R完成75%试验
的
参与者
我有一个大型
数据
集
,参与者完成了一项任务
的
试验。有100个常规试验和10个实践试验。对于这个任务,我们只想
保留
人们正确
的
试验。我已经制作了一个单独
的
数据
集
,其中包含没有离群
值
和不正确试验
的
数据
。现在,我被卡住了,因为我需要找到一种方法,只
保留
那些仍然拥有至少75%
数据
的
参与者。为了简化而不是发布整个大型
数据
集
,
浏览 0
提问于2018-09-13
得票数 1
1
回答
将所有数字列除以一个公共
因子
;每个不同
的
行组
的
不同因素
、
、
、
我希望将所有数字列除以一个公共
因子
,在每个行子集中使用不同
的
因子
。一个有代表性
的
例子是iris
数据
集
,如果我想将每个Species
的
所有数字列除以不同
的
因子
(例如尝试拆分然后
合并
-提供因素列表;
按
组拆分iris
数据
集
列表,对
两个
输入进行映射,然后重新组合--但我无法正确地得到
浏览 3
提问于2020-09-14
得票数 0
回答已采纳
1
回答
根据数组,插入排序和
合并
排序哪个更快?
、
、
、
、
假设我们得到一个已经
按
升序排序
的
数组A。插入-排序和
合并
-排序,哪一个更快? 像wise一样,假设我们得到一个
按
降序排序
的
数组B,所以它需要颠倒。哪一个现在无症状地更快了?我很难掌握这一点,我已经知道插入排序更适合于
较小
的
数据
集
,而
合并
排序更适合于较大
的
数据
集
。然而,我不确定为什么一个比另一个更快,这取决于
数据
集
是否已经排序。
浏览 0
提问于2021-02-24
得票数 0
2
回答
在SAS中
合并
列
、
我有
两个
数据
集
,它们来自不同
的
来源,但包含相似的变量。一个类似的变量是来自
数据
集
A
的
"Procedure“和来自
数据
集
B
的
"SurgicalProcedure”。我已经将这
两个
数据
集
合并
成一个巨大
的
数据
集
,我们称之为
数据
集
C。 有时这
两个
浏览 78
提问于2017-02-21
得票数 0
回答已采纳
3
回答
如何更改以特定
字符
开头
的
列
的
所有
字符
值
?
我有一个拥有数百万观测
数据
的
数据
集
。考虑到我
的
数
浏览 0
提问于2019-09-24
得票数 3
1
回答
将一个
数据
帧
的
avro模式复制到另一个
数据
帧-pyspark
、
我有一个具有模式A
的
数据
集
A,也有一个具有模式B
的
数据
集
B。这
两个
数据
集
A和B大多相似(具有相同
的
列,但
数据
类型仅在少数情况下不同),但有一个次要
的
differences.One示例,即
数据
集
A中
的
列具有日期
值
(‘2020-08-03’,表示为
字符
串
数据
类型),
数据<
浏览 7
提问于2020-08-03
得票数 1
1
回答
如何使用R中
两个
现有变量
的
特定
值
创建变量
如何使用我已经拥有的
两个
变量
的
某些
值
在R中创建一个新变量?具体来说,我
的
数据
集
有
两个
变量作为方法,我只需要
保留
一个
值
较小
的
变量。下面是一个示例:x1 3 2x3 0 7 在这个示例dataset
的
例子中,我希望只使用
较小
的
值
创建一个新变量"b“,因此它将是a2 for
浏览 2
提问于2022-11-09
得票数 0
3
回答
在SAS上,
合并
、追加和
合并
有什么区别?
我试图在SAS上运行代码来连接、追加和
合并
,但无法理解它们之间
的
区别。寻找一些人来帮助我理解同样
的
例子。
浏览 3
提问于2016-03-23
得票数 0
1
回答
Weka中基于日期
的
两个
文件
合并
我有
两个
数据
集
要
合并
在一起,它们具有不同
的
属性。一个大约有400万个实例,另一个大约有180个实例。它们都具有日期属性,并且涵盖相同
的
时间段。具有400万
的
数据
库具有覆盖日/月/年和时间
的
日期属性。我如何
合并
这些
数据
,并让
较小
的
数据
集
将其实例复制到较大
数据
集
的</e
浏览 5
提问于2020-12-01
得票数 0
1
回答
为什么在内存中对
较小
的
数据
集
进行散列以进行散列连接
、
为什么在哈希连接中,它是保存在内存中
的
较小
的
数据
集
?我知道
保留
较小
的
数据
集
可以节省内存空间,但这确实意味着我们需要迭代较大
的
数据
集
,所以这对性能不是很坏吗?
浏览 1
提问于2014-06-18
得票数 0
2
回答
SSIS中
的
分组
所以,我有一堆
数据
,我正在尝试使用SSIS导入。我遇到
的
问题是有些
数据
已经过时了。所以我只想导入最新
的
数据
。我有一个键,它指示每一行所属
的
数据
集
,并且我只想为每个键导入最多
的
行。在SSIS中执行此操作
的
最佳方法是什么? 我唯一
的
想法是使用
两个
排序转换。第一个将
按
日期排序。第二个将
按
我
的
键排序,并消除重复行。只有在保证排序保持以前
浏览 1
提问于2010-10-19
得票数 3
回答已采纳
1
回答
如何在R中使用left_join函数避免重复
、
假设有
两个
数据
集
具有相同
的
列: A、B、C。我
按
A
合并
了
两个
数据
集
。但是,
合并
后
的
数据
集
具有名为B.x、B.y、C.x、C.y
的
列。但我只想在新
数据
集中包含B和C。如何解决这个问题?
浏览 22
提问于2020-09-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据集的纵向合并——Stata 软件
更换MySQL数据库字符集的那些事儿
快速掌握R语言中类SQL数据库操作技巧
必学包之dplyr包
pandas系列学习(五):数据连接
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券