腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
pivot_wider
对
R
中值
列
中
存在
重复
和
多个
类
的
数据
集
进行
整理
我正在尝试
使用
pivot_wider
来
整理
数据
集
,但我遇到了一些我不知道
如何
处理
的
问题。在我赋值给"values_from“
的
值
列
"OrigValueStr”
中
,我既有数字又有因子。因为有一些
重复
项,所以我希望从数值
中
获得平均值,但我希望将因子作为因子(可能通过将可能
的
重复
项放在彼此后面,用";“或"_”分
浏览 40
提问于2020-01-20
得票数 0
回答已采纳
2
回答
用于大
数据
集
的
pivot_wider
替代方案
、
我有一个大
数据
集
(35.8 GB,超过10亿行),我需要
整理
。full <- as.data.table(full)此代码适用于此示例:
pivot_wider
(names_from = item, values_from = itemformat)但是,在大规模
数据
<e
浏览 3
提问于2022-10-20
得票数 6
回答已采纳
1
回答
R
中
数据
帧
中
重复
列
的
分裂
和
重命名
、
、
、
我
对
R
非常陌生,我正在
整理
数据
集
。我有大量
的
列
,其中一些
列
(在.CSV文件
中
)包含几个逗号分隔
的
名称。例如,我需要拆分
和
复制该
列
,并将逗号分隔
的
名称分别提供给每一
列
:但是,我可能有更复杂
的
情况,其中有几个
列
(具有不同
的
数值)具有相同
的
重复
浏览 2
提问于2018-05-31
得票数 0
回答已采纳
1
回答
如何
对
数据
进行
预处理以处理
R
中
缺失
的
值
、
、
、
、
我试图在
R
中
对
我
的
数据
进行
预处理,以便
对
属于给定元组“”
的
所有样本
使用
“属性平均值”。
数据
源提供程序已经给出了丢失
的
值或超出范围
的
值-1。但是,我想根据上面用粗体表示
的
数据
挖掘原则来替换那些缺失
的
值。作为我
的
类
决策器
的
列
是“意外严重度”,我想给出所有样本<
浏览 1
提问于2014-03-20
得票数 0
2
回答
R
:通过
R
中
列
的
范畴变量
对
Sumif
和
Countif等价
、
、
、
假设我有一个10
列
的
数据
集
。其中9个是数值,一个是分类值,如HIgh
中值
和
低值。我想用范畴变量
对
R
中所有9个数字
列
进行
总结(类似于excel
中
的
sumif
和
countif )。 这是
如何
做到
的
呢?我
对
R
很陌生,任何帮助都是很棒
的
!谢谢!
浏览 7
提问于2015-09-14
得票数 0
回答已采纳
1
回答
R
pivot_wider
为每一行保留一个id
、
我有一个包含ID
和
值
的
数据
集
,其中一个ID可以接受
多个
值。目前,相同
的
ID在具有
多个
值时是按行顺序
重复
的
,但我希望每行保留一个ID,在必要时添加更多
的
列
。下面是一个可
重复
的
例子: val = c(10:15))df2
浏览 1
提问于2020-07-19
得票数 0
回答已采纳
1
回答
比较
数据
,如果
存在
多行相同
的
数据
,则将规则作为参数提及
我收集了
数据
,任务是用一定
的
规则检查
多个
列
。例如:如果Username
列
和
employee ID匹配,则检查
重复
项;如果
存在
匹配项,则需要记下
重复
的
值,并在输出列
中
写入
R
1。然后,下一步是检查Username
和
员工工资,然后检查
重复
项,如果
存在
匹配,则需要注意
重复
的
值,并在输出列
中</
浏览 5
提问于2020-11-07
得票数 0
1
回答
在returning
中
,当结合
使用
mutate()
和
c_across()时,所有行都返回相同
的
值
、
我
对
R
相当陌生,我正在处理一个大
的
光谱
数据
集
。我想平均每个样品
的
红色
和
近红外波长
的
反射率。
使用
pivot_wider
,我
的
波长350-2500显示为包含反射率
的
列
.我尝试过(
使用
dplyr):
pivot_wider
(names_from=Wavelength,values_from)%>% mu
浏览 4
提问于2022-02-25
得票数 0
回答已采纳
3
回答
标识
和
修改
数据
帧
中
的
列表单元格
、
我
使用
pivot_wider
来传播我
的
数据
。但是,
存在
重复
的
行(尽管我仍然不清楚原因),所以
重复
的
行被存储在“list_columns”
中
。我现在正在尝试识别哪些单元格已经存储为列表,并且我希望仅用列表
中
的
第一个元素替换这些值。df时,a
列
中
的
第一个单元格显示为c("a", "b") (见
浏览 43
提问于2020-06-10
得票数 2
回答已采纳
2
回答
如何
根据给定
列
中
的
值汇总
R
数据
集
?
、
我是
R
的
新手,到目前为止我一直做得还不错,但是我现在需要做一些有点复杂
的
事情,不能完全让它开始工作。我有一个类似于以下
数据
集
的
数据
集
(接下来我将调用这个df): "test" = ifelse(word == "test&q
浏览 5
提问于2020-06-18
得票数 3
回答已采纳
1
回答
使用
R
中
的
同义词识别近似
重复
的
条目
、
、
、
我正在尝试识别
数据
库
中
接近
重复
的
姓名条目。我是
数据
库
的
新手,但我熟悉
R
。我可以
使用
模糊匹配
和
R
中
的
soundex获得近似
重复
的
集群。然而,有几个名称是彼此
的
同义词。我想根据这个标准
和
上面的标准
对
这些名称
进行
聚
类
。 我想按照
中
的</e
浏览 2
提问于2014-03-14
得票数 2
1
回答
R
数据
帧,2
列
为宽格式,
使用
spread()或
pivot_wider
()获取
重复
/非唯一错误/警告消息
、
、
这显然是一个入门级
的
问题,但似乎表明,我可能缺少一些基本
的
R
如何
处理基本水平
的
数据
转换. 注意,我已经阅读了所有其他
的
信息/回复,但我仍然
对
为什么不能完成下面这个非常简单
的
任务感到困惑。有人能至少向我解释一下这里发生了什么,以及
如何
在警告信息中
使用
这些选项吗?(在正常情况下,
使用
3
列
或更多
列
非常简单,因此这里缺少了一些东西。)我
浏览 2
提问于2021-06-19
得票数 0
2
回答
添加包含出现次数
的
列
,为每条记录重置
我有行数可变
的
记录,
列
A有7个可能
的
值,它们都是可
重复
的
。 我需要一个基于A
的
新
列
B,显示每条记录
中
每个值出现
的
次数。每条记录
中
的
计数都应该重置。我设法在
列
A
中
按字母顺序
对
每条记录
中
的
行
进行
排序,但我找不到正确
的
表达式来
进行
计数。我只能设法通过所有
数
浏览 1
提问于2020-07-22
得票数 3
1
回答
R
ggplot2重新排序条块,并在末尾放置一个特定
的
条块
、
我
如何
安排这个表,使gg图按“部分”
对
条形图
进行
排序,同时将“其他”放在末尾?(我
的
真实
数据
集
更大,所以我需要一些‘自动’
的
东西)。8 Banana PROD 0.35 我已经做了几次解释,但是没有人有像我这样
的
数据
集
(其中'PART‘是在一个
列
中
,而不
浏览 0
提问于2021-03-07
得票数 0
1
回答
表
中
数据
列
的
多标签分类
、
、
、
、
我正在寻求关于涉及
数据
列
标记
的
机器学习问题
的
指导。目前,我有一个系统,用户可以在这个系统
中
向表
中
的
列
添加
多个
标记。但是,我想通过
使用
多标签分类来自动标记新
列
。通过
对
列
值
进行
列分析,我从每个
列
中提取了21个特征。得到
的
特征将包括统计值,如标准差、最大值、最小值、峰度等。我是否正确地
使用
这些特征作
浏览 0
提问于2018-02-10
得票数 3
1
回答
多个
计算
数据
集
列子集
的
相关矩阵
、
我正在
使用
R
中
的
R
包对
数据
集
进行
多个
估算,其中
存在
大量
的
缺失。原始
数据
集中有一些变量对于计算过程
和
以后
的
分析非常重要。但是,我想
使用
cor()创建一个相关矩阵,而不包括一些变量。通常,对于一个简单
的
dataset x,cor(x[,3:7])会生成第3
列
到第7
列
的</
浏览 1
提问于2016-03-25
得票数 2
3
回答
用
列
内
类
的
平均值替换缺失
的
值
、
、
、
我有一个很大
的
数据
集
,其中缺少一些值(NAs)。我希望用
列
平均值替换这些值,但是用
类
替换为
类
,也就是说,如果类k
中
的
项在
列
j中有一个缺失值,则该值将被
类
k
中
项
的
J
列
中值
的
平均值所取代。此外,我还想
使用
基
R
或dplyr来实现这一点。 与已经在这里回答
的
著名问题相比,
类<
浏览 8
提问于2020-05-01
得票数 1
回答已采纳
1
回答
两组大规模比较
、
、
、
、
Supplier_id
和
" status“(pass
和
fail是状态
列
的
值)这两个
数据
集
通过标识符
列
链接。 然而,我们
的
目标是找
浏览 0
提问于2022-04-06
得票数 0
1
回答
不移除
重复
项
的
Pivot_wider
、
、
我想
使用
pivot_wider
,目标是通过保持
重复
的
值分开,结果
列
的
数量等于旋转
的
行数。为此,我需要通过GroupID
和
groupTheme扩展
数据
集
。我想每人一排。注意,每一组人
对
“委员会”
的
意见都是
重复
的
。对于原始
数据
集中
的
每个“名称”,都是这样
的
。这是因为在所有行
中
,G
浏览 3
提问于2022-05-22
得票数 0
回答已采纳
2
回答
如何
使用
来自两个XTS
的
数据
来创建新
的
XTS?
、
、
)x2015-01-02 1 22015-01-06 3 6
和
2015-01-02 "a"a b2015-0
浏览 6
提问于2019-11-19
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券