腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
尝试
将
数据
集
拆
分为
案例
和
控件
所以我有一个海量的
数据
集
,我需要在其中找到病例
和
对照的描述性统计
数据
,然后能够对它们进行比较。例如,我有997名女性
和
1139名男性,但我需要知道有多少女性是病例,有多少是对照。Controls =0
和
cases = 1。我想保留所有其他变量,但只将它们分成两组。我试过使用split()函数,我试着创建一个subset(),但我仍然不知道如何让它向我显示不同的组。我对R比较陌生,但需要用它来分析我的硕士论文
数据
。
浏览 17
提问于2021-05-11
得票数 0
1
回答
在Scala中拆分列
嗨,我想分
拆
一个专栏。
数据
集
样本: 2019 10并在一年内进一步统计所有的推特(我知道如何在这里使用reduceByKey(+) ) 如何分割星火中的列?我不想使用
数据
帧。
浏览 4
提问于2020-05-27
得票数 2
1
回答
如何在spss中分析匹配的病例对照
数据
我有一个
数据
集
,其中一个变量是该情况下匹配
控件
的id。3(马、香蕉)的id与对照5(鲨鱼、苹果)
和
对照2匹配,则应排除在分析中,因为任何情况下都不引用。我想: _______________________________________________________________动物马(%) 2 (100%) 1 (50%)水果-苹果(%) 1 (50% ))2 (100%) 执行结果变量的赔率和风险比在
案例
Vs。<e
浏览 0
提问于2015-05-31
得票数 0
回答已采纳
1
回答
glm函数没有获取正确的
数据
集
、
我刚刚开始学习R和
数据
集
,它有1470个
案例
。
数据
集
的名称是ABC。使用as.factor,我
将
分类变量转换为因子。Dept)BusinessTravel_1 <- as.factor(ABC$BusinessTravel) 在此之后,我
将
数据
集
分为
训练
数据
集
和
测试<em
浏览 2
提问于2016-11-21
得票数 0
回答已采纳
1
回答
如何用SPSS fuzzy命令修复病例对照匹配
、
、
我试图在我的
数据
中创建一个1:4的病例对照匹配,但最终的
数据
集
不包括任何
控件
。为什么会这样呢?病例
和
对照已经在年龄
和
性别上匹配,但我正在
尝试
创建五个观察(1个病例
和
4个对照)的集群,每个都标记有一个特定的ID。supplierid=supplier newdemanderidvar=sid group=case %%性别范围从8-88m年龄可以接受两个值(1或2),“供应商”是一个从1到745,414的序列号,“
案例
”标记观察是病例(
浏览 132
提问于2019-04-28
得票数 1
3
回答
如何评价和解释这一机器学习中的训练模型?
、
、
、
、
我做了一个测试,但不知道如何解释
和
评估。我首先将
数据
(
数据
A,约8000字)随机
分为
10组(a1..a10)。在每一组中,我使用90%的
数据
来建立ngram模型。然后,在同一组的其他10%
数据
上测试此ngram模型。结果精度在10%以下。其他9组采用相同的方法(分别建立模型,并分别在该组剩余的10%
数据
上进行测试)。所有结果的准确度都在10%左右。
案例
2: 首先建立了一个基于全
数据
集
(<
浏览 5
提问于2012-05-23
得票数 0
回答已采纳
1
回答
拆分
数据
列
和
订单列
、
我正在
尝试
一些分割-应用-组合方法。如何
将
数据
划
分为
不同的类别,然后按特定列的降序排序每个类别。我先把车
拆
了那如果我做了 按顺序错误(Mpg):找不到对象
浏览 5
提问于2015-05-25
得票数 2
回答已采纳
1
回答
为python中的分类问题生成合成
数据
的适当起点
、
、
我有一个包含9个特征
和
1300行的
数据
集
。我正在
尝试
在我拥有的现有
数据
上生成合成
数据
。输出
分为
两个选项。即1
和
0,即(1-是
和
0-否)这里的问题是,几乎1100个
案例
的输出为"0“,200个
案例
的输出为"1”。之前,我
尝试
过训练,但效果并不好。我的教授建议我在合成
数据
上工作,并增加输出"1“的情况,以便它有助于开发机器学习模型。我对合
浏览 11
提问于2019-06-19
得票数 0
1
回答
如何在RandomizedSearchCV中使用交叉验证拆分
数据
、
、
我正在
尝试
使用RandomizedSearchCV将我的模型从单次运行转移到超参数调优。这是正确的方法吗?我的问题是:我如何访问剩余的33%的train_input以将其提供给我的验证准确性
浏览 6
提问于2018-02-10
得票数 0
回答已采纳
1
回答
添加
控件
和
案例
编号,而不是add_nevent()
下面的代码生成一个包含"N“
和
"Event N”的N列,作为单变量回归表的一部分。我有一个
案例
控件
数据
集
,我希望使用" cases“
和
" controls”列来提供
案例
和
控件
的数量。“case”
和
"control“由下面代码中的变量"response”决定。例如,响应(1)=“
案例
”,而响应(0)=“控制”。 我该怎么做呢?
浏览 13
提问于2020-10-15
得票数 0
回答已采纳
1
回答
数据
和
指令是否隔离在修改过的哈佛体系结构中的
数据
总线中?
、
、
、
在经过修改的哈佛体系结构中,
数据
和
指令(代码)一起存储在DRAM
和
L2缓存中,而在L1级别上是分开的。它们也都通过
数据
总线从DRAM传输到缓存。我读到,
数据
/指令可以有单独的内存控制器。但是,是否
将
公交线路细
分为
数据
和
指令? 如果它们是分开的,那么分
拆
公交线路与统一线路之间的权衡又是什么呢?它们是以不同的方式实现的,还是可替代的?
浏览 5
提问于2020-07-14
得票数 0
回答已采纳
2
回答
尝试
将
数据
划
分为
训练
集
、测试
集
和
验证
集
(按时间顺序)
、
、
我有一个
数据
集
:getSymbols('GOOG', from = "2010-05-01", to = "2017-05-01", src = "yahoo")我试图
将
这些
数据
分成训练(nrow 1:到nrow 60%的
数据
)、test (nrow 60%的
数据
到nrow 80%的
数据
)
和
最终的验证(nrow 80%的
数据</
浏览 0
提问于2017-11-01
得票数 0
1
回答
在R中创建匹配对
、
我有一个大约20,000个病例的
数据
集
,每个病例有3个可能的对照。每个
案例
和
控件
都由一个ID变量唯一标识。我已经
将
数据
导入到R中,并将其视为一组大约20,000个病例
和
大约50,000个对照,以便为
数据
集中与协变量(例如,年龄)匹配的每个病例仅选择一个对照。我想要的输出是第1列中的
案例
ID
和
第2列中匹配的
控件
ID。 我一直在
尝试
使用MatchIt包进行匹配,但是包
浏览 0
提问于2020-05-20
得票数 0
1
回答
设置参数
控件
和
使用过滤器
、
、
、
、
我目前在新南威尔士州有一个超速罚款的
数据
集
。我已经创建了一个条形图,其中显示了超速违章的前10个频率。这些违规行为
分为
学校区域违规行为
和
正常超速违规行为。但是,条形图不会发生任何变化。
浏览 0
提问于2020-08-03
得票数 0
1
回答
在R中拆分每小时的时间序列
、
、
我正在
尝试
使用R
将
时间序列
数据
集
拆
分为
训练
集
和
测试
集
。
数据
集结构如下: Date (format = %Y-%m-%d) | Hour (24 H format) | Value 2018-09-2315 12345 我使用以下代码将此
数据
集
转换为时间序列格式: tt <- ts(df$Value,start=c(2018
浏览 15
提问于2021-04-27
得票数 1
回答已采纳
1
回答
什么时候使用Scala合适?
、
、
Scala提取器的大多数示例都是相对简单的情况,例如: 随着代码(和
数据
)
浏览 1
提问于2016-03-02
得票数 0
回答已采纳
1
回答
关于团体归属的培训
和
测试
集
然而,在我的
数据
集中,受试者被
分为
两组(病人和对照组),因此,我希望
将
数据
分成两组,同时保持每个培训
和
测试集中患者
和
对照组所占比例与完整
数据
集
的比例相同。我怎样才能在R中做到这一点?如何修改以下功能,使其在
将
数据
拆
分为
培训
和
测试
集
时考虑到组间的隶属关系?,并将
数据
集
拆
分为
培训
和
测试
集<
浏览 3
提问于2013-09-22
得票数 1
回答已采纳
2
回答
拆分列表中的
数据
、
、
因此,我有一个
数据
集
,我正在
尝试
将
数据
拆
分为
4个列表。我编写这个函数就是为了做到这一点。list1, list2, list3, list4 = map(list, zip(*newlist)) 但是,当我
将
n设置为4时,代码只能将
数据
拆
分为
3个列表,而当我
将
n设置为5时,代码
将
数据
拆
分为</em
浏览 30
提问于2018-09-10
得票数 0
回答已采纳
1
回答
R:通过随机化组变量来拆分
数据
集
我有一个
数据
集
,我需要在R中将其拆
分为
训练
和
测试
集
。它有许多观察值,每个观察值都有各自的时间值(Q32008,Q42008,...,Q42016)。我想将
数据
集
一
分为
二,使用随机化季度,其中特定季度的所有观察结果都在一起。例如,一个
数据
集
将
包含来自Q2 2009、Q4 2010、Q1 2008的所有观测值。我
尝试
使用split,但是我不能随机地将它unsplit成两个唯一的
浏览 0
提问于2016-11-15
得票数 0
1
回答
k-means算法会提高
数据
处理的性能吗?
、
、
我正在
尝试
对一个大型
数据
集
实现k-means算法,因为k-means的目标是
将
一组
数据
点划
分为
k个簇。我不确定是否
将
数据
集
重新划
分为
k-means聚类,这是否能够提高
数据
处理的性能?
浏览 1
提问于2015-10-23
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
vba高级班内容详情
常见功能测试点的测试用例大全
第31天,我终于被递归打败了,禁止套娃太应该了!
一个案例引发的思考:税收筹划的最关键原则是什么?
解密SuperMap iDesktop自动化测试技术
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券