尝试将数据集拆分为案例和控件_将ImageFolder拆分为训练数据集和验证数据集_按月将数据集拆分为训练和测试 - 腾讯云开发者社区

所以我有一个海量的数据集，我需要在其中找到病例和对照的描述性统计数据，然后能够对它们进行比较。例如，我有997名女性和1139名男性，但我需要知道有多少女性是病例，有多少是对照。Controls =0和cases = 1。我想保留所有其他变量，但只将它们分成两组。我试过使用split()函数，我试着创建一个subset()，但我仍然不知道如何让它向我显示不同的组。我对R比较陌生，但需要用它来分析我的硕士论文数据。

浏览 17提问于2021-05-11得票数 0

1回答

在Scala中拆分列

嗨，我想分拆一个专栏。数据集样本： 2019 10并在一年内进一步统计所有的推特(我知道如何在这里使用reduceByKey(+) ) 如何分割星火中的列？我不想使用数据帧。

浏览 4提问于2020-05-27得票数 2

1回答

如何在spss中分析匹配的病例对照数据

我有一个数据集，其中一个变量是该情况下匹配控件的id。3(马、香蕉)的id与对照5(鲨鱼、苹果)和对照2匹配，则应排除在分析中，因为任何情况下都不引用。我想： _______________________________________________________________动物马(%) 2 (100%) 1 (50%)水果-苹果(%) 1 (50% ))2 (100%) 执行结果变量的赔率和风险比在案例Vs。<e

浏览 0提问于2015-05-31得票数 0

回答已采纳

1回答

glm函数没有获取正确的数据集

、

我刚刚开始学习R和数据集，它有1470个案例。数据集的名称是ABC。使用as.factor，我将分类变量转换为因子。Dept)BusinessTravel_1 <- as.factor(ABC$BusinessTravel) 在此之后，我将数据集分为训练数据集和测试<em

浏览 2提问于2016-11-21得票数 0

回答已采纳

1回答

如何用SPSS fuzzy命令修复病例对照匹配

、、

我试图在我的数据中创建一个1:4的病例对照匹配，但最终的数据集不包括任何控件。为什么会这样呢？病例和对照已经在年龄和性别上匹配，但我正在尝试创建五个观察(1个病例和4个对照)的集群，每个都标记有一个特定的ID。supplierid=supplier newdemanderidvar=sid group=case %%性别范围从8-88m年龄可以接受两个值(1或2)，“供应商”是一个从1到745,414的序列号，“案例”标记观察是病例(

浏览 132提问于2019-04-28得票数 1

3回答

如何评价和解释这一机器学习中的训练模型？

、、、、

我做了一个测试，但不知道如何解释和评估。我首先将数据(数据A，约8000字)随机分为10组(a1..a10)。在每一组中，我使用90%的数据来建立ngram模型。然后，在同一组的其他10%数据上测试此ngram模型。结果精度在10%以下。其他9组采用相同的方法(分别建立模型，并分别在该组剩余的10%数据上进行测试)。所有结果的准确度都在10%左右。案例2：首先建立了一个基于全数据集(<

浏览 5提问于2012-05-23得票数 0

回答已采纳

1回答

拆分数据列和订单列

、

我正在尝试一些分割-应用-组合方法。如何将数据划分为不同的类别，然后按特定列的降序排序每个类别。我先把车拆了那如果我做了按顺序错误(Mpg)：找不到对象

浏览 5提问于2015-05-25得票数 2

回答已采纳

1回答

为python中的分类问题生成合成数据的适当起点

、、

我有一个包含9个特征和1300行的数据集。我正在尝试在我拥有的现有数据上生成合成数据。输出分为两个选项。即1和0，即(1-是和0-否)这里的问题是，几乎1100个案例的输出为"0“，200个案例的输出为"1”。之前，我尝试过训练，但效果并不好。我的教授建议我在合成数据上工作，并增加输出"1“的情况，以便它有助于开发机器学习模型。我对合

浏览 11提问于2019-06-19得票数 0

1回答

如何在RandomizedSearchCV中使用交叉验证拆分数据

、、

我正在尝试使用RandomizedSearchCV将我的模型从单次运行转移到超参数调优。这是正确的方法吗？我的问题是:我如何访问剩余的33%的train_input以将其提供给我的验证准确性

浏览 6提问于2018-02-10得票数 0

回答已采纳

1回答

添加控件和案例编号，而不是add_nevent()

下面的代码生成一个包含"N“和"Event N”的N列，作为单变量回归表的一部分。我有一个案例控件数据集，我希望使用" cases“和" controls”列来提供案例和控件的数量。“case”和"control“由下面代码中的变量"response”决定。例如，响应(1)=“案例”，而响应(0)=“控制”。我该怎么做呢？

浏览 13提问于2020-10-15得票数 0

回答已采纳

1回答

数据和指令是否隔离在修改过的哈佛体系结构中的数据总线中？

、、、

在经过修改的哈佛体系结构中，数据和指令(代码)一起存储在DRAM和L2缓存中，而在L1级别上是分开的。它们也都通过数据总线从DRAM传输到缓存。我读到，数据/指令可以有单独的内存控制器。但是，是否将公交线路细分为数据和指令？如果它们是分开的，那么分拆公交线路与统一线路之间的权衡又是什么呢？它们是以不同的方式实现的，还是可替代的？

浏览 5提问于2020-07-14得票数 0

回答已采纳

2回答

尝试将数据划分为训练集、测试集和验证集(按时间顺序)

、、

我有一个数据集：getSymbols('GOOG', from = "2010-05-01", to = "2017-05-01", src = "yahoo")我试图将这些数据分成训练(nrow 1:到nrow 60%的数据)、test (nrow 60%的数据到nrow 80%的数据)和最终的验证(nrow 80%的数据</

浏览 0提问于2017-11-01得票数 0

1回答

在R中创建匹配对

、

我有一个大约20,000个病例的数据集，每个病例有3个可能的对照。每个案例和控件都由一个ID变量唯一标识。我已经将数据导入到R中，并将其视为一组大约20,000个病例和大约50,000个对照，以便为数据集中与协变量(例如，年龄)匹配的每个病例仅选择一个对照。我想要的输出是第1列中的案例ID和第2列中匹配的控件ID。我一直在尝试使用MatchIt包进行匹配，但是包

浏览 0提问于2020-05-20得票数 0

1回答

设置参数控件和使用过滤器

、、、、

我目前在新南威尔士州有一个超速罚款的数据集。我已经创建了一个条形图，其中显示了超速违章的前10个频率。这些违规行为分为学校区域违规行为和正常超速违规行为。但是，条形图不会发生任何变化。

浏览 0提问于2020-08-03得票数 0

1回答

在R中拆分每小时的时间序列

、、

我正在尝试使用R将时间序列数据集拆分为训练集和测试集。数据集结构如下： Date (format = %Y-%m-%d) | Hour (24 H format) | Value 2018-09-2315 12345 我使用以下代码将此数据集转换为时间序列格式： tt <- ts(df$Value,start=c(2018

浏览 15提问于2021-04-27得票数 1

回答已采纳

1回答

什么时候使用Scala合适？

、、

Scala提取器的大多数示例都是相对简单的情况，例如：随着代码(和数据)

浏览 1提问于2016-03-02得票数 0

回答已采纳

1回答

关于团体归属的培训和测试集

然而，在我的数据集中，受试者被分为两组(病人和对照组)，因此，我希望将数据分成两组，同时保持每个培训和测试集中患者和对照组所占比例与完整数据集的比例相同。我怎样才能在R中做到这一点？如何修改以下功能，使其在将数据拆分为培训和测试集时考虑到组间的隶属关系？，并将数据集拆分为培训和测试集<

浏览 3提问于2013-09-22得票数 1

回答已采纳

2回答

拆分列表中的数据

、、

因此，我有一个数据集，我正在尝试将数据拆分为4个列表。我编写这个函数就是为了做到这一点。list1, list2, list3, list4 = map(list, zip(*newlist)) 但是，当我将n设置为4时，代码只能将数据拆分为3个列表，而当我将n设置为5时，代码将数据拆分为</em

浏览 30提问于2018-09-10得票数 0

回答已采纳

1回答

R:通过随机化组变量来拆分数据集

我有一个数据集，我需要在R中将其拆分为训练和测试集。它有许多观察值，每个观察值都有各自的时间值(Q32008，Q42008，...，Q42016)。我想将数据集一分为二，使用随机化季度，其中特定季度的所有观察结果都在一起。例如，一个数据集将包含来自Q2 2009、Q4 2010、Q1 2008的所有观测值。我尝试使用split，但是我不能随机地将它unsplit成两个唯一的

浏览 0提问于2016-11-15得票数 0

1回答

k-means算法会提高数据处理的性能吗？

、、

我正在尝试对一个大型数据集实现k-means算法，因为k-means的目标是将一组数据点划分为k个簇。我不确定是否将数据集重新划分为k-means聚类，这是否能够提高数据处理的性能？

浏览 1提问于2015-10-23得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云