开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Stata:我如何从病例对照研究的结果中生成数据集？

Stata是一种统计分析软件，用于数据管理和数据分析。在病例对照研究中，我们可以使用Stata来生成数据集。下面是一个完善且全面的答案：

病例对照研究是一种流行病学研究设计，用于比较患病个体（病例）和非患病个体（对照）之间的暴露因素。在病例对照研究的结果中，我们通常会得到每个个体的暴露情况和疾病状态。

要从病例对照研究的结果中生成数据集，可以按照以下步骤进行：

导入数据：首先，将病例和对照的数据导入Stata软件中。可以使用Stata的数据导入命令（如import）来实现。
数据清洗：对导入的数据进行清洗，包括处理缺失值、异常值等。可以使用Stata的数据清洗命令（如drop、replace）来进行数据清洗。
数据合并：将病例和对照的数据进行合并，生成一个包含所有个体的数据集。可以使用Stata的数据合并命令（如merge）来实现。
数据变换：根据病例对照研究的设计，可能需要进行一些数据变换操作，如计算变量、生成新变量等。可以使用Stata的数据变换命令（如generate、egen）来进行数据变换。
数据分析：在生成数据集后，可以使用Stata进行进一步的数据分析。可以使用Stata的统计分析命令（如regress、logit）来进行数据分析。

在使用Stata进行病例对照研究数据集生成的过程中，腾讯云提供了一系列适用于数据分析和计算的产品和服务。其中，推荐的腾讯云产品包括：

云服务器（CVM）：提供高性能、可扩展的云服务器实例，可用于安装和运行Stata软件。
云数据库MySQL版（CDB）：提供稳定可靠的关系型数据库服务，可用于存储和管理病例对照研究的数据。
弹性MapReduce（EMR）：提供大数据处理和分析的云服务，可用于处理大规模的病例对照研究数据。
人工智能机器学习平台（AI Lab）：提供丰富的人工智能算法和模型训练平台，可用于进行病例对照研究的数据分析和建模。

以上是关于如何从病例对照研究的结果中生成数据集的完善且全面的答案。希望对您有帮助！如需了解更多关于腾讯云产品和服务的信息，请访问腾讯云官方网站：https://cloud.tencent.com/

相关搜索:java-如何在不使用JDBC的情况下从数据库检索结果集？在病例对照研究中如何使用SPSS复制病例集中的数据？如何从JSON映射数据并按照我所描述的那样构建结果如何从我在Python Tkinter中生成的条目表中获取数据？如何从我的ngFor数据中生成多行？如何从数据中生成R中的图形兼容边集如何从数据库中导出巨大的结果集到几个csv文件中，并在运行时压缩它们？如何从数据集的复杂列中生成字典？如何使用TF 2.0从巨大的二进制数据中生成训练数据集？如何在R shiny上从我的数据帧中获得正确的结果？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

BP综述：自闭症中基于功能连接体的预测模型

使用多个数据集来确保结果在样本间保持不变是增加结果普遍性的一种方法。我们描述这些问题是为了提高人们的意识;我们强烈提倡公开共享数据集。...病例对照分类:侧重诊断的病例病例对照分类研究构成了大多数自闭症预测文献(表1)。这些研究的优势在于其明确的性质:参与者被正确分类或未被正确分类。...未来的方向和结论我们已经回顾了预测建模框架如何提供洞察自闭症的神经生物学相关，以及潜在的临床效用。目前，病例对照分类研究包含了大多数文献，允许观察发展趋势。...使用多个数据集来确保结果在样本间保持不变是增加结果普遍性的一种方法。我们描述这些问题是为了提高人们的意识;我们强烈提倡公开共享数据集。...病例对照分类:侧重诊断的病例病例对照分类研究构成了大多数自闭症预测文献(表1)。这些研究的优势在于其明确的性质:参与者被正确分类或未被正确分类。

4843 0

MP:精神疾病患者和正常发育人群皮层特征的共同模式

PCA产生了一个大范围的主要空间主成分（PC1），并且这个结果是跨数据集可重复的。...UKB的对照组（N = 296）从UKB的被试中选择，AUDIT < 1和其他人口统计学变量与病例组匹配。接下来，我们研究了PC1似乎在酒精依赖被试和对照组之间的病例-对照比较中占主导地位的程度。...除酒精依赖外，从已发表的结果中提取了之前6项研究的病例-对照比较效应量，包括13652例病例和19878例对照。...病例-对照比较区域CT的效应量及其与联合PC1的相关性。A. 使用ENIGMA和UKB数据集计算的酒精依赖（ALCgc）的病例-对照比较的效应大小。B....此外，目前的发现揭示了重新检查大型现存数据集来检测可重复的低维模式的效用，这可能对精神疾病有重要意义。在两个独立数据集的病例-对照比较显示了与酒精依赖相关的较低CT的模式。

3651 0

孟德尔随机化之Wald ratio方法（三)

在这里，我将使用流行病学术语定义具有结局事件的个体为病例（Y=1），将没有结局事件发生的个体作为对照（Y=0）。...4.1.4 回顾性研究或病例-对照研究数据在孟德尔随机研究中，我们通常仅使用回顾性数据中未患病的个体（如病例对照研究中的对照人群）推断基因与暴露的关联。...这么做主要是因为两个方面：（1）反向因果关系：结局事件可能会使结局发生后测量出的暴露值失真；（2）在病例对照的情况下，研究人员通常会尽可能多地纳入病例，这也意味着纳入人群中的混杂因素分布与普通人群中的混杂因素分布不同...如果结局事件很普遍，并且已知其在总人群中的发病率，则可以同时使用病例和对照数据去获取基因与暴露的关联。...如果D> 0并且f1<0，则95％置信区间是从负无穷大到（f2 +√D）/ f1和从（f2-√D）/ f1到正无穷大两个区间的并集。

1.2K3 0

乳腺癌DNA甲基化分子标志物研究~

数据介绍本研究从14个欧洲中心收集了329例预后不良的原发性乳腺癌患者的样本，869名非乳腺癌女性(图1)。并且本研究自测了相关的DNA甲基化数据。...分类器在发现数据集的三分之二（572 例对照，217 例乳腺癌病例）上进行训练，其余三分之一用作内部验证集（297 例对照，112 例病例）（图 1）。...由 225 名对照和 113 名乳腺癌病例组成的单独独立外部验证数据集用于验证WID-BC-index表现（图 1）。图 1 技术路线本研究技术路线如图所示。...在这些卵巢癌和子宫内膜癌病例以及同样来自乳腺癌内部验证集的297个对照样本中，本研究分别获得了 0.69（图 4c 和 d）和 0.58（图 4e、f）的 AUC，卵巢癌组的子成分遵循与乳腺癌病例相似的模式...在来自内部验证集的 107 例病例和 280 例对照中，本研究发现对照中的 PRS 和 WID-BC-index 之间存在显著的相关性（图 5b），而病例中没有显著相关性。

3083 0

孟德尔随机化之高密度脂蛋白胆固醇（HDL-C）与心肌梗死的因果关系

‍今天这篇文献主要是为了和大家探讨一下在MR研究中我们如何看待SNP（IV）的数量。...研究设计作者分析了6项前瞻性研究和14项横断面研究的个体数据，包括20 913例心肌梗死病例和95 407例对照，不过这里IV分析假设的评估是在更大的一组研究中进行的。...采用这两种分析的另一个实际原因是，由于缺失一个或多个遗传变异的数据，第二种分析在更小的参与者子集中进行，包括12 482个心肌梗死病例和41 331个对照，因此构建基因风险分数来增加统计效力。...结果从流行病学的观察性结果来看，内皮脂肪酶基因中每个遗传变异等位基因的预期优势比(OR)为0.87 (95%置信区间为0.84 ~ 0.91)。...从孟德尔随机化中，对等位基因评分，HDL-C每增加1个标准偏差，那么预期的流行病学OR值为0.62（95%置信区间为 0.58~0.66)，而孟德尔随机化研究的结果则是OR为0.93（95%置信区间为0.68

6593 0

Nature neuroscience：精神疾病脑异常的局部、回路和网络异质性

摘要：典型的病例对照研究往往忽略了精神疾病患者的个体异质性，这种研究依赖于群体均值比较。...结果2.1 样本特征我们检查了1465例hcc(54.47%为男性)和1294例病例的数据，这些数据来自14项不同的研究和25个不同的扫描点。...与病例相比，对照组中很少有区域显示出更大的异常相关FC重叠。另一种将FC结果映射到分割区域的方法产生了类似的结果。...因此，采用不同的获取、招募和临床评估方案收集数据。为了避免引入扫描部位和诊断组之间的依赖关系，这可能会混淆病例-对照比较，我们主要关注在同一台扫描仪上获得的对照数据和临床数据。...然后使用这些估计来量化测试子集中样本的偏差，测试子集通常由从训练集的规范人口统计范围中抽样的案例组成。当使用多站点数据时，与扫描仪和站点相关的可变性会引入人为的方差，从而混淆任何后续分析的结果。样本。

3383 0

Nature：人类一生中的脑图形态变化

研究结果发现：从妊娠中期开始，脑灰质（脑细胞）的体积迅速增加，并5.9岁时达到顶峰，然后体积开始缓慢下降。从妊娠中期到儿童早期，脑白质（大脑连接）的数量也迅速增加，并在28.7岁时达到峰值。...图3：神经发育里程碑个体化百分位数利用与年龄相关的标准化脑图进行了基准测试，计算了个体化百分位分数。汇总数据集的临床多样性，使研究能够全面分析百分位数得分的病例-对照差异。...相对于对照组(CN)，在诊断为多种疾病的大(N>500)病例组中，百分位数得分存在显著差异（图4）。临床病例对照分析中，皮质厚度和表面积的差异，与体积组间差异的趋势类似。...精神分裂症的CMD在总体上排名第三，仅次于阿尔茨海默病和轻度认知障碍(MCI)(图4c)。在生命周期的所有主要时期中，无论诊断类别如何，病例中的CMD始终高于对照组。...总结研究汇总了迄今为止最大的神经成像数据集，用于构建典型和非典型的人类大脑发育和衰老的标准人脑图表。研究结果表明，利用构建的人脑标准图表，可以通过MRI按年龄和性别记录脑图像的正常变化速率和方向。

5733 0

北大数据分析老鸟写给学弟们一封信

首先，它是专业的统计软件，对“万”甚至“十万”样本量级别的数据集都能应付自如；其次，它是统计软件而非专业的计量软件，因此它的强项在于数据清洗、描述统计、假设检验（T、F、卡方、方差齐性、正态性、信效度等检验...STATA与EVIEWS都是我偏好的计量软件。...随机实验设计方法能够在最大程度上保证干预组与对照组的相似性，得出的研究结论更具可靠性，更具说服力。...从准确度角度来说，随机实验的准确度高于准实验和非实验分析。关于分析工具的选择如果根据理论或逻辑已经预设了变量间的因果关系，那么就无需使用实验方法。我对非实验数据分析工具的选择原则如下。...某些“诡异的”、不合常理的数据分析结果，很可能就是研究最重要的所得。以上，如有错误，敬请指正；如有补充，欢迎留言，我会加进文中。后记：过完年就要去工作了，每想及此就颇为伤感。

1.6K4 0

北大数据分析老鸟写给学弟们一封信

首先，它是专业的统计软件，对“万”甚至“十万”样本量级别的数据集都能应付自如；其次，它是统计软件而非专业的计量软件，因此它的强项在于数据清洗、描述统计、假设检验（T、F、卡方、方差齐性、正态性、信效度等检验...STATA与EVIEWS都是我偏好的计量软件。...随机实验设计方法能够在最大程度上保证干预组与对照组的相似性，得出的研究结论更具可靠性，更具说服力。...从准确度角度来说，随机实验的准确度高于准实验和非实验分析。关于分析工具的选择。如果根据理论或逻辑已经预设了变量间的因果关系，那么就无需使用实验方法。我对非实验数据分析工具的选择原则如下。...某些“诡异的”、不合常理的数据分析结果，很可能就是研究最重要的所得。以上，如有错误，敬请指正；如有补充，欢迎留言，我会加进文中。后记：过完年就要去工作了，每想及此就颇为伤感。

1.6K10 0

北大老鸟三年数据分析深刻总结——致学弟学妹们

首先，它是专业的统计软件，对“万”甚至“十万”样本量级别的数据集都能应付自如；其次，它是统计软件而非专业的计量软件，因此它的强项在于数据清洗、描述统计、假设检验（T、F、卡方、方差齐性、正态性、信效度等检验...STATA与EVIEWS都是我偏好的计量软件。...随机实验设计方法能够在最大程度上保证干预组与对照组的相似性，得出的研究结论更具可靠性，更具说服力。...随机实验需要至少两期的面板数据，并且要求样本在干预组和对照组随机分布，分析方法就是DID（倍差法，或曰双重差分法）；准实验分析用截面数据就能做，不要求样本在干预组和对照组随机分布，分析方法包括DID（需两期的面板数据...某些“诡异的”、不合常理的数据分析结果，很可能就是研究最重要的所得。以上，如有错误，敬请指正。后记：过完年就要去工作了，每想及此就颇为伤感。

3K6 0

Nature medicine：基于可穿戴运动追踪数据早期识别帕金森疾病

此外，大多数研究倾向于将前驱PD患者与没有任何合并症的对照组进行比较，这限制了这些研究结果的转化有效性和现实适用性。...从完整的UKBB数据集开始，我们首先关注那些有加速度计数据的人，他们根据我们的诊断提取方法被分配到不同的组。接下来是三种不同的分析。...从未受影响的对照组中，我们随机抽取年龄和性别匹配的个体作为PD。仅包括通过加速度计数据质量控制的参与者。健康相关结果数据可获得至2021年3月。...我们在五个交叉验证测试集上报告了随时间变化的AUROC(图5d-f)和综合Brier评分(补充图20)。这些指标是通过动态定义几个时间点的病例和对照来计算的，在PD诊断时，对照过渡到病例。...这在很大程度上与缺乏另一个在规模和数据量方面相当于UKBB的数据集有关，该数据集将允许对多种疾病的前驱期进行回顾性研究。

2932 0

R语言分布滞后线性和非线性模型（DLM和DLNM）建模|附代码数据

数据集分别包含一项关于药物的假设试验和嵌套病例对照研究的模拟数据，两者均包括随时间变化的暴露量度。...数据集还包含有关在第28天测量的结果和受试者性别的信息。嵌套的第二个数据包括针对300个癌症病例和300个按年龄匹配的对照的每个记录。...根据研究设计和随时间变化的暴露信息，需要以不同的方式将这个n×（L −'0 + 1）矩阵组合在一起。在第一个示例中，我为数据框药物中的试验数据建立了暴露历史记录矩阵。...时间序列以外的应用一个简单的DLM 在第一个示例中，我将dlnm应用于数据集药物，分析了药物日剂量与未指定健康结果之间的时间依赖性。...更为复杂的DLNM 在第二个示例中，我使用嵌套的数据集来评估长期暴露于职业病中如何影响癌症发生的风险。分析步骤与说明的步骤相同。

5311 0

仅2张图分析如何发到顶刊PNAS？

of America（IF=9.412）上的一篇文章：“Assessing thyroid cancer risk using polygenic risk scores”，作者通过对甲状腺癌样本数据集的...）和英国（534例患者和407945例对照）的三个PTC研究组中的GWAS结果，建立的多基因风险评分(PRS)模型去评估这些变异对PTC风险的联合遗传效应。...基于LDpred方法估计了592,475个常见SNP的PRS，调整了连锁不平衡影响的GWAS汇总统计量，并从中发现10-SNP和592K-SNP的PRSs在甲状腺病例组和对照组中大致呈正态分布，在3个研究组中甲状腺癌病例组和对照组间差异均有统计学意义...附图S1 甲状腺癌病例组（实线）和对照组（虚线）的多基因风险评分分布 3.预测模型中的PRS 为了研究PRSs的预测能力，作者使用ROC曲线评价了预测模型。...图2 从俄亥俄州、冰岛和UKB研究组的Meta分析结果获得的甲状腺癌状态的10-SNP PRS十分位的OR估计值，使用底部10-SNP PRS十分位(0-10%)作为参照组（显示为水平实线）小结

6222 0

R语言分布滞后线性和非线性模型（DLM和DLNM）建模

数据主要通过两个示例来说明软件的应用，使用药物数据作为数据对象。数据集分别包含一项关于药物的假设试验和嵌套病例对照研究的模拟数据，两者均包括随时间变化的暴露量度。...数据集还包含有关在第28天测量的结果和受试者性别的信息。嵌套的第二个数据包括针对300个癌症病例和300个按年龄匹配的对照的每个记录。...根据研究设计和随时间变化的暴露信息，需要以不同的方式将这个n×（L −'0 + 1）矩阵组合在一起。在第一个示例中，我为数据框药物中的试验数据建立了暴露历史记录矩阵。...时间序列以外的应用一个简单的DLM 在第一个示例中，我将dlnm应用于数据集药物，分析了药物日剂量与未指定健康结果之间的时间依赖性。...更为复杂的DLNM 在第二个示例中，我使用嵌套的数据集来评估长期暴露于职业病中如何影响癌症发生的风险。分析步骤与说明的步骤相同。

4.8K1 0

R语言分布滞后线性和非线性模型（DLM和DLNM）建模|附代码数据

数据主要通过两个示例来说明软件的应用，使用药物数据作为数据对象。数据集分别包含一项关于药物的假设试验和嵌套病例对照研究的模拟数据，两者均包括随时间变化的暴露量度。...数据集还包含有关在第28天测量的结果和受试者性别的信息。嵌套的第二个数据包括针对300个癌症病例和300个按年龄匹配的对照的每个记录。...根据研究设计和随时间变化的暴露信息，需要以不同的方式将这个n×（L −'0 + 1）矩阵组合在一起。在第一个示例中，我为数据框药物中的试验数据建立了暴露历史记录矩阵。...时间序列以外的应用一个简单的DLM 在第一个示例中，我将dlnm应用于数据集药物，分析了药物日剂量与未指定健康结果之间的时间依赖性。...点击标题查阅往期内容 R语言里的非线性模型：多项式回归、局部样条、平滑样条、广义相加模型GAM分析 01 02 03 04 更为复杂的DLNM 在第二个示例中，我使用嵌套的数据集来评估长期暴露于职业病中如何影响癌症发生的风险

8290 0

韩国科研团队：超90%的医学影像AI论文未在临床环境进行严格验证

，并且在外部验证的情况下，是否收集验证数据；2）是否使用诊断队列设计而不是诊断病例对照设计；3）是否来自多个机构；4）是否以前瞻性的方式。...因此，开发此类AI算法的个体可能依赖于任何可用的数据（方法上称为便利病例 - 对照数据 convenience case-control data），尽管这些可能易于发生选择偏倚和人为疾病流行（artificial...数据提取两位评审员通过以下标准评估了符合条件的文章的全文：1）该研究是否使用外部验证而不是内部验证，并且在外部验证的情况下，是否收集验证数据，2）是否使用诊断队列设计而不是诊断病例对照设计，3）是否来自多个机构...对于在同一机构收集训练和验证数据集的研究，如果验证数据集的临床设置和患者资格标准与训练数据集分开指定，则验证数据仅被视为外部数据。...诊断病例对照设计容易出现疾病谱偏倚，这可能导致对诊断性能的夸大估计和非自然流行，从而产生诊断性能的不确定性（12,26）。

7993 0

单细胞转录组揭示系统性红斑狼疮的特定细胞类型的基因表达变化

将另外100个病例与154例对照进行比较，发现淋巴细胞丰度显著降低，但单核细胞丰度无差异为了评估淋巴细胞减少和SLE之间是否存在因果关系，作者将遗传数据与免疫细胞组成使用 GSMR 包进行分析。...为了进一步调查CD8GZMH和CD8GZMK的克隆性，作者对T细胞受体（TCR）的CDR3区域进行扩增测序，从10.2%的CD4和8.7%的CD8获得配对的TCRA和TCRB序列。...I 型干扰素刺激 SLE 中骨髓细胞的基因表达在病例和对照组中，髓系细胞表现出最多的DEG，为了进一步研究其异质性，作者将髓系细胞重新聚集为6个亚群：单核细胞系（cM：CD14+；ncM：FCGR3A...为了对病例进行分子分型，作者进行了表达特征的主成分分析，然后进行K-means聚类成2个群体，发现PC1与Panup、Myeup和Bup模块中的基因相关最多，其中包括IFITM3的髓系特异性表达。...通过对cis-eQTLs和全基因组关联研究结果的联合分析，可以识别与免疫疾病治疗相关的细胞类型，对疾病相关位点进行精准定位，使发现新的SLE相关性位点成为可能。

3723 0

一篇多芯片生信分析（meta）

从PubMed，谷歌学术，中国国家知识基础设施（CNKI），重庆VIP电子（VIP）和中国万方数据库中检索到相关研究。Fig 1显示了该研究的工作流程。 ?...此外，Stata 12.0软件用于对来自多个来源（芯片，文献，miRNA测序和RT-qPCR）的数据进行全面的meta分析。...结果确认microRNA-144-3p在非小细胞肺癌中的表达和临床价值， MicroRNA-144-3p在非小细胞肺癌中的表达通过GEO获得来自GEO数据库的19个geo数据集符合纳入标准。...纳入的GEO数据集特征展示在Tbale1中。其中，14个数据集来源于从组织，5个来自血液（GSE27486，GSE40738，GSE64951，GSE93300和GSE114711）。...通常，漏斗图是对称的，并且从Begg和Egger的测试中获得的p值分别为0.833和0.335。总之，结果表明研究的发表偏倚是可控的 ?

2.5K3 1

meta分析一般步骤

大家好，又见面了，我是你们的朋友全栈君。 Meta分析总体可分为以下几步：选题，文献检索、数据提取、质量评估、数据整合及结果解读。...确定语言类型：包括所有英语和非英语的文献； 3. 明确需要包含的研究类型：仅包含RCT，还是病例对照试验，队列研究等。 4. 明确暴露因素/治疗方法 5....观察性研究的质量评价工具：（1）NOS量表（最常用）：病例对照研究和队列研究；（2）CASP清单：病例对照研究和队列研究；（3）JBI标准：横断面研究；经验总结、案例分析及专家意见；（4）AHRQ...对数据的整合分为描述性整合和定量整合：对于描述性整合，应考虑： • 建立干预/暴露因素是如何导致结果的假说，包括原因和适用人群； • 初步综合纳入的研究，以文本形式或者制表和／或图形显示； •...c．图示单个试验的结果和合并后的结果：森林图（Forrest plot） d．敏感性分析：用来评估meta分析结果的稳定性 1）按研究质量评价标准从纳入文献中去除尚有争议的研究、排除低质量的研究、早期研究

6903 0

JAMA Psychiatry：六种精神疾病中皮层厚度的虚拟组织学及共同的神经生物学过程

二、研究目标确定6种精神疾病中病例组和健康对照组之间皮层厚度的群体差异在神经生物学上的相关性，这6种精神疾病包括注意力缺陷多动障碍(ADHD)、自闭症谱系障碍(ASD)、双相情感障碍(BD)、...磁共振成像上和遗传上的相似性对于每种疾病病例组与对照组在皮层厚度上的组间差异，首先使用R包WGCNA中的biweight midcorrelation来分析这些组间差异的相关性，得到两两疾病间的相关性矩阵...从Allen Human Brain Altas获取脑组织基因表达的数据并按照Desikan-Killiany脑区模板对应到相应脑区，此数据来源于6个捐赠者，年龄从25到57岁，经过两个阶段的过滤后，剩下...，每个通路基因数目最少设置为10，最多设置为500个；接着从DisGeNet数据库种获取与ADHD、ASD、BD、MDD、OCD和SCZ相关的基因集，用超几何分布检验共表达基因是否富集在这6个与不同精神疾病关联的基因集中...五、结果 1.

7760 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭