首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何使用lubridate为缺失的参与者数据创建行(纵向研究)?

lubridate是一个R语言的日期和时间处理包,它提供了一系列方便的函数来处理日期和时间数据。在纵向研究中,有时候会遇到缺失的参与者数据,我们可以使用lubridate来创建这些缺失数据的行。

首先,我们需要安装和加载lubridate包:

代码语言:txt
复制
install.packages("lubridate")
library(lubridate)

接下来,假设我们有一个数据框df,其中包含了参与者的ID和参与日期。我们想要为缺失的参与者数据创建行,可以按照以下步骤进行操作:

  1. 首先,我们需要确定参与者的ID范围,可以使用unique()函数获取唯一的参与者ID列表:
代码语言:txt
复制
participant_ids <- unique(df$participant_id)
  1. 接下来,我们需要确定参与日期的范围,可以使用min()max()函数获取最早和最晚的参与日期:
代码语言:txt
复制
start_date <- min(df$date)
end_date <- max(df$date)
  1. 然后,我们可以使用expand.grid()函数创建一个包含所有可能的参与者ID和日期组合的数据框:
代码语言:txt
复制
all_combinations <- expand.grid(participant_id = participant_ids, date = seq(start_date, end_date, by = "day"))
  1. 接下来,我们可以使用merge()函数将原始数据框df和新创建的数据框all_combinations进行合并,使用all = TRUE参数表示保留所有行:
代码语言:txt
复制
new_df <- merge(df, all_combinations, by = c("participant_id", "date"), all = TRUE)
  1. 最后,我们可以使用arrange()函数对新的数据框按照参与者ID和日期进行排序:
代码语言:txt
复制
new_df <- arrange(new_df, participant_id, date)

至此,我们已经成功使用lubridate为缺失的参与者数据创建了行。新的数据框new_df包含了所有参与者的所有日期,缺失的数据用NA表示。

在腾讯云的云计算平台中,可以使用云服务器CVM来进行数据处理和分析。腾讯云的CVM产品提供了高性能的计算资源,可以满足各种规模的数据处理需求。您可以通过以下链接了解更多关于腾讯云云服务器CVM的信息:

腾讯云云服务器CVM产品介绍

请注意,本回答中没有提及其他云计算品牌商,如有需要可以自行搜索相关信息。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • Nature子刊:一个从大脑结构中识别阿尔茨海默病维度表征的深度学习框架

    脑部疾病的异质性是精准诊断/预后的一个挑战。作者描述并验证了一种名为Smile-GAN(SeMI-supervised cLustEring-Generative Adversarial Network),的半监督深度聚类方法,它研究了与正常大脑结构对比的神经解剖学异质性,从而通过神经影像特征识别疾病亚型。当应用于来自T1加权MRI的区域体积时(两项研究;2832名参与者;8146次扫描),包括认知正常的人和那些有认知障碍和痴呆症的人,Smile-GAN确定了四种神经变性模式。将此框架应用于纵向数据揭示了两种不同的进展途径。这些模式的表达测量预测了未来神经变性的途径和速度。模式表达在预测临床进展方面提供了与淀粉样/tau蛋白互补的性能。这些深度学习衍生的生物标志物为精确诊断和有针对性的临床试验招募提供了潜力。

    05

    PNAS:控制缺乏情感的肢体语言的大脑回路

    适应性社会行为和心理健康不仅依赖于对情绪表达的识别,而且依赖于对情绪缺失的推断。虽然承销情绪感知的神经生物学已经得到了很好的研究,但在社会信号中检测缺乏情绪内容的机制仍在很大程度上是未知的。在这里,使用大脑有效连接的先进分析,我们揭示了区分中性和情感的肢体语言的大脑网络。数据显示,相对于情绪性肢体语言,右侧杏仁核和小脑蚓中线更活跃。最重要的是,杏仁核和脑岛之间的有效连接预测了人们识别没有情绪的能力。这些结论在很大程度上扩展了当前的情绪感知概念,表明在识别肢体语言阅读中缺乏情绪时,使用了边缘有效连接。此外,通过提供肢体语言阅读和边缘通路之间缺失的环节,该结果可能会促进对抑郁症或精神分裂症中过度情绪化的社会信号的理解。因此,这项研究为从动物模型到神经精神疾病患者社会认知和潜在的小脑网络的多学科研究开辟了一条道路。

    00

    NC:预测阿尔茨海默病的个体进展轨迹

    对阿尔茨海默病(AD)进展的预期对于评估二级预防措施是至关重要的,因其被认为可以改变疾病的发展轨迹。然而,很难预测AD的自然进展,特别是不同的功能在不同的年龄下降,不同患者的发生率不同。我们在这里评估了AD进程映射,这是一个统计模型,根据当前疾病早期阶段的医学和放射学数据,预测患者的神经心理评估和成像生物标志物的进展。我们对96000多例患者进行了该方法的测试,其中包括来自四大洲的4600多名患者。我们测量了方法准确性通过选择了在一个假设的试验中显示临床端点进展的被试。我们发现,使用预测进展者丰富人群可以使所需的样本量减少38%至50%,这取决于试验时间、结果和目标疾病阶段,从无症状的AD风险个体到早期和轻度AD被试。我们表明,该方法没有引入关于性别或地理位置的偏差,并且对缺失的数据是稳健的。它在疾病的早期阶段表现最好,因此非常适合用于预防试验。

    01

    大脑和行为个体化模型的精神病学生物标志物识别

    转化神经科学的一个主要目标是识别精神病理学的神经相关因素(“生物标志物”),可用于促进诊断、预后和治疗。这一目标已经导致了对精神病理学症状如何与大规模的大脑系统相关的大量研究。然而,这些努力还没有产生在临床实践中使用的实际生物标志物。这一令人失望的进展的一个原因可能是,许多研究设计关注的重点是增加样本量,而不是在每个个体中收集额外的数据。这一焦点限制了任何一个人的大脑和行为测量的信度和预测效度。由于生物标记物存在于个体的水平上,因此更加关注在个体中验证它们是有必要的。我们认为,从个人内部的大量数据收集中估计出来的个性化模型可以解决这些问题。我们回顾了来自两个迄今为止独立的关于(1)精神病理症状和(2)大脑网络功能磁共振成像测量的个性化模型研究的证据。最后,我们提出了跨两个领域的方法,以改进生物标志物研究。

    03

    Cerebral Cortex:老年人生活方式与脑功能连接的关系及其与认知能力下降的联系

    本研究探讨了参与不同生活方式活动与大范围脑功能网络连接的关系,以及网络连接是否独立于脑淀粉样蛋白水平而改善认知能力下降。参与者(N = 153,平均年龄= 69岁,包括N = 126淀粉样蛋白成像)在完成静息状态功能磁共振成像、生活方式活动问卷和认知测试后,认知正常。他们每年接受长达5年的认知测试(平均= 3.3年)。线性回归表明,认知活动参与与背侧注意网络内的连接,以及身体活动水平与默认模式、边缘和额顶叶控制网络内的连接以及全局网络内连接之间存在正相关关系。此外,较高的认知和身体活动水平与较高的网络模块化(功能网络专业化的衡量指标)独立相关。这些相关性在很大程度上独立于APOE4基因型、淀粉样蛋白负担、全脑萎缩、血管风险和认知储备水平。此外,背侧注意、默认模式和边缘网络的高连通性,以及更大的全局连通性和模块化与认知能力下降相关,与APOE4基因型和淀粉样蛋白负担无关。这些发现表明,大脑功能连接的变化可能是生活方式活动减少认知能力下降的机制之一。

    02

    Molecular Psychiatry|青少年焦虑发作:一项机器学习预测

    最近对青少年的纵向研究报告了MRI与青春期前瞻性焦虑症状的相关性,而青春期是焦虑障碍发病的易感时期。然而,它们的预测价值尚未确定。通过机器学习算法进行个体预测可能有助于缩小与临床相关性之间的差距。采用随机森林、支持向量机和逻辑回归算法的投票分类器,评估感兴趣的灰质体积和心理测量学评分在检测前瞻性临床焦虑中的预测相关性。研究对象为年龄18 ~ 23岁的临床焦虑患者(N = 156)和健康对照者(N = 424)。提取Shapley值对特征重要性进行深度解读。对合并焦虑障碍的前瞻性预测主要依赖于心理测量学特征,达到了中等水平(受试者工作曲线下面积= 0.68),而广泛性焦虑障碍(GAD)的预测达到了相似的性能。仅就心理测量学特征而言,MRI局部体积并不能改善前瞻性合并焦虑症的预测性能,但它们改善了GAD的预测性能,其中尾状核和苍白球体积是贡献最大的特征之一。总之,在非焦虑的14岁青少年中,未来4-8年的临床焦虑发作可以个体化预测。心理测量学特征如神经质、绝望和情绪症状是汇总焦虑障碍预测的主要贡献因素。神经解剖学数据,如尾状核和苍白球体积,已被证明对GAD有价值,应纳入前瞻性临床焦虑预测。

    04

    Cerebral Cortex:额顶控制网络的网络间作用可以很好地预测记忆抑制能力

    记忆抑制(Memorysuppression,MS)与精神健康相关。然而,没有研究探索内在静息态功能连接(resting-state functional connectivity,rs-FC)如何预测这种能力。本文基于rsfMRI脑功能连接组预测模型(connectome-based predictivemodeling,CPM)来探究预先定义脑网络(额顶控制网络或FPCN)中的rs-FC图谱是否能以及如何预测健康个体的MS(497名参与者)。在think/no-think范式中,使用由MS导致的遗忘来评估MS能力。结果表明,FPCN网络有利于建立MS预测模型。FPCN中的一些区域,如额中回、额上回和顶下叶在预测MS能力中起着重要作用。此外,FPCN与多个网络(如背侧注意网络(DAN)、腹侧注意网络(VAN)、默认模式网络(DMN)、边缘系统和皮下层区域)间的功能相互作用能够预测MS。关键的是,用于预测的FPCN网络是稳定的并对MS是特定的。这些结果表明FPCN与其他网络相互作用能够表明MS能力。这些结果有助于解释这些功能网络的相互作用是如何导致某些精神障碍中的特定入侵性思维和记忆的。

    00

    建立脑影像机器学习模型的step-by-step教程

    机器学习的日益普及导致了一些工具的开发,旨在使这种方法的应用易于机器学习新手。这些努力已经产生了PRoNTo和NeuroMiner这样的工具,这并不需要任何编程技能。然而,尽管这些工具可能非常有用,但它们的简单性是以透明度和灵活性为代价的。学习如何编程一个机器学习管道(即使是一个简单的)是一个很好的方式来洞察这种分析方法的优势,以及沿着机器学习管道可能发生的扭曲。此外,它还允许更大的灵活性,如使用任何机器学习算法或感兴趣的数据模式。尽管学习如何为机器学习管道编程有明显的好处,但许多研究人员发现这样做很有挑战性,而且不知道如何着手。

    05

    Nature neuroscience:功能脑组织表征的挑战和未来方向

    摘要:大脑组织的一个关键原则是将大脑区域的功能整合成相互关联的网络。在休息时获得的功能MRI扫描通过自发活动中的相干波动模式,即所谓的功能连接,提供了对功能整合的见解。这些模式已被深入研究,并与认知和疾病有关。然而,这个领域是细分的。不同的分析方法将对大脑进行不同划分,限制了研究结果的复制和临床转化。这种划分的主要来源是将复杂的大脑数据简化为用于分析和解释的低维特征集的方法,这就是我们所说的大脑表征。在本文中,我们提供了不同大脑表征的概述,列出了导致该领域细分和继续形成汇聚障碍的挑战,并提出了统一该领域的具体指导方针。 1.简述 静息态MRI的研究领域是分级的,关于预处理流程、脑分区方法、后处理分析方法和端点都存在争议。这个问题的主要来源是脑表征的挑战。磁共振产生大量的高维数据,一个主要的分析任务是从测得的脑活动的巨大的复杂度中提取可解释的内容。此处我们用“脑表征”来描述这个降维过程。脑表征是一个采集的MRI数据的多层面描述,包括脑单元的空间定义(分区)和在脑单元水平提取可解释特征的总体测度(如配对相关)。如何表征脑数据从根本上奠定了脑功能和组织的描述。 脑的表征经常被考虑为映射问题,旨在消除功能和神经组织的神经解剖不同区域的边界。然而,脑表征包括了表征形式以及数据如何转化成这些表征。本文旨在为该领域的一致性和可重复性提供一个rfMRI表征挑战的入门。 2.脑表征入门 脑表征可以将采集得到的BOLD数据减少为一组特征进行分析。许多脑表征识别:1)一组低维脑单元(空间分区)2)应用在脑单元水平的一组测度组合(配对相关)。这些特征用于后面的统计或预测分析。用“脑单元”来指代任意空间上定义的神经实体,可以被当作一个基础的功能处理单元。“测度组合”作为计算特征的方法,相对于脑单元定义。组合测度用来回答研究问题,因此是相对“特定领域”的。一小部分脑表征不用脑单元和组合测度,而用估计特征,可以代表活动的复杂的时空模式。 2.1定义一个脑单元 rfMRI空间分辨率轻松可达2x2x2mm³,这会在全脑得到约100000体素。rfMRI中,这些体素(或顶点)是最小的可测脑单元。然而其并不代表具体的神经解剖层级水平。因此会将体素或顶点单元组合成更小的脑单元集合来实现有意义的低等级脑表征。 脑单元可能在空间上相邻或不相邻。相邻脑单元与功能具体皮层区域一致(图1a),不相邻脑单元可以捕捉层级组织的和大的半球对称脑的复杂网络结构(图1b)。脑单元可以是二值化(一个体素或顶点被分配到一个单元)的或加权的(体素或顶点根据其权重对多个单元有贡献)。 很多方法可以来定义脑单元。明显的选择是根据基于组织学、病变、褶皱或其他特征定义的图集的分区。但这些图集源于小部分人,且解剖上定义的边界与功能组织不一定匹配。很多方法用功能数据来定义分区,包括ICA,PCA,非负矩阵分解,概率功能模块或字典学习。这种分区依赖于自发BOLD波动,限制了其适用性。用解构、静息、任务结合的多模态方法可能提供广泛性更好的分区。

    00

    Nature子刊:临床前家族性阿尔兹海默症患者的功能性大脑老化加速

    即将发展为阿尔兹海默病(AD)痴呆人群的静息态功能连接(rs-fMRI)在早期就已经出现异常。这种异常可能有助于AD的临床前研究。本文运用静息态(rs)fMRI数据得到了一个预测大脑年龄的模型,并评估了AD的遗传决定因素和淀粉样蛋白(A)病理学是否会加速大脑老化。使用从多地得到的1340名(年龄在18-94岁)认知未受损的参与者数据,结果表明根据rs-fMRI构建的图的拓扑属性可以预测整个生命周期上的年龄。将预测模型应用于临床前AD,结果表明常染色体显性AD的症状前阶段存在功能性大脑老化加速。这种联系在有明显A病变的个体中更强。

    04

    数字货币可不只是区块链的全部!聪明人已经把它用到了业务中

    接收程序员的 8 点技术早餐 人类的历史,即分久必合,合久必分。 2017 年,比特币因行情疯长火热一时。2018 年伊始,其使用的底层技术区块链又迎来狂欢:从国内创投人到硅谷投资者,从 BAT 到互联网企业众生,都纷纷加入这场技术的斗艳中。 在去中心化技术给这个时代带来新革命的同时,区块链也在更多的行业施展拳脚,利用去中心化计算机系统来创建安全、可验证和永久的交易记录,从而解决不透明或非可信问题。从本质上讲,它创建了一个安全的、分布式的信息和交易记录数据库。 对于交易不透明等问题,广告行业存在的欺诈流量、

    010

    利用无创性头皮脑电图可以快速定位神经静默

    一种快速、经济、非侵入性的检测和表征神经静默的工具在诊断和治疗许多疾 病方面具有重要的益处。我们提出了一种名为SilenceMap的算法,用于使用非侵入性头皮脑电图(EEG)信号揭示电生理信号或神经静默的缺失。通过考虑不同来源对记录信号功率的贡献,并使用半球基线方法和凸谱聚类框架,SilenceMap允许使用相对少量的EEG数据快速检测和定位大脑中的静默区。SilenceMap在使用不到3分钟的脑电图记录(13、2和11 mm对25、62和53 mm)以及对基于真实人体头部模型的100个不同模拟静默区域(12±0.7 mm对54±2.2 mm)进行估计方面,大大优于现有的源定位算法。SilenceMap为可访问的早期诊断和持续监测人类皮质功能的改变的生理特性铺平了道路。 1.简述 本文利用数据相对较少的头皮脑电(EEG)信号,为神经静默的非侵入性检测提供了理论和实验支持。我们采用静默或静默区域这一术语来指代大脑组织中神经活动很少或没有活动的区域。这些区域反映缺血、坏死或病变组织、切除的组织(例如,癫痫手术后)或肿瘤。皮质扩散去极化(CSD)也出现动态静默区,这是大脑皮层缓慢传播的静默波。 脑电图被越来越多地用于诊断和监测神经疾病,如中风和脑震荡。用于检测脑损伤的常用成像方法(例如磁共振成像(MRI)或计算机断层扫描)不是便携式的,不是为连续(或频繁)监视而设计的,在许多紧急情况下难以使用,甚至可能在许多国家的医疗机构中不可用。然而,许多医学场景可以受益于便携式、频繁/持续的神经静默监测,例如,检测肿瘤或病变大小/位置和CSD传播的变化。然而,非侵入性头皮脑电图在紧急情况下可以广泛使用,甚至可以在现场部署,但只有几个限制。与其他成像方式相比,它安装简单快捷,携带方便,成本较低。此外,与MRI不同的是,EEG可以从体内植入金属物体的患者身上记录下来,例如起搏器。 源定位VS静默定位。脑电图的一个持续挑战是源定位,即根据头皮脑电图记录确定潜在神经活动的位置的过程。挑战主要来自三个问题:(i)问题的性质不明确(传感器很少,源的可能位置很多);(ii)大脑和头皮之间的距离和层的空间低通滤波效应;以及(iii)噪声,包括外部噪声、背景脑活动以及伪像,例如心跳、眼球运动和咬合下巴。在应用于神经科学数据的源定位范例中,例如在事件相关电位范例中,头皮EEG信号在事件相关试验上聚集以求出背景脑活动和噪声的平均值,从而允许提取跨试验一致的信号活动。静默区的定位带来了额外的挑战,其中最重要的是如何处理背景脑活动:虽然在源定位中它通常与噪声归为一类(例如,有文章指出:“脑电数据总是受到噪声的污染,例如,外源性噪声和背景脑活动”),在静默定位中,估计背景活动存在的位置是直接感兴趣的,因为静默定位的目标是将正常的大脑活动(包括背景活动)从异常静默中分离出来。因为源定位忽略了这种区别,正如我们在下面的实验结果中所展示的那样,经典的源定位技术,例如多信号分类(MUSIC)、MNE(MNE)和标准化低分辨率脑电磁层析成像(SLORETA),即使在适当的修改之后,也不能定位大脑中的静默(“方法”详细说明了我们对这些算法的修改)。 为了避免平均背景活动,我们估计了每个源对所有电极上记录的EEG的贡献。这一贡献是以平均功率感而不是平均值来衡量的,因此保留了背景脑活动的贡献。我们的静默定位算法,称为SilenceMap,估计这些贡献,然后使用工具量化我们对静默区域的假设(连续、静默区域的小尺寸,并且仅位于一个半球)来定位它。正因为如此,另一个不同之处出现了:静默定位可以使用更多的时间点(比典型的源定位)。例如,采样频率为512 Hz的160秒数据为SilenceMap提供了大约81,920个要使用的数据点,提高了信噪比(SNR),而源定位技术通常仅依赖于几十个与事件相关的试验来平均和提取跨试验一致的源活动。 此外,我们还面临两个额外的困难:缺乏背景脑活动的统计模型,以及参考电极的选择。第一种情况是通过包括基线记录(在没有静默的情况下;我们在实验结果中没有基线)或利用半球基线来处理第一种情况,即在相对于纵向裂缝对称放置的电极上测得的功率大致相等(见图1B)。虽然这里使用的半球基线提供了相当精确的重建,但我们注意到这个基线只是一个近似值,实际的基线有望进一步提高精度。第二个困难是相关的:为了在功率上保持这种近似的半球对称性,最好利用纵裂顶部的参比电极(见图1A)。利用这些改进,我们提出了一种迭代算法,使用相对较少的数据来定位大脑中的静默区。在模拟和真实数据分析中,SilenceMap在定位准确性方面优于现有的算法,该算法仅使用128个电极上160秒的脑电信号来定位三名接受手术切除的参与者的静默区域。 2.结果 SilenceMap通过两个步骤定位静默区:(1)第一步在低分辨率源网格中找到一个连续的静默区,假设在此分辨率下,源在空间上是不相关的。在这个低分辨率的网格中,

    02

    数据处理的R包

    整理数据的本质可以归纳为:对数据进行分割(Split),然后应用(Apply)某些处理函数,最后将结果重新组合(Combine)成所需的格式返回,简单描述为:Split - Apply - Combine。plyr包是Hadley Wickham为解决split – apply – combine问题而写的一个包。使用plyr包可以针对不同的数据类型,在一个函数内同时完成split – apply – combine三个步骤。plyr包的主函数是**ply形式的,函数名的第一个字符代表输入数据的类型,第二个字符代表输出数据的类型,其中第一个字符可以是(d、l、a),第二个字母可以是(d、l、a、_ ),不同的字母表示不同的数据格式,d表示数据框格式,l表示列表,a表示数组,_则表示没有输出。

    02

    Nature medicine:基于可穿戴运动追踪数据早期识别帕金森疾病

    摘要:帕金森病是一种具有长期潜伏期的神经退行性运动障碍,目前尚无治疗方法。可靠的预测性生物标志物可能会改变开发神经保护治疗的努力,但仍有待确定。利用UK Biobank,我们研究了加速度计在普通人群中识别前驱帕金森病的预测价值,并将这种数字生物标志物与基于遗传、生活方式、血液生化或前驱症状数据的模型进行了比较。使用加速度计数据训练的机器学习模型在区分临床诊断的帕金森病和诊断前7年的前驱帕金森病与普通人群方面的测试性能优于所有其他测试模。加速度计是一种潜在的重要、低成本的筛查工具,用于确定有患帕金森病风险的人,并确定神经保护治疗临床试验的参与者。

    02

    Science子刊:利用DTI和NODDI纵向研究揭示轻度脑外伤后的白质微结构改变

    能够检测轻度脑外伤(mTBI)后的白质(WM)病理,并预测长期结果的神经成像生物标记物是改善护理和开发治疗方法所必需的。本文利用弥散张量成像(DTI)和近期新兴的神经突方向离散度和密度成像(NODDI)对mTBI后的WM微观结构进行了横断面研究和纵向研究,并将其与神经心理指标进行了相关性分析。在横截面研究中,早期分数各向异性的减小和平均扩散系数的增加对应于NODDI中WM区域自由水含量的升高。这种自由水升高的情况在早期脑震荡后症状的患者亚组中更为广泛。长期纵向的WM改变包括NODDI中的轴突密度下降,表征了弥漫性轴索损伤所致的轴突变性。因此,相比于DTI,NODDI能够更加清晰地表征弥漫性轴索损伤,是一种比DTI更敏感、更特异的检测mTBI所致的WM微结构改变的生物标志物,在对mTBI的诊断、预后和治疗监测中值得进一步研究。本文发表于Science Advances杂志。

    03
    领券