今年2月《Emerging Topics in Life Sciences》刊出题为“Space: the final frontier — achieving single-cell, spatially resolved transcriptomics in plants”的综述文章,简要回顾了空间转录组学方法的发展,并强调了目前在植物中实现三维空间转录组学的实验和计算方面的进展和挑战,特别关注这种方法如何接近单细胞分辨率。同时还确定并探讨了在植物学中进一步推进空间转录组学的潜在机会。
叶绿体基因组类的文章通常是我们自己做几个,然后结合已经发表的数据做分析。已经公布在NCBI的叶绿体基因组中通常没有反向重复区的信息。这个时候就需要我们自己重新注释。注释用到的是在线工具GeSeq https://chlorobox.mpimp-golm.mpg.de/geseq.html
在上期文章中介绍了rRNA的预测,今天继续介绍tRNA的预测。tRNA是具有结合并转运氨基酸功能的RNA,由一条长70~90nt并折叠成三叶草形状的短链组成的。一种tRNA只能携带一种氨基酸,如丙氨酸tRNA只携带丙氨酸,但一种氨基酸可被不止一种tRNA携带。
11月26日,深圳华大生命科学研究院主导在Nature Communications期刊发表题为“Chloranthus genome provides insights into the early diversification of angiosperms” 的研究论文。该研究从金粟兰目基因组水平,确定金粟兰目一直存在争议的系统发育位置,为核心被子植物五大类群系统发育关系进一步研究奠定基础,揭示金粟兰目植物药用和芳香化合物利用价值,为物种资源保护提供科学支撑。
评估海马硬化(hippocampal sclerosis,HS)的严重程度是否跟大尺度水平的脑网络水平改变有关。本文发表由宾夕法尼亚大学Bassett等在Neurology杂志。
请点击上面“思影科技”四个字,选择关注我们,思影科技专注于脑影像数据处理,涵盖(fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动)等,希望专业的内容可以给关注者带来帮助,欢迎留言讨论,也欢迎参加思影科技的其他课程。(文末点击浏览)
今天给大家带来一篇发表在nature biotechnology上研究空间转录组的文章。最近的空间基因表达技术能够在保留空间背景的同时全面测量转录组谱。然而,现有的分析方法并没有解决技术的分辨率或有效地利用空间信息。在这里,作者介绍了贝叶斯空间,一种完全贝叶斯统计方法,它利用来自空间邻域的信息来提高空间转录组数据的分辨率和聚类分析。作者将BayesSpace与目前的空间和非空间聚类方法进行了基准测试,并表明它改进了对来自大脑、黑色素瘤、浸润性导管癌和卵巢腺癌样本中不同的组织内转录谱的识别。利用免疫组化和由scRNA-seq数据构建的硅质数据集,作者发现贝叶斯空间解决了在原始分辨率下无法检测到的组织结构,并识别了组织学分析无法获得的转录异质性。
本文介绍了宾夕法尼亚大学生物医学图像计算与分析中心的Zhijian Yang和Ilya M. Nasrallah等共同发表在Nature Communications的研究成果:本文提出了Smile-GAN模型(半监督聚类生成对抗网络),这是一种半监督深度聚类方法,它能够通过神经成像特征识别阿尔茨海默疾病亚型。通过在数据集上的训练,Smile-GAN确定了四种神经变性模式,将该框架应用于纵向数据,又确定了疾病的两种发展进程,它可以预测神经变性的途径和速率,这为精准诊断和定向临床试验提供了方向。
The landscape of chloroplast genome assembly tools
GetOrganelle推荐组装命令介绍--reads开始 优先推荐的命令--auto(高等植物叶绿体基因组) get_organelle_from_reads.py -1 sample_1.fastq.gz -2 sample_2.fastq.gz -F embplant_pt -o output-plastome -R 10 -t 1 -k 21,45,65,85,105 命令中的参数说明 -1和-2 正向和反向测序原始数据文件 (如果是单向测序, -u) -F 设定要组装的基
青藏高原连续日光诱导叶绿素荧光数据集(2000-2018)是通过MODIS各通道反射率和SIF观测数据建立神经网络模型,从而得到较高时空分辨率的SIF数据,常作为初级生产力的参考。前言 – 人工智能教程 源数据范围为全球,本数据集选取了青藏高原区域。本数据将原本的4天时间尺度数据集成至月数据,加工方法为取月最大值,尽可能达到去除噪声的效果。该数据集常被用作评定植被绿度和初级生产力的时间和空间格局,具有实际意义和理论价值。
最近一项研究表明:DNA metabarcoding为追踪人类饮食中植物的摄入提供了一种有潜力的新方法,类似方法也可以用来检测人类食谱中的动物成分和真菌成分。该研究发表在了《mSystems》期刊 (IF:6.5),阐述了广泛用于野生生物的研究方法能从人类粪便食物残渣中扩增和测序植物DNA。
《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》 一、背景 大脑的发育受多方面因素影响,较高的社会经济地位(higher socioeconomic status, SES)就是其中一个重要的因素。儿童、青少年时期的SES与其较强的认知能力,学业成就和较低的精神疾病发病率有关,甚至会影响婴儿时期的大脑皮层发育。已有的一些研究发现SES与大脑的结构发育呈现紧密关系,具体表现为低SES个体的大脑结构发育加速,这表明SES会调节年龄和大脑结构发展之间的关系,目前尚不清楚其在大脑功能发育中是否存在这种调节关系,这促使人们深入地研究社会经济地位是否以及如何影响青少年大脑功能网络的发育。在大多数这些研究中,关于SES的研究是在家庭层面进行的,包括家庭收入,成员学历等,部分研究也关注了邻里社区SES的影响。然而已有的研究结果还不足以清晰的揭示SES与儿童、青少年的大脑功能发育之间的关系,以及SES是如何影响的发育的,特别是与年龄的交互作用。该研究利用费城跨年龄段的大样本横断面影像数据来研究年龄,SES和大脑功能网络拓扑之间的关系,分别从全脑水平,网络水平,以及单个大脑区域三个层次,利用图论的聚类系数和模块化指数两个网络指标,从整体到局部的研究了在青少年发育过程中,SES对其功能网络拓扑结构的影响。该研究为SES与功能网络拓扑的发展之间的联系提供了证据,为早期成长环境影响大脑神经活动提供了更深入的见解。 二、材料和方法 1、被试和数据 从Philadelphia Neurodevelopmental Cohort(PNC)数据集中选取符合排除标准的,年龄在8到22岁之间的,1012名儿童和青少年的神经影像数据,其中平均年龄15.78,女性552名。SES的测量结合了被试社区的结婚率,贫困人口比例,家庭收入以及邻里家庭收入,教育占比,人口密度,就业率等多个特征计算其SES得分。结构和功能数据的预处理借助ANTs和XCP工具包处理,将功能数据映射到皮层上进行后续功能网络分析 2、构建功能网络 对每个被试,提取N = 360 个皮层区域的BOLD信号,通过计算皮尔逊相关系数来表示每两个区域之间的功能连接,最后得到了一个360*360的功能连接矩阵,如图1。基于个体数据的差异性与局限性,只有359个节点被纳入到后续分析中。
空间转录组学研究正在达到单细胞空间分辨率,数据通常来自多个组织切片。《Genome biology》发表了一种计算方法BASS,支持单细胞分辨率空间转录组学的多尺度和多样本分析。BASS在单细胞尺度上进行细胞类型聚类,在组织区域尺度上进行空间结构域检测,这两项任务在贝叶斯层次结构模型框架内同时进行。
今天的推文简单介绍一下使用GeOrganelle这款软件利用全基因组重测序数据组装叶绿体基因组的过程
背景:阿尔茨海默病(AD)是一种具有显著异质性的神经退行性疾病。不同的AD表型可能与特定的脑网络的改变有关。利用功能网络揭示疾病的异质性可以为精确诊断提供见解。
https://onlinelibrary.wiley.com/doi/epdf/10.1111/1755-0998.13787
最近的研究表明,慢性疼痛患者的大脑网络可能发生重大的重组,但即时疼痛体验如何影响大规模功能网络的组织尚不清楚。为了研究这个问题,我们对106名同时经历有害和无害发热的参与者进行了功能性磁共振成像。疼痛刺激引起的脑连接的网络重组与无痛刺激和标准静息状态网络的组织结构有本质上的不同。有害刺激增加了躯体感觉网络与(a)参与情境表征的额顶叶网络、(b)参与动机行为选择的腹侧注意网络区域以及(c)基底神经节和脑干区域的连接。这导致了小世界性、模块化(更少的网络)和全球网络效率的降低,并出现了一个整合的疼痛超级系统(PS),其活动预测了5个参与者群体中疼痛敏感性的个体差异。网络枢纽被重组(枢纽中断),以便更多的枢纽在PS中被定位,并且从连接不同网络的连接器枢纽转向连接PS内区域的省级枢纽。我们的发现说明大尺度脑系统网络结构的重组,这些变化可能会优先考虑对疼痛事件的反应,并在疼痛过程中提供伤害性系统认知和行动的中央控制的特权访问。
物业工程肩负着维持项目各类设施设备的正常运作,保障全体业主的正常生活,令物业保值升值,是项目的心脏部门。拓端数据(tecdat)研究人员根据全国电梯故障上报汇总数据,从多个角度进行数据分析。
肌萎缩性脊髓侧索硬化症(ALS)是一种以运动系统退化为主要特征的疾病,临床证据表明,多达50%的病例出现认知和行为改变。ALS在临床上和生物学上都是异质性(一种遗传性状可以由多个不同的遗传物质改变所引起)的。目前使用临床参数进行亚分组,如症状出现的部位(延髓或脊柱)、疾病负担和家族性疾病患者的基因组学。然而,除基因组学外,这些亚分类没有考虑潜在的疾病病理生物学,不能完全预测疾病的病程或预后。
引言 空间数据挖掘(Spatial Data Mining,SDM)即找出开始并不知道但是却隐藏在空间数据中潜在的、有价值的规则的过程。具体来说,空间数据挖掘就是在海量空间数据集中,结合确定集、模糊集、仿生学等理论,利用人工智能、模式识别等科学技术,提取出令人相信的、潜在有用的知识,发现空间数据集背后隐藏的规律、联系,为空间决策提供理论技术上的依据[1]。 1.空间数据挖掘的一般步骤 空间数据挖掘系统大致可以分为以下步骤: (1)空间数据准备:选择合适的多种数据来源,包括地图数据、影像数据、地形数据、属性数
背景:亨廷顿舞蹈病是一种以运动、行为和认知领域的临床改变为特征的神经退行性疾病。然而,大规模脑认知网络的结构和破坏尚未建立。
岛叶皮层和前扣带皮层共同组成显著或中扣带-岛叶网络,参与发现显著性事件和启动控制信号来调节脑网络动力学。凸显网络和大脑其他部分之间的功能耦合在多大程度上由于发育和衰老而发生变化,目前还没有被探索。在本文中,我们研究了凸显网络的动态功能连接(dFC)在一个大寿命样本(n = 601;6岁85岁)。滑动窗口分析和k-means聚类分析揭示了由凸显网络形成的dFC的五种状态,它们要么具有广泛的异步性,要么具有凸显网络与其他脑区之间不同的同步模式。我们确定了每个状态和主体的频率、停留时间、总过渡和特定状态到状态的过渡,并根据主体的年龄回归度量来确定生命周期趋势。凸显网络与大脑其余部分之间的低连通性为特征的动态状态在年龄、频率和驻留时间之间具有很强的二次正相关关系。另外的频率,停留时间,总转变,以及状态到状态的转变趋势在其他凸显网络状态被观察到。我们的研究结果强调了凸显网络的亚稳态动力学及其在认知关键脑区成熟中的作用。
三重网络模型是Vinod Menon 2011年基于静息态功能连接提出的用于评估人类神经精神疾病的理论模型。该模型认为静息态功能网络中突显网络、默认网络、中央执行网络对神经精神疾病评估具有重要意义。数十年来,该模型在多项疾病研究中得到验证,但受限于人体的非侵入性,极少有研究能深入到神经元层面探讨三重网络的结构功能基础。本研究利用大脑转录组信息整合了人、猕猴、小鼠脑功能网络,发现小鼠、猕猴大脑也可以用三重网络模型来描述。本实验进一步探究了类抑郁动物模型、神经元结构环路、光遗传功能网络与三重网络的相关性,从神经系统构成机制上对三重网络进行了验证。实验再次证明了三重网络的应用价值,同时为动物研究结果向人类转化提供了范式。本文发表在Molecular Psychiatry杂志。
空间基因表达技术能够在保留空间背景信息的同时,全面测量转录组谱。然而,现有的分析方法并没有解决技术分辨率有限或有效利用空间信息的问题。
脑地图集在研究大脑解剖和功能方面起着重要的作用。随着对多模态磁共振成像(MRI)方法(如结合结构MRI、弥散加权成像(DWI)和静息态功能MRI (rs-fMRI))的兴趣的增加,有必要基于这三种成像方式构建集成的脑地图集。本研究构建了中国成年人群(年龄22-79岁,n = 180)的多模态脑图谱,包括反映脑形态学的T1图谱、描绘复杂纤维结构的高角度分辨率弥散成像(HARDI)图谱和反映单一立体定向坐标下大脑固有功能组织的rs-fMRI图谱。我们采用大变形自形度量映射(LDDMM)和无偏自形图谱生成方法同时生成T1和HARDI图谱。利用谱聚类,我们从rs-fMRI数据中生成了20个脑功能网络。我们通过联合独立成分分析,展示了使用图谱来探索大脑形态、功能网络和白质束之间的一致性标记。
本文介绍了机器学习领域中10种适合初学者的算法,包括线性回归、逻辑回归、决策树、朴素贝叶斯、K-means、随机森林、支持向量机、神经网络、K-NN和PCA。这些算法涵盖了监督学习、非监督学习和集成学习等领域,适用于分类和回归问题。通过对比不同算法的优缺点,本文为初学者提供了选择合适算法的方法,并附上了详细的算法实现步骤和示例代码。
C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART
今天我们对概率图模型(Probabilistic Graphical Model,PGM)做一个总结。
虽然在当前,人们对精神分裂症的神经机制有了一定的了解,但是对其神经生物学的异质性仍旧了解甚少,这严重影响了当前对精神分类症神经生物学的不同表征的分析研究。
原文:一只鸟的天空(http://blog.csdn.net/heyongluoyao8) 在进行数据挖掘时,首先要进行商业理解,即我们需要达到什么目的,解决什么问题;其次需要进行数据理解,我们需要哪些数据以及需要什么样的数据;接着需要进行数据准备,即进行相关数据采集与读取,并进行数据预处理;继而建立相关模型,即使用什么算法与模型去解决这个问题;进而进行模型评估,即采用一些指标评价模型的好坏程度;然后,进行模型发布,即当模型的效果达到设定值之后,我们将模型进行上线发布;最后,进行模型更新
01 传统方法与深度学习 图像分割 图像分割是医疗图像中一个很重要的任务,通常分为分割,配准,可视化几个子任务。这里贴一张广义的图像分割的图: 存在的困难: 不同目标区域亮度一致,区分度小, 不同目标
K-MEANS 算法 K-MEANS 评估聚类结果与选择K MapReduce GMM 算法 初始化 过拟合 K-MEANS比较 LDA LDA和clustering的区别 数学基础 四种分布 共轭分
Rose小哥今天给大家介绍一些运动想象系统的原理以及运动想象系统中常见的特征提取算法和分类算法。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种基于密度的空间聚类算法。该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。 在DBSCAN算法中将数据点分为三类:
大脑是最重要的器官之一。它们为整个身体提供调度指示,让我们能够与世界互动。因此,快速检测大脑活动的变化是很重要的。一种可能导致永久性损伤的危险变化是神经静默(neural silence)【注:这个词汇暂时未查询到对应中文,所以暂译为神经静默,它表示的是一种神经系统的静默状态。可能有不妥,欢迎专业人士告知】,即大脑的某一部分没有任何活动的迹象。
聚类特征(Clustering Feature,简称CF)是一种用来表征聚类特征的数据格式,他由以下三部分组成:簇中所含样本点的个数(用 N N N来表示)、簇中所有点的各项属性的线性和(用 L S LS LS来表示)以及簇中所有点的各项属性的平方和(用 S S SS SS来表示),假设存在簇 C = { ( 1 , 2 ) , ( 2 , 1 ) , ( 1 , 1 ) , ( 2 , 2 ) } C=\{\left(1,2\right),\left(2,1\right),\left(1,1\right),\left(2,2\right)\} C={ (1,2),(2,1),(1,1),(2,2)},那么 N = 4 N=4 N=4, L S = ( { 1 + 2 + 1 + 2 } , { 2 + 1 + 1 + 2 } ) = ( 6 , 6 ) LS=\left(\{1+2+1+2\},\{2+1+1+2\}\right)=\left(6,6\right) LS=({ 1+2+1+2},{ 2+1+1+2})=(6,6), S S = 1 2 + 2 2 + 1 2 + 2 2 + 2 2 + 1 2 + 1 2 + 2 2 = 20 SS=1^2+2^2+1^2+2^2+2^2+1^2+1^2+2^2=20 SS=12+22+12+22+22+12+12+22=20。因此这种结构具有很好的线性性质,即当需要合并两个簇时,总的聚类特性可以简单的通过两者聚类特性之和来表示。有了上述信息之后,就可以计算簇的质心以及方差(或标准差),其中方差可以用来表征簇的半径,还可以间接的计算两个簇质心之间的距离。 聚类特征树(Clustering Feature Tree,简称CF-Tree)是一棵高度平衡的树,这棵树由根节点、内部节点(或者称为非叶节点)以及叶节点,其中每个非叶节点和根节点都由形如 [ C F i , c h i l d i ] [CF_{i},child_{i}] [CFi,childi]的项组成, c h i l d i child_i childi代表第 i i i个节点的子节点,而叶节点(或者称为簇)通过 C F i CF_i CFi组成的序列来表示每个簇的特征,下图(图1)所示是一个CF-Tree实例。
来源:软件定义世界 本文长度为2877字,建议阅读6分钟 本文为你分析如何选择机器学习的各种方法。 每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客,讲述了如何选择机器学习的各种方法。 另外,Scikit-learn 也提供了一幅清晰的路线图给大家选择: 其实机器学习的基本算法都很简单,下面我们就利用二维数据和交互图形来看看机器学习中的一些基本算法以
1.1.数据挖掘处理的对象有哪些? 处理某一专业领域中积累的数据; 1.2.数据挖掘在电子商务中的客户关系管理起到非常重要的作用;
每当提到AI、深度学习、机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。本文理清了机器学习的4种方法。
分类是把某个对象划分到某个具体的已经定义的类别当中,而聚类是把一些对象按照具体特征组织到若干个类别里。虽然都是把某个对象划分到某个类别中,但是分类的类别是已经预定义的,而聚类操作时,某个对象所属的类别却不是预定义的。所以,对象所属类别是否为事先,是二者的最基本区别。而这个区别,仅仅是从算法实现流程来看的。
聚类是一种无监督学习,聚类的方法几乎可以应用于所有对象。 聚类分析根据聚类算法将数据或样本对象划分成两个以上的子集。 每一个子集称为一个簇,簇中对象因特征属性值接近而彼此相似。不同簇对象之间则彼此存在差异。 把相似的对象归于统一组,不同对象归于不同组。需要一种相似度的计算方法
脑机接口(BCI),是一种通过检测中枢神经系统活动并将其转化为人工输出,来替代、修复、增强、补充或者改善中枢神经系统的正常输出,从而改变中枢神经系统与内外环境之间的交互作用的技术。脑机接口技术通过置于头皮或颅内的电极等传感器采集脑神经活动信号,经过信号处理、特征提取、模式识别等过程,可获知人的控制意图、认知或心理状态、神经系统疾病状态等信息,为运动、语言等功能残缺的患者提供新的控制、交流通道或康复手段,也可为健康人群提供更多信息输出通道。随着脑电信号采集技术与信号处理技术的发展成熟,脑机接口技术已逐渐走入临床应用,在诸如中风、注意力缺陷等脑损伤或其他神经系统疾病患者的临床康复中表现出色,为高位截瘫、肌萎缩性侧索硬化症等运动功能障碍患者提供新的运动功能替代方案,为情绪、疲劳、意识状态等的检测和识别提供客观指标。
分类是把某个对象划分到某个具体的已经定义的类别当中,而聚类是把一些对象按照具体特征组织到若干个类别里(点击文末“阅读原文”获取完整代码数据)。
大脑皮层的微观结构受到昼夜节律和睡眠剥夺的影响,但这些影响的确切基础尚不清楚。t1加权和t2加权磁共振图像之间的比率(T1w/T2w比率)与髓磷脂水平和树突密度有关,这可能为研究睡眠剥夺大脑的皮质内微观结构提供新的见解。在这里,我们检测了41名健康青年(26名女性)在睡眠剥夺(n = 18)或正常睡眠-觉醒周期(n = 23)前后32小时的皮质内T1w/T2w比值。线性模型显示,在32小时后,四组患者的T1w/T2w比值变化有显著的组间差异,包括岛叶、扣带回和颞上皮质的双侧效应,包括涉及注意、听觉和疼痛处理的区域。在整组中,睡眠剥夺组T1w/T2w比值增加,而正常睡眠-觉醒组T1w/T2w比值降低。这些变化不能用扫描仪内头部运动来解释,在调整皮质厚度和水合作用后,簇间95%的影响仍然显著。与正常的睡眠-觉醒周期相比,32小时的睡眠剥夺使皮质内T1w/T2w比值增加。虽然本研究检测到的皮质内变化可以反映髓磷脂或树突密度的变化,或两者的变化,但需要组织学分析来明确具体的皮质过程。
阿尔茨海默病(AD)损害了大脑的结构和功能网络,导致认知障碍。最近的连接组学研究结果已经将AD中结构和功能网络组织的变化与淀粉样蛋白-β和tau蛋白的积累和扩散模式联系起来,为该疾病的神经生物学机制提供了见解。此外,对基因相关的连接组变化的研究可能有助于AD的早期诊断,并促进在该疾病的早期阶段有效的个性化治疗策略的发展。在这篇文章中,我们回顾了连接组变化与淀粉样蛋白-β和tau蛋白病理之间的关系以及分子遗传学的研究。我们还强调了连接组衍生的计算模型在复制先验发现和跟踪与预测AD病理生理学生物标记物进展方面的应用。
每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客
近些年Aβ和tau相关PET的运用为探究全身血管健康与大脑健康的关系提供了很好的途径。本研究旨在寻求早期脑血管健康相关的MRI影像标记物(包括结构、灌注、白质微结构完整性)。来自梅奥医学中心的研究者使用两个独立的样本,通过既往病史(高血压、高脂血症、心律失常、冠状动脉疾病、充血性心力衰竭、糖尿病和中风)总结被试心血管和代谢状况(CMC)来确定其血管的健康程度。利用多元回归模型,分析CMC与脑健康之间的关系,并控制年龄、性别、教育/职业和AD病理(Aβ和tau)等因素。研究者发现全身血管健康与内侧颞叶皮质变薄、广泛的脑低灌注和白质微结构破坏(主要包括胼胝体和穹窿等纤维束)密切相关。进一步的研究表明,胼胝体膝部的微结构完整性可以用于脑血管健康的早期评估,在独立样本中可进行验证,而且预测认知的能力高于Aβ沉积指标。最后,研究者总结全身血管健康状况对大脑结构和功能有显著影响,早期脑血管健康相关的MRI标记物独立于AD病理指标,可预测认知衰退。
领取专属 10元无门槛券
手把手带您无忧上云