等高线指的是地形图上高程相等的相邻各点所连成的闭合曲线。把地面上海拔高度相同的点连成的闭合曲线,并垂直投影到一个水平面上,并按比例缩绘在图纸上,就得到等高线。 等高线也可以看作是不同海拔高度的水平面与实际地面的交线,所以等高线是闭合曲线。在等高线上标注的数字为该等高线的海拔。
umap/tsne图作为单细胞转录组的王牌图形之一,当seurat 或者 singleR 直接绘制的umap/tsne 图需要调整的时候,可能比较难调整,当然AI或者PS都可以办到 。但是本次主要分享使用ggplot2进行可视化,能比较方便的进行后期的微调 ,也学习回顾了ggplot2的基本参数。
降维是机器学习从业者可视化和理解大型高维数据集的常用方法。最广泛使用的可视化技术之一是 t-SNE[1],但它的性能受到数据集规模的影响,并且正确使用它可能需要一定学习成本(t-SNE:如何理解与高效使用)。
降维是机器学习从业者可视化和理解大型高维数据集的常用方法。最广泛使用的可视化技术之一是 t-SNE,但它的性能受到数据集规模的影响,并且正确使用它可能需要一定学习成本。
降维是机器学习中的可视化和理解高维数据的强大工具。t-SNE是最广泛使用的可视化技术之一,但其性能在大型数据集中会受到影响。
单细胞韧皮部研究代码解析1-QC_filtering.R:https://cloud.tencent.com/developer/article/2256814?areaSource=&traceId
在数据科学和机器学习领域,我们经常面对高维数据的挑战。高维数据不仅难以理解和可视化,而且会增加计算复杂性。
需要的文件:由R里面对Seurat对象的数据导出的 1.velocyto pipeline 跑出来的loom文件 2.细胞名字文件 3.细胞属于的类群
为了确定我们的分群是否可能是由于细胞周期阶段或线粒体表达等人工因素造成的,可视化探索这些指标以查看是否有任何簇表现出富集或与其他簇不同,这是很有用的。然而,如果观察到特定簇的富集或差异,它可以用细胞类型来解释,那就可以不必担忧。
UMAP算法被认为是与t-SNE相似的原理,都是将高维概率分布映射到低维空间的算法,从而做到降维的效果。主要基于流形理论和拓扑算法的理论,对高维数据进行降维,从而形成其他分类模型的输入特征。
由于最近一直需要加班和做试验,我把更文的时间变成一周一次啦,有问题的小伙伴可以留言,我们做生信的小可爱们一起学习进步。
偶然见到一张将拟时序分析的结果映射到umap中的图(https://www.jianshu.com/p/e2f0dc8a485c),想了下只需要获取 时序分析的结果 + umap的位置信息 ,使用ggplot2是不是就可以绘制了?
Poisson scRNA Integration of Mixed Unknown Signals(PRIMUS):混杂未知信号的泊松scRNA数据整合
Umap2是一款由NCC Group和Cisco SAS小组开发的、基于python的USB host安全评估工具。 它拥有第一版所支持的所有功能: umap2emulate:USB设备枚举 umap2scan:用于设备支持的USBhost扫描 umap2detect:USBhost操作系统检测(尚未实现) umap2fuzz:USB host fuzzing 另外,该版本中添加了额外的功能: USBhost fuzzing使用kitty作为fuzzing引擎 Umap2中不仅包含可执行的脚本,而且作为
今天没什么废话,主要讲讲如何用pseudobulk data做hdWGCNA。🙃
正好来复习一下前面[[111-R可视化35-结合grid与ggplot输出]] 的用法。
作者按 大家或许都曾被Nature, Science上的单细胞umap图吸引过,不免心生崇拜。在这里,我们将介绍一种简单方便的顶刊级umap图可视化 全文字数|预计阅读时间: 2000|5min ——Starlitnightly(星夜)
本质上,inferCNVpy这个包是InferCNV的python版重现。主要还是遵循R包版本的计算步骤,进行了少量修改。inferCNVpy通过使用numpy、scipy和稀疏矩阵,使其计算效率大大提高。inferCNVpy可以在Linux,Mac环境下运行。Windows下可参考:
Seurat使用基于graph的聚类方法,该方法使用K最近邻(KNN)图(默认情况下)将细胞嵌入到图结构中,在具有相似基因表达模式的细胞之间绘制边缘。然后,它试图将该图划分为高度互连的‘quasi-cliques’或 ‘communities’[ Seurat - Guided Clustering Tutorial(https://satijalab.org/seurat/v3.1/pbmc3k_tutorial.html)]。
这篇推文的目的是探索一些重要参数对后续分群UMAP可视化的影响。参数主要考虑:高变基因个数;pca维数;UMAP中的n_neighbors,min_dist和dims参数。影响主要看T细胞和B细胞是否分开。
随着生物学背景知识的增加,单细胞图谱的可视化直接用10X的Loup或者seurat的Dimplot函数直接绘制的umap/tsne图往往很难达到要求了,这就要求我们提高绘图技能。我们都知道ggplot2是一款很好的绘图R包,甚至可以说在语法上扩展了R语言本身。那么,当我们需要绘图的时候,自然我们会想到它及其周边。今天我们就主要地看一下ggforce这个包带给我们的可能性。
有了基因集文件除了做scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?GSVA分析,还可以计算每个细胞的目标基因集评分 。
另外,前两天在《生信技能树》和《单细胞天地》等公众号都推出来了一个10X单细胞转录组钜惠套餐,详见:2个分组的单细胞项目标准分析,原价15~20万的6个10x单细胞转录组套餐,现价10万。其实本文介绍的就是:敲除Dnmt1基因前后分组的两个单细胞转录组数据分析。
单细胞RNA-seq分析介绍 单细胞RNA-seq的设计和方法 从原始数据到计数矩阵 差异分析前的准备工作 scRNA-seq——读入数据详解 scRNA-seq——质量控制 为什么需要Normalization和PCA分析 scRNA-seq聚类分析(一) scRNA-seq聚类分析(二) scRNA-seq Clustering (一) scRNA-seq Clustering (二) scRNA-seq Clustering quality control(一)
接下来就可以读取它们啦,有意思的是每个样品都需要独立的读取3个文件,合并成为一个单细胞Seurat对象,操作技巧满满!
上一讲我们构造好了SingleCellExperiment对象,后续全部的分析都会以这个SingleCellExperiment对象为准,大家务必熟悉SingleCellExperiment对象的各种结构,教程见:cytofWorkflow之构建SingleCellExperiment对象(二)。有了这个SingleCellExperiment对象,而且经过了合理的质量控制,接下来就可以进行聚类分群拉!
随着高通量单细胞RNA-seq测序技术的发展,scRNA-seq数据集的大小已经从单个细胞增长到数百万个细胞,如何将这些高维度的数据可视化也是生物信息一个重要的应用领域。这一期给大家介绍一些scRNA-seq文章中常见的图,希望给大家带来一些新的作图思路.
Palantir是一个2019年在nature biotechnology提出的用于单细胞数据轨迹推断的Python工具包。根据官方教程,简单学习用法如下。
最近写召回、混排算子的时候需要用c++,对我来说就是纯新手入门,这里记录一些常见到的容器和他们的一些特性。
这个umap里面,叠加了FeaturePlot看一个基因表达信息。文献出处是:《IL-11 is a crucial determinant of cardiovascular fibrosis》,作者其实就是想展现IL-11这个基因呢,在其中一个fibroblasts细胞亚群里面是表达量比较高!
降维不仅仅是为了数据可视化。它还可以识别高维空间中的关键结构并将它们保存在低维嵌入中来克服“维度诅咒”
单细胞数据中包含很多细胞以及很多基因,是一个较大的数据集,维度较大,需要对数据进行降维。降维就是对原始数据进行特征提取,经常会得到高维度的特征向量。通过降维的方式来寻找数据内部的特性,提升特征表达能力,降低模型的训练成本。
参考:https://stackoverflow.com/questions/59101791/seurat-dimplot-highlight-specific-groups-of-cells-in-different-colours
随着单细胞技术的成熟,测序成本的降低,单细胞的数据量和样本量也日益增长。我们知道单细胞转录组的一个主要应用就是解释细胞的异质性,那么,不同器官,不同测序平台,不同物种之间的单细胞数据何如整合分析呢?特别是在单细胞的数据维度这么高的前提下,显然传统的基于回归的方法已经不适用了。于是出现了一批单细胞整合分析的工具,它们大多数是在R生态条件下的。如:
https://mp.weixin.qq.com/s/UsDC-t1j7NHaLTnI6xCATQ
单细胞测序的细胞数目成千上万,在后续分析中需要对其进行注释,但是对每一个细胞都进行注释不现实,因此我们需要对这些细胞进行聚类,这样只需要对聚类生成的cluster进行注释就可以了(聚成一类的细胞大概率是相同的细胞类型)。
单细胞初级8讲和高级分析8讲 单细胞分析十八般武艺1:harmony 单细胞分析十八般武艺2:LIGER 单细胞分析十八般武艺3:fastMNN 单细胞分析十八般武艺4:velocyto
This procedure avoids calling false positive CNV regions due to cell-type specific expression of clustered gene regions (e.g. Immunoglobulin- or HLA genes in different immune cell types).
Seurat软件学习1-多个模型得数据进行整合:https://cloud.tencent.com/developer/article/2130078
PRIMUS 来源于最近国人的一篇Sci Adv的文献Longitudinal single-cell RNA-seq analysis reveals stress-promoted chemoresistance in metastatic ovarian cancer[1]。作者期望通过研究化疗前后卵巢癌样本的单细胞转录组层面的变化,然而由于卵巢癌肿瘤特有的异质性,不同肿瘤之间细胞成分差异很大,多样本之间整合存在困难。而基于以往的Seurat v3, Harmony, LIGER, mnnCorrect, and fastMNN 以及三种Bulk RNAseq的整合方法(ComBat、ComBat-seq,and limma)整合仍然不能很好的解决这个问题。基于此,作者团队开发了PRIMUS。
在处理大数据集时,降维是最重要的方面之一,因为它有助于将数据转换为低维,以便我们能够识别一些重要的特征及其属性。它通常用于避免在分析大数据集时产生的维度问题。
现在运行 infercnvpy.tl.infercnv()。本质上,该方法通过染色体和基因组位置对基因进行分类,并将基因组区域的平均基因表达与参考进行比较。原始的 inferCNV 方法使用上下游50个基因作为窗口,但更大的窗口大小可能有意义,具体取决于数据集中的基因数量。
单细胞测序技术是近年最大的生命科学突破之一,相关文章频繁发表于各大顶级期刊,然而单细胞数据的分析依然是大家普遍面临的障碍。本专题将针对10X Genomics单细胞转录组数据演示各种主流分析,包括基于Seurat的基础分析、以及基于clusterProfiler、Monocle、SingleR等R包的延伸分析。不足之处请大家批评指正,欢迎添加Kinesin微信交流探讨!
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1:https://cloud.tencent.com/developer/article/2055573
领取专属 10元无门槛券
手把手带您无忧上云