首页
学习
活动
专区
工具
TVP
发布

生物信息云

旨在传播生物医学科研实验技能和生物信息学基础知识及应用技巧
专栏成员
257
文章
1193862
阅读量
407
订阅数
​单细胞专题 | 7.单细胞下游分析——常规分析流程案例一
单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 单细胞专题 | 6.单细胞下游分析——不同类型的数据读入
DoubleHelix
2022-12-16
4.5K0
基于R语言利用NMF(非负矩阵分解)替代层次聚类进行肿瘤分型
随着芯片和测序水平的发展,使得我们研究所有基因在整个基因组里的表达情况成为了可能。合理地利用和解释这些数据,能够帮助我们探索相关的生物过程和人类疾病的机制。目前已经有一些软件或方法,可以将具有相似表达模式的基因或者样本进行聚类,但是都有自身的限制。NMF包基于非负矩阵分解(non-negative matrix factorization,以下简称NMF)方法,提取基因表达矩阵内数据的生物相关系数,通过对基因和样本进行组织,抓住数据的内部结构特征,从而对样本进行分组,目前在疾病分型方面受到广泛应用。我前面已经介绍过了NMF的基本原理【NMF(非负矩阵分解)的算法原理】,这里我介绍R语言实现NMF。下面是一篇今年刚发的一篇纯生信的分析文章,用的就是NMF这个方法来对肿瘤进行分型。影响因子为4.8。
DoubleHelix
2022-01-19
16.4K0
分子对接教程 | (7) AutoDock对接中易错问题
首先就是准备受体的时候,加氢的问题,其实在前文已经有过介绍,在选择一个分子作为配体或受体之前,必须把所有的氢都加到这个分子上,而且是全氢。如果你操作是用我选择的蛋白或者受体,前面可能你没有发现一个问题,那就小分子配体,我们下载的sdf文件和mol2文件,其中的sdf文件在PubChem数据库下载的,在3D Conformer处左侧有一些选项勾选,比如是否显示氢键,我当时是勾选的。
DoubleHelix
2021-02-26
6.9K0
R绘图笔记 | 一般的散点图绘制
plot函数中,x和y分别表示所绘图形的横坐标和纵坐标;函数中的...为附加的参数。plot函数默认的使用格式如下:
DoubleHelix
2020-11-03
5.2K0
Linux笔记【004】| 文件/文件夹的基本操作命令
如果后面的参数文件名指定了路径,则表示在指定的路径下创建;如果只是传递一个文件名,则表示在当前目录创建文件。
DoubleHelix
2020-11-03
1.5K0
转录组分析 | 使用Stringtie对数据进行下游处理
StringTie 是用于 RNA-seq 的转录本组装和定量软件,StringTie 可以看做是cufflinks软件的升级版本,其功能和Cufflinks是一样的,包括下面两个主要功能:转录本组装和定量;相比Cuffinks, 其运行速度更快。该软件的官网:https://ccb.jhu.edu/software/stringtie/index.shtml。
DoubleHelix
2020-09-23
12.5K2
不用编程,这个工具除了帮你绘制漂亮的图还提供Python和R代码以及统计分析
如果你不会编程,又想绘制一些好看的图片,除了其他绘图软件以外,我这里给大家推荐一个工具——Plotly,这个工具我收藏很久了,也没有用过,今天突然想起来,就分享给大家,具体怎么用大家自己去探索。这个网站的注册,最好是学校邮箱注册。重点是该工具后还提供Python和R代码,有没有很爽??除了绘图,还可以进行统计分析,功能反正很强大。
DoubleHelix
2020-07-28
7240
GEO数据库表达数据的提取以及limma包进行差异分析
关于GEO数据库认识和在线使用教程,参考文章:GEO数据库使用教程及在线数据分析工具。关于GEO数据库的R包:Bioconductor:GEOquery包,我们前面已经介绍,当然是官方案例,我们这里实战一下。
DoubleHelix
2020-06-24
17.4K11
常用生物信息 ID的介绍
Gene ID 也称Entrez ID,EntrezGene ID ,是 NCBI 使用的能够对众多数据库进行联合搜索的搜索引擎, 其对不同的 Gene 进行了编号, 每个 gene 的编号就是 entrez gene id. ,说白了,就是数字,比如:TP53 ,Gene ID就是: 7157。由于 entrez id 相对稳定, 所以也被众多其他数据库, 如 KEGG 等采用. Entrez Gene ID 就是一系列数字, 也比较容易辨识。R 或网站都有众多的工具可以帮助从不同的 ID 转换为 entrez id 或者反向转换。
DoubleHelix
2020-06-04
5.3K0
R语言数据分析与挖掘(第九章):聚类分析(2)——层次聚类
层次聚类根据划分策略包括聚合层次聚类和拆分层次聚类,由于前者较后者有更广泛的应用且算法思想一致,因此本节重点介绍聚合层次聚类算法。
DoubleHelix
2020-02-17
11.2K0
R语言数据分析与挖掘(第七章):因子分析
因子分析(factor analysis, 简称FC)又称因素分析,基于相关关系而进行的数据分析技术,是一种建立在众多的观测数据的基础上的降维处理方法。其主要目的是探索隐藏在大量观测数据背后的某种结构,寻找一组变量变化的共同因子,将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
DoubleHelix
2019-12-17
5.6K0
R语言数据分析与挖掘(第五章):方差分析(3)——协方差分析
为了更好的帮助大家理解,下面简要介绍相关结构,大家也可以自行回顾一下本公众号推送的回归分析与方差分析模型的结构;
DoubleHelix
2019-12-17
7.2K0
R语言数据分析与挖掘(第五章):方差分析(2)——多因素方差分析
在实际应用中,更多出现的是包含多因素的试验和处理。多因素试验与双因素试验背后的基本思想是一致的。与单因素方差分析不同,在双因素方差分析中因素间可能会有交互作用。假设有两个因素A和B,因素A和B没有交互作用指的是A的水平值不取决于B的水平值,反之亦然。对于有交互作用的因素,我们不可孤立地看待这些因素。对于双因素的情形,一般从图像上看,没有交互作用的因素水平图表现为两条不相交的线段,而有交互作用的因素水平图为两相交的线段。例如,下图显示的是在研究年龄和性别对身高是否有显著作用过程中,因素年龄与性别之间的交互作用。从图像上看,两曲线没有明显相交,据此可以推测二者间不存在相互作用。当然,要判定是否存在或者不存在交互作用,还需要根据相应的统计量来分析。
DoubleHelix
2019-12-16
10K0
R语言数据分析与挖掘(第六章):主成分分析(1)——主成分分析概论
在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在多数情况下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性,同时对分析带来不便。如果分别对每个指标进行分析,分析往往是孤立的,而不是综合的。盲目减少指标会损失很多信息,容易产生错误的结论。
DoubleHelix
2019-12-16
9040
R语言数据分析与挖掘(第六章):主成分分析(2)——案例讲解
na.action:一个函数,指定缺失数据的处理方法,若为NULL,则使用函数na.omit()删除缺失数据。
DoubleHelix
2019-12-16
3.5K0
R语言数据分析与挖掘(第四章):回归分析(4)——logistic回归
前面我们介绍的回归方法,一般适用于数值型数据对象,对于分类数据类型就不再适用。对于分类数据对象,我们需要引入广义线性回归方法,比如logistic回归和poisson回归模型。这里我们介绍logistic回归。
DoubleHelix
2019-12-13
13.4K0
R语言数据分析与挖掘(第四章):回归分析(3)——变量的选择
  在数据挖掘的实战过程中,经常会遇到变量非常多的情况,即数据的维数很高,也称为“维数灾难”问题。在我们生物医学统计领域,一个数据集中可能存在成百上千个变量,对于回归处模而言,并不是越多变量越好,利用少而精的变量建模显得极为重要,如何选择变量子集就是解决问题的关键。
DoubleHelix
2019-12-13
8.5K0
R语言数据分析与挖掘(第九章):聚类分析(1)——动态聚类
在R语言中,用于实现k-means聚类的函数为kmeans(),其的数的基本书写写格式为:
DoubleHelix
2019-12-13
3K0
R语言数据分析与挖掘(第八章):判别分析(3)——费歇尔(Fisher)判别分析
我们之前介绍了判别分析中,因为判别准则的不同,可分为多种判别分析法。常用的有费歇尔(Fisher)判别分析、贝叶斯(Bayes)判别分析和距离判别分析。在上2篇文章中(判别分析——距离判别法和贝叶斯(Bayes)判别分析)介绍了距离判别分析和贝叶斯判别,本文将介绍贝费歇尔(Fisher)判别分析。
DoubleHelix
2019-12-13
8.2K0
R语言数据分析与挖掘(第四章):回归分析(2)——多元线性回归
上一篇文章中介绍了一元线性回归(R语言数据分析与挖掘(第四章):回归分析(1)——一元回归分析),然而,在实际操作中,多元性回归会更多见,因为一个响应变量会对应多个解释变量,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。
DoubleHelix
2019-10-01
4.3K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档