首页
学习
活动
专区
工具
TVP
发布

生信修炼手册

专栏作者
877
文章
1749433
阅读量
182
订阅数
《实用医学统计学与SAS应用》学习笔记 | 绪论
统计学的概念:统计学是一门处理数据中变异性的科学与艺术,内容包括收集,整理,分析,解释和表达数据,以获得可靠的结果。
生信修炼手册
2023-03-09
4470
文献阅读|Nomograms列线图在肿瘤中的应用
列线图,也叫诺莫图,在肿瘤研究的文章中随处可见,只要是涉及预后建模的文章,展示模型效果除了ROC曲线,也就是列线图了。那么列线图究竟是什么,列线图怎么得到,从图中我们可以得到哪些信息,带着这些问题,我们来阅读下面的这篇文献,地址如下
生信修炼手册
2022-06-09
2.2K0
绘制cox生存分析结果的森林图
每一行表示一个study,用errorbar展示log odds ratio值的分布,并将p值和m值标记在图中。森林图主要用于多个study的分析结果的汇总展示。
生信修炼手册
2022-06-09
2K0
冲击图和桑基图,傻傻分不清楚!
在之前的文章中,我们介绍了桑基图的可视化原理,而冲击图作为桑基图的一个子类,其展示的信息和桑基图基本一致,只不过在输入数据的格式上要略作调整。
生信修炼手册
2022-06-09
1.3K0
好看的桑基图是如何炼成的!
Sankey Diagram, 也叫做桑基图,是一种展示数据流的可视化方式,一张典型的桑基图示例如下
生信修炼手册
2022-06-09
1.5K0
ConsensusClusterPlus, 一步到位的一致性聚类!
在之前的文章中分享了一致性聚类的原理,本文介绍下如何用R语言进行分析。ConsensusClusterPlus这个R包,就是专门用于一致性聚类分析的,为了简化调用,甚至将所有的步骤都封装到了一个函数里面,所以其使用方法非常的简单,一共三步
生信修炼手册
2022-06-09
5.4K0
巧用热图展示基因分布的总体趋势
热图是最常见的基因表达量数据的可视化方式,将每个单元格的表达量按照数值高低映射为不同的颜色,可以直观展示表达量在不同样本间的分布,再综合聚类的结果和基因/样本的注释信息,进一步丰富了展示的信息,一个经典的热图如下
生信修炼手册
2022-06-09
1.2K0
使用sva包处理批次效应
需要注意的是,在校正批次效应之前,表达量数据必须经过归一化操作,而且去除了缺失的基因,比如在80%的样本中没有表达量的基因。
生信修炼手册
2022-06-09
2.1K0
背景校正,芯片预处理的第一步!
对于芯片数据而言,在分析之前,需要先进行背景校正background correct。所谓背景校正,其本质上都是一个减法,将总体信号看做由探针特异性的结合信号(真实信号)和非特异性结合(噪声信号)两部分组成,背景校正的工作就是从总体信号中减去噪声信号,从而得到真实信号。
生信修炼手册
2022-04-18
6160
深度学习基本概念|张量tensor
深度学习常用于处理图像,文本,语音等数据,在计算机中,需要将这些数据用合适的数据结构来存储。以图像为例,每一幅图像可以看作由像素点构成的二维数组,而每个像素点又可以表示成RGB对应的3元组,经过这样的嵌套之后,每一幅图像实际上变成了一个高阶数组, 图示如下
生信修炼手册
2021-07-06
7980
机器学习专题
随着人工智能的火热,机器学习和深度学习技术再一次进入了大众的视野。python的scikit-learn模块专注于机器学习领域,提供了数据集构建,数据预处理,模型算法,效果评估等各个环节的接口,是入门机器学习的最佳模块。
生信修炼手册
2021-07-06
3260
前馈神经网络与反向传播算法
在上述网络中,信号从输入层开始,经过线性组合和激活函数的处理,输入到下一层的神经元,信号依次经过各个隐藏层的处理,最终输出到输出层,这样的信号传递是一个正向传递的过程,这种结构的神经网络称之为前馈神经网络。
生信修炼手册
2021-07-06
1.2K0
聚类模型评估指标之外部方法
聚类算法的理想结果是同一类别内的点相似度高,而不同类别之间的点相似度低。聚类属于无监督学习,数据没有标签,为了比较不同聚类模型的好坏,我们也需要一些定量的指标来进行评估。根式是否提供样本的标签信息,相关的指标可以分为以下两大类
生信修炼手册
2021-05-27
2.4K0
异常点检测算法
在进行机器学习建模之前,首先要对数据中存在的异常点样本进行过滤,异常点,也叫做离群点,对数据的归一化,以及后续建模的准确性都会造成影响。因此,必须先去除异常点,常用的有以下3种策略
生信修炼手册
2021-04-29
8570
LLE降维算法
流形分析的要点在于降维之后,仍然保留流形中的某些几何属性。之前介绍的isomap保留了测地距离这一几何属性,由于考虑的是全局关系,对于样本量大,维度非常高的数据,计算量很大。本片文章的主角LLE算法,保留的是局部样本点之间的线性关系,算法复杂度低,运行速度更快。LLE全称如下
生信修炼手册
2021-04-29
8290
isomap降维算法
降维算法分为线性和非线性两大类,主成分分析PCA属于经典的线性降维,而t-SNE, MDS等属于非线性降维。在非线性降维中,有一个重要的概念叫做流形学习manifold learing。
生信修炼手册
2021-04-29
8960
使用t-SNE算法进行可视化
t-Distributed Stochastic Neighbor Emdedding
生信修炼手册
2021-04-15
8710
LDA线性判别分析
线性判别分析,全称是Linear Discriminant Analysis, 简称LDA, 是一种属于监督学习的降维算法。与PCA这种无监督的降维算法不同,LDA要求输入数据有对应的标签。
生信修炼手册
2021-04-14
7350
非负矩阵分解NMF
non-negative matrix factorization,简写为NMF, 翻译为非负矩阵分解,属于矩阵分解的一种算法。在特征分解,SVD等传统的矩阵分解技术中,分解后的矩阵会出现负值,但是负值在实际场景中是没有意义的,比如在图像处理领域,图像是由像素点构成的矩阵,每个像素点由红,绿,蓝的比例构成,这些数值都是非负数,在对分解处理得到的负值并没有实际意义。
生信修炼手册
2021-04-14
1.1K0
MDS多维尺度分析
MDS是一种常用的降维算法,其基本思想是保证高维空间映射到低维空间之后,样本间的相对距离基本不变。
生信修炼手册
2021-04-14
1.5K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档