生物信息与临床医学专栏

结合生物大数据分析与临床实践
68 篇文章
15 人订阅

全部文章

生信与临床

孟德尔随机化之因果推断的假设(一)

工具变量(IV)技术是可用于估算因果效应的几种方法之一,而无需完全了解所有可能影响暴露-结局关系的混杂因素。在这一期中,我们继续回顾和讨论IV的特性,并探讨实际...

8110
生信与临床

PRSice使用文档(英文版)

usage: Rscript PRSice.R [options] <-b base_file> <-t target_file> <--prsice prsi...

8610
生信与临床

多基因风险评分2

众所周知,人体的染色体是由A、T、C、G四种碱基组成的DNA双螺旋结构,其中A碱基与T碱基相对,C碱基与G碱基相对。换言之,如果一条DNA单链某位置上的碱基是A...

8020
生信与临床

多基因风险评分3

PRSice是当前比较流行的多基因风险评分工具,它主要是用R语言编写的,运行速度快,可以高通量处理大数据。它既有Linux版本,也有Windows版本,由于我们...

7810
生信与临床

R语言进阶之Lattice绘图

由Deepayan Sarkar编写的“lattice”包是在R语言基础绘图系统上开发的绘图包。它最大的特点就是优化基础绘图的默认值并能更简单地去展示多元关系,...

7320
生信与临床

多基因风险评分1

多基因风险评分(Polygenic Risk Score,PRS),有时也称为遗传风险评分(Genetic Risk Score,GRS),它主要用于评估个体患...

8830
生信与临床

Linux下文本的简单处理(awk和sed)

最近,米老鼠经常需要处理大型文本(500M以上),用R和Python感觉有点太慢,所以就直接使用Linux指令处理了。

7510
生信与临床

R语言进阶之如何正确认识判别分析和聚类分析

到现在为止,我已经和大家讲解过判别分析和聚类分析了,可能有些朋友会认为这两个是一回事,在这里我需要强调一下------判别分析和聚类分析是两回事!!!

4821
生信与临床

R语言进阶之生存分析

在医学研究中,生存分析是一类非常重要的统计方法,它主要的目的是对生存率和时间进行建模,计算患者在特定时间段内生存的概率,主要用于评估治疗的效果和疾病的危险程度。...

6310
生信与临床

R语言入门之频率表和列联表

‍‍‍‍‍‍在这一期我们将要学习如何针对分类变量数据创建频率表和列联表,之后在此基础之上进行独立性检验、关联度测量以及相关数据的可视化。

12730
生信与临床

R语言入门之评估假设检验的条件

在传统的假设检验过程中,我们常常假定模型的误差项是符合正态分布且同方差的。对于这样的假设是否真的成立,通常情况下我们可以使用诊断图来进行判断,但在这里我将和大家...

8720
生信与临床

R语言进阶之广义线性回归

广义线性回归是一类常用的统计模型,在各个领域都有着广泛的应用。今天我会以逻辑回归和泊松回归为例,讲解如何在R语言中建立广义线性模型。

7740
生信与临床

R语言入门之数据排序、合并、分类汇总

在R中对数据框中的数据排序,我们通常使用order()函数,该函数默认是升序,但是在要排序的变量前加上减号(-)就相当于降序排列了。

9630
生信与临床

R语言进阶之判别分析

R语言的“MASS“包是一个十分强大的统计包,可以进行各种统计分析,我也将围绕它来介绍判别分析。”MASS“包既可以进行线性判别,也可以进行二次判别。除非指定先...

7010
生信与临床

R语言进阶之聚类分析

R语言拥有大量和聚类分析相关的函数,在这里我主要会和大家介绍K-means聚类、层次聚类和基于模型的聚类。

8620
生信与临床

R语言入门之偏度(skewness)与峰度(kurtosis)

偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。在定义上,偏度是样本的三阶标准化矩:

16430
生信与临床

R语言入门之散点图

在R中有很多方式去绘制散点图,其中最基本的就是是用plot(x, y)函数,往期内容已经进行过详细讲解,这里就不赘述了,下面直接看实例图。

7920
生信与临床

网状Meta分析之R语言‘gemtc’包实战(3)

这次和大家分享的还是基于R包‘gemtc‘的网状Meta分析,之前已经讲解过如何导入数据以及使用固定效应模型去分析。这一次主要内容是使用随机效应模型去进行网状M...

10320
生信与临床

R语言入门之变量重编码与重命名

在很多时候,我们需要对数据进行分类,比如根据血糖值将患者分成糖尿病组与非糖尿病组,亦或者按照年龄将样本分为老年人,中年人和青年人等等,这些就需要我们对数据进行重...

6620
生信与临床

初探PLINK文件格式(bed,bim,fam)

近十几年来,全基因组关联研究(Genome-Wide Association Study,GWAS)迅速发展,为探索疾病的发病机制做出了突出贡献,也为精准医学的...

13520

扫码关注云+社区

领取腾讯云代金券