首页
学习
活动
专区
工具
TVP
发布

生信小驿站

专栏作者
354
文章
842013
阅读量
162
订阅数
R语言之可视化(31)扫地僧easystats(2)相关性分析
相关性是一个专注于相关性分析的easystats软件包。 它轻巧,易于使用,并允许计算许多不同类型的相关性,例如偏相关性,贝叶斯相关性,多级相关性,或Sheperd的Pi相关性(鲁棒相关性的类型),距离相关(一种非线性相关性)等等,还允许它们之间进行组合(例如,贝叶斯局部多级相关性)。
用户1359560
2020-05-08
1.6K0
使用pandas构建简单直观的数据科学分析流程
我们将展示如何使用一个名为pdpipe的小库使用Pandas构建直观而有用的分析流程(管道)。
用户1359560
2019-12-11
9550
R语言meta分析(7)诊断性meta分析(meta4diag包)
meta4diag程序包是R软件中专用于实现诊断准确性试验(diagnostic test accuracy,DTA) Meta分析的程序包,该程序包基于贝叶斯理论采用INLA(integrated nested Laplace approximation)法来对 单个研究效应值进行合并,同时,该程序包还提供了SROC(Summary Receiving Operation Characteristic) 曲线图的分析与绘制,然而其缺陷在于无法给出异质性检验及风险偏倚评估。本文以实例形式就 meta4diag程序包实现诊断准确性试验DTA Meta分析的数据准备与分析、结果汇总及图形绘制等功能作相 关简述。
用户1359560
2019-12-02
2.6K0
一文解决CIBERSORT网页版和R语言版
CIBERSORT 是基于线性支持向量回归(linear support vector regression)的原理对人类白细胞亚型的表达矩阵进行去卷积的一个网页版工具。多用于芯片表达矩阵,对未知混合物和含有相近的细胞类型的表达矩阵的去卷积分析优于其他方法 (LLSR,LLSR,PERT,RLR,MMAD,DSA) 。该方法仍然是基于已知参考集,提供了22种白细胞亚型的基因表达特征集—LM22. 网址链接:http://cibersort.stanford.edu/
用户1359560
2019-07-22
14K3
R语言网状Meta 分析-原理和实战
近年来基于严格设计的随机对照试验(RCT)已经被公认为评价干预措施疗效的最佳手段,这种比较所采用的针对两组研究结果比较的定量综合方法,被称为传统的 Meta 分析方法。传统 Meta 分析通过合并多个直接比较的研究而得到一个综合的评估结果,从而克服了单个研究样本量不足的缺陷,提高了研究的检验效能,特别是研究结果出现不一致时,运用 Meta 分析对判断某种干预措施的有效性与否发挥了重要作用。当欲开展两种干预措施利弊比较(A vs B)的 Meta 分析,但不能找到 A vs B 直接比较的 RCT,却可找到 A vs C与 B vs C 进行比较的 RCT,我们可以将 C 作为共同对照,通过 A vs C 与 B vs C的比较结果来间接得到 A vs B 的疗效比较,这种方法叫做间接比较(indirect comparison)。在实际的临床工作中,临床医生常常需要同时比较多种干预措施,权衡利弊以进行临床决策,这时证据网络中既存在直接证据,又存在间接证据,这种综合直接及间接证据的分析方法即为网状 Meta 分析(Network Meta-analysis, NMA)。 网状 Meta 分析可以同时比较三个或三个以上干预措施的疗效,因而被认为是传统 Meta 分析的扩展及延伸,即 NMA 可基于严格设计 RCT 同时比较多个干预措施,对直接及间接比较进行综合性分析。当无直接比较的研究存在时,间接比较成为提供有价值的卫生决策信息的有效途径;当有直接比较的研究存在时,综合直接比较与间接比较的研究结果能够提高结果的精度。不仅如此,NMA 还能够就不同干预措施的疗效进行排序,提供每一个干预措施是最佳干预措施的概率。关于 Meta 分析方法的研究迄今已经有 30 多年的时间,NMA作为一门新崛起的、一种循证医学统计学方法,越来越受到流行病学家、统计学家、临床研究者及药学家的关注及青睐。
用户1359560
2019-06-24
3.3K0
一文解决RNA测序资料的差异
本文目标: (1)使用edger包做TCGA数据库RNA-seq数据差异分析 (2)使用deseq包做TCGA数据库RNA-seq数据差异分析 (3)使用limma包做TCGA数据库RNA-seq数据差异分析 (4)如何在没有生物学重复的情况下(比如说只有两个样本,来求取差异基因)
用户1359560
2019-06-15
1.5K0
机器学习之决策树理论
在决策树理论中,有这样一句话,“用较少的东西,照样可以做很好的事情。越是小的决策树,越优于大的决策树”。数据分类是一个两阶段过程,包括模型学习阶段(构建分类模型)和分类预测阶段(使用模型预测给定数据的类标号)。决策树分类算法属于监督学习(Supervised learning),即样本数据中有类别标号。下面是两个阶段的简单描述:
用户1359560
2019-01-03
5090
Python从零开始第六章机器学习①逻辑回归
在本节中,您将使用机器学习算法解决泰坦尼克号预测问题:Logistic回归。 Logistic回归是一种分类算法,涉及预测事件的结果,例如乘客是否能够在泰坦尼克号灾难中幸存。
用户1359560
2018-12-26
5080
使用R语言进行机器学习特征选择②
特征工程其实是一个偏工程的术语,在数据库领域可能叫做属性选择,而在统计学领域叫变量选择,其实是一个意思:即最大限度地从原始数据中提取有用信息以供算法和模型使用,通过寻求最优特征子集等方法使模型预测性能最高。
用户1359560
2018-10-22
1.6K0
机器学习总揽①
看到不错的,记录分享出来 图片发自简书App 图片发自简书App
用户1359560
2018-10-08
2570
机器学习算法选择流程
?
用户1359560
2018-08-27
4950
R语言 朴素贝叶斯分类器①
这种学习方法基于条件概率,也就是通过已经给定的东西来推断一件事情的发生可能性。朴素贝叶斯应用了贝叶斯定理和朴素独立性假设。
用户1359560
2018-08-27
7820
主成分分析①
principal() 含多种可选的方差旋转方法的主成分分析 fa() 可用主轴、最小残差、加权最小平方或最大似然法估计的因子分析 fa.parallel() 含平行分析的碎石图 factor.plot() 绘制因子分析或主成分分析的结果 fa.diagram() 绘制因子分析或主成分的载荷矩阵 scree() 因子分析和主成分分析的碎石图
用户1359560
2018-08-27
8241
无监督学习 聚类分析④
假如我们随机选取了100名男生和100名女生,两百个人混在一起,而目前只有每个人学生的身高数据,我们既不知道每个身高数据所对应的性别,也不知道男生和女生两个群体的总体身高分布情况。首先我们假设男生身高分布符合170cm的正太分布,而女生身高符合160cm的正态分布。通过这个假设的参数,对所有的身高数据进行性别分类。当完成分类后,通过对预测的男生,女生两个群体的分布来修改之前假设的身高分部参数。如此循环,直至收敛。
用户1359560
2018-08-27
3590
机器学习算法①
这个算法由一个目标/结果变量(或因变量)组成,这个变量可以从一组给定的预测变量(独立变量)中预测出来。 使用这些变量,我们生成一个将输入映射到所需输出的函数。 训练过程一直持续到模型达到训练数据所需的准确度。 监督学习的例子:回归,决策树,随机森林,KNN,逻辑回归等。
用户1359560
2018-08-27
2590
监督式和非监督式机器学习算法
监督式学习指的是你拥有一个输入变量和一个输出变量,使用某种算法去学习从输入到输出的映射函数
用户1359560
2018-08-27
5660
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档