生信小驿站

100 篇文章
19 人订阅

全部文章

用户1359560

NA、Inf、NaN、NULL等值处理

这几个都是R语言里面的特殊值,都是R的保留字(reserved words)。它们的意义分别为:

673
用户1359560

Python数据处理从零开始----第四章(可视化)(4)目录正文

有时候需要展示连续变量的误差,matplotlib通过plt.plot和plt.fill_between来实现。下面通过Scikit-Learn程序库的API里...

421
用户1359560

Python数据处理从零开始----第四章(可视化)(6)(画布设置)目录正文

style包为易于切换的绘图『样式』增加了支持,它们与matplotlibrc文件参数相同。 有一些预定义样式由matplotlib提供。 例如,有一个名为『...

503
用户1359560

R语言之可视化④点韦恩图upsetR目录正文

介绍一个R包UpSetR,专门用来集合可视化,当多集合的韦恩图不容易看的时候,就是它大展身手的时候了。

602
用户1359560

R语言之可视化③点图续

函数scale_x_discrete可用于将项目的顺序更改为“2”,“0.5”,“1”:

542
用户1359560

Python数据处理从零开始----第四章(可视化)(4)(韦恩图)

matplotlib-venn 包提供了四个主要的函数:venn2、venn2-circles、venn3 和 venn3-circles。

592
用户1359560

R语言之可视化②点图

第一步:准备数据,使用的数据包括三列,len长度,supp是分类变量,dose是0.5mg,1mg和2mg三个变量。

684
用户1359560

TCGA生存分析③

TCGA 癌症基因组图谱(TCGA)是国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)之间的合作,收集了33种癌症类型的大量临床和基因组数据。 整...

544
用户1359560

TCGA生存分析②

接上文,Kaplan-Meier曲线有助于可视化两个分类组之间的生存差异,当你设置参数pval = TRUE时,可以获得的对数秩检验值有助于探讨不同组之间的生存...

883
用户1359560

R语言之可视化①误差棒

本教程介绍如何使用R软件和ggplot2包创建带有误差棒的图形。 可以使用以下函数创建不同类型的错误栏:

753
用户1359560

生存分析①R语言

生存分析(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小...

883
用户1359560

Python数据处理从零开始----第四章(可视化)(3)目录正文

plt.scatter相对于plt.plot的主要优势在于,前者在创建散点图时具有更高的灵活性,可以单独控制每个散点与数据匹配,也可以让每个散点具有不同的属性(...

572
用户1359560

R for data science (第一章) ②

添加其他变量的一种方法是aesthetics。 另一种对分类变量特别有用的方法是将绘图分割为多个子图,每个子图显示一个数据子集。要通过单个变量来划分您的绘图,请...

823
用户1359560

Python数据处理从零开始----第四章(可视化)背景:Matplotlib

我们现在将深入研究Matplotlib包,以便在Python中进行可视化。 Matplotlib是一个基于NumPy阵列的多平台数据可视化库,旨在与更广泛的Sc...

631
用户1359560

Python数据处理从零开始----第四章(可视化)(2)目录正文

=========================================================

772
用户1359560

R for data science (第一章)①Chapter1 使用ggplot2进行数据可视化

本章将教您如何使用ggplot2可视化您的数据。 R有几个用于制作图形的系统,但ggplot2是最优雅和最通用的系统之一。 ggplot2实现了图形语法,它是一...

602
用户1359560

gbm算法

gbm是通用梯度回归模型(Generalized Boosted Regression Models)简称。GBDT(Gradient Boosting Dec...

1180
用户1359560

决策树理论

在决策树理论中,有这样一句话,“用较少的东西,照样可以做很好的事情。越是小的决策树,越优于大的决策树”。数据分类是一个两阶段过程,包括模型学习阶段(构建分类模型...

990
用户1359560

机器学习预测乳腺癌良恶性(1)(逻辑回归)

逻辑回归算法思想:逻辑回归(LogisticRegression)是当前机器学习算法比较常用的方法,可以用来回归分析,也可以用来分类,主要是二分类问题。逻辑回归...

813
用户1359560

机器学习实战(2)之预测房价

数据预处理要点: 1.使用log(x+1)来转换偏斜的数字特征 -,这将使我们的数据更加正常 2.为分类要素创建虚拟变量 3.将数字缺失值(NaN)替换为...

933

扫码关注云+社区