腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

生信小驿站

专栏作者

354

文章

840830

阅读量

162

订阅数

一篇基于美剧的scientific study（绘制临床三线表）

文章标题：“Death is certain, the time is not”: mortality and survival in Game of Thrones 网址：

2018-12-27

7110

Python从零开始第五章生物信息学②热图及火山图目录

通过上一篇的过程，我们得到了该数据集的差异分析的两个关键参数，1.差异倍数（foldchange）以及2.（差异的P值）。在这一篇中，我们目的是得到满足差异倍数和差异P值得基因，以及同时进行可视化（包括差异分析常见的火山图和热图）。

2018-12-21

1.6K0

Python数据处理从零开始----第四章（可视化）①③多变量绘图目录

科研工作中我们经常需要把每两个变量之间的关系计算，然后可以得到一个相关矩阵。如果两个变量的变化趋势一样，那么这个值就会大于零，表明连个变量正相关，值越大代表相关性越强。相反的话，如果两个变量的变化趋势相反，这个值就会小于零。我们经常需要关注这个值，是因为在许多机器学习算法中，强相关的变量会导致算法能力下降。

2018-12-21

4820

R语言之生信⑧Cox比例风险模型(多因素)目录正文

现在，我们想描述这些因素如何共同影响生存。为了回答这个问题，我们将进行多变量Cox回归分析。由于变量ph.karno在单变量Cox分析中不显着，我们将在多变量分析中跳过它。我们将3个因素（性别，年龄和ph.ecog）纳入多变量模型。

2018-12-19

4.3K0

Python数据处理从零开始----第三章（pandas）④数据合并和处理重复值目录数据合并移除重复数据

===============================================

2018-12-19

3.3K0

Python数据处理从零开始----第四章（可视化）(11)多分类ROC曲线目录

===============================================

2018-12-18

1.6K0

R语言之生信⑦Cox比例风险模型(单因素)目录

在前一章（TCGA生存分析）中，我们描述了生存分析的基本概念以及分析和总结生存数据的方法，包括：1.危险和生存功能的定义 2.为不同患者群构建Kaplan-Meier生存曲线用于比较两条或更多条生存曲线的logrank检验

2018-12-18

3.4K0

Python数据处理从零开始----第四章（可视化）(10)二分类ROC曲线目录

机器学习中对于分类模型常用混淆矩阵来进行效果评价，混淆矩阵中存在多个评价指标，这些评价指标可以从不同角度来评价分类结果的优劣，以下内容通过简单的理论概述和案例展示来详细解释分类模型中混淆矩阵的评价指标及其用途。

2018-12-17

9590

Python数据处理从零开始----第三章（pandas）②处理缺失数据

在实际应用中对于数据进行分析的时候，经常能看见缺失值，下面来介绍一下如何利用pandas来处理缺失值。常见的缺失值处理方式有，过滤、填充。

2018-12-14

1.1K0

Python数据处理从零开始----第三章（pandas）①删除列目录

在这里默认：axis=0，指删除index，因此删除columns时要指定axis=1； inplace=False，默认该删除操作不改变原数据，而是返回一个执行删除操作后的新dataframe；inplace=True，则会直接在原数据上进行删除操作，删除后就回不来了。

2018-12-14

7680

R语言之可视化①④一页多图（1）目录

其他 r 语言

这里要分享一页多图其实就是指，在做了很多图的情况下，如何将诸多图表合理的布局在一张大的版面上，而不是一幅一幅的导出最后在其他软件中手动拼凑。这个技能在制作多图仪表盘场景下，将会特别有用。还需要强调下这里所指的一页多图与我们之前介绍过的分面可是大有不同，分面其实是一幅图表中，将分类变量所构成的分类图表分图呈现，但是本质上所有分面内的单个图表共享标题、图例、坐标轴刻度（虽然可以手动定义）。也就是说分面的图表类型与诸多元素都是一样的，但是分面解决不了不同图表的排版布局问题：比如单独绘制而成的一幅散点图、柱形图和一幅饼图，分面将无能为力。

2018-12-14

8280

R语言之可视化①③散点图+拟合曲线目录

gene2) Pearson's product-moment correlation data: data gene1 and data$gene2 t = 2.4858, df = 395, p-value = 0.01334 95 percent confidence interval: 0.02600102 0.21984192 cor 0.1241053

2018-12-14

2.2K0

Python数据处理从零开始----第四章（可视化）(9)线性相关曲线目录

这是通过python语言绘制的线性相关曲线拟合图，感觉比R语言在代码上更简洁，且图片能展示的信息更多。

2018-12-14

5650

Python数据处理从零开始----第四章（可视化）(8)火山图目录

来源数据分别是差异基因分析的两列指标，FoldChange和Pvalue值，根据这两个指标，我们可以把基因分为up，down和normal三种差异表达类型，然后使用python的seaborn程序绘制散点图即可。最终得到想要的火山图，相对于ggplot2绘制火山图python的优点是步骤明确易懂。

2018-12-13

8880

R语言之可视化⑩坐标系统目录

ggplot2可以通过coord_flip()切换x和y轴。例如，如果你想要水平箱形图。这对长标签也很有用：很难让它们在x轴上不重叠的情况下适合。

2018-12-13

6530

R.python常见问题③（xgboost介绍和安装）

XGBoost ：eXtreme Gradient Boosting 项目地址：https://github.com/dmlc/xgboost

2018-12-12

1.1K0

R语言之可视化⑦easyGgplot2散点图目录

ggplot2.stripchart是一个易于使用的函数（来自easyGgplot2包），使用ggplot2绘图系统和R软件生成条带图。条形图也被称为一维散点图（或点图）。当样本量较小时，这些图比较适用于箱型图。

2018-12-12

7720

Python数据处理从零开始----第四章（可视化）（7）（多图合并）目录正文

=========================================================

2018-12-12

5730

R语言之可视化⑥R图形系统续目录

ggplot2包中的主要功能是ggplot（），它可用于使用数据和x / y变量初始化绘图系统。例如，以下R代码将数据集初始化为ggplot，然后将一个图层（geom_point（））添加到ggplot上，以创建x = Sepal.Length的散点图y = Sepal.Width：

2018-12-12

1.9K0

R语言之可视化⑧easyGgplot2散点图续目录

目录 R语言之可视化①误差棒 R语言之可视化②点图 R语言之可视化③点图续 R语言之可视化④点韦恩图upsetR R语言之可视化⑤R图形系统 R语言之可视化⑥R图形系统续 R语言之可视化⑦easyGgplot2散点图 R语言之可视化⑧easyGgplot2散点图续 ====================================== 根据组更改条形图颜色可以将颜色指定为十六进制RGB三元组，例如“＃FFCC00”或名称。还可以使用其他颜色比例，例如从RColorBrewer包中提取的颜色比例。

2018-12-12

9550

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态