优雅R

269 篇文章
24 人订阅

全部文章

王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「R」数据可视化21: Edge Bunding图

本文作者蒋刘一琦,自嘲是一个有艺术追求的生信狗,毕业于浙江大学生物信息学专业,目前在复旦大学就读研究生,研究方向为宏基因组。

9310
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

随机森林概览:创建,使用和评估

决策树在训练集中的表现较好,但是因其不具有灵活性而在其他外部数据中的表现略差。由许多决策树组成的随机森林更具有灵活性,从而较大地提高了准确预测的能力。

8510
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「Workshop」第十九期:Markdown与RMarkdown最佳入口

目前对于两者的介绍网上一大堆,而且本身语法简单,上手很快,这里不会过多介绍。**本文的核心在于让读者了解这些工具以及根据需要去学习和利用它们。**这里主要为初学...

7430
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「翻译」在生物信息学中使用 GNU-Parallel

原文出处:https://www.danielecook.com/using-gnu-parallel-for-bioinformatics/

9820
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

线性判别分析总览

线性判别分析总览(Linear Discriminant Analysis,LDA):用于数据预处理中的降维、分类任务,其目标是找到能够最大化类间区分度的坐标轴...

7910
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

使用 rush 进行命令并行处理

rush 是一个类似于 GNU-parallel 的工具,提供了并行化命令的处理方案。官方地址是:https://github.com/shenwei356/r...

6720
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「Workshop」第十七期 奇异值分解

奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以...

10620
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

正则化(3):弹性网络回归

引言:在前面一小节中我们指出,在含有多个参数的模型中,如何做出对模型的优化。岭回归更好?还是lasso回归更优?参考:正则化(2):与岭回归相似的 Lasso ...

5830
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

正则化(2):与岭回归相似的 Lasso 回归

Lasso回归与ridge回归有很多相似之处,但是二者之间有一些显著的区别。如果你不太清楚岭回归,请参考前一章节推文:通俗易懂的岭回归。

4520
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

正则化(1):通俗易懂的岭回归

引言:在学习本章节的的内容之前,如果你不太熟悉模型的方差与偏差(偏差与方差(Bias and Variance)),此外还有简单线性模型、多元线性模型(线性回归...

8730
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「Workshop」第十六期:Pandas 使用介绍

7910
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「R」绘制分组排序点图

我在看过的一些 Nature 文章和 COSMIC 数据库中看到用点图来展示不同癌症类型下 TMB 的分布差异。在 R 包中,我有看到过 maftools 中可...

6430
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

交叉验证法(​cross validation)

基于一些已知样本,根据其变量(是否出现胸痛、是否有良好的血液循环、是否有闭锁的动脉、体重指标),预测其是否患有心脏病(左侧)。接着,出现一个新来的患者,我们可以...

9920
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「Workshop」第十四期:线性回归

表示第i个因变量(reponse), 表示第i个自变量(feature), 是需要模型的参数, 是噪音或者说随机误差(random error),在线性回归里面...

9120
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「R」使用有限混合模型

Flexmix 这个包的文档看起来让人很蒙蔽,完全搞不懂核心的一些建模函数。我下面测试下不同的接口使用的效果。

8740
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

在 Hiplot 中使用 Sigflow

突变模式(印记)分析(mutational signature analysis)目前已经成为变异检测后一个重要分析流程,它能够揭示癌症组织样本受哪些内外界因素...

6610
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「R」使用 tinyscholar 展示个人谷歌学术档案

谷歌学术是目前感觉最好的学术搜索引擎,谷歌学术档案提供了学者的个人学术信息,不过通常情况我们无法查看和使用这个信息。Y 叔写的 scholar[1] 包虽然提供...

8640
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「Workshop」第十三期:统计检验与多重矫正

假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。

7810
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

「R」Rprofile:R 全局设置

根据我的 R 使用经验,结合 Y 叔和 Yihui 提供的一些便利函数,我构建了一个比较合适的 R 配置。推荐大家结合自己需求使用和自定义。

8610
王诗翔呀

上海科技大学 · 博士研究生 (已认证)

PicGo + Gitee 构建免费云图床

PicGo 下载链接:https://github.com/Molunerfinn/PicGo/releases/

6420

扫码关注云+社区

领取腾讯云代金券