首页
学习
活动
专区
工具
TVP
发布

生信小驿站

专栏作者
354
文章
842574
阅读量
162
订阅数
适合用于FPKM数据求差异基因的ballgown算法
对于FPKM表达数据时,Edger,limma,和deseq等算法并不合适。而ballgown是针对于FPKM数据开发的差异基因算法,可以尝试。 示例数据如下所示:
用户1359560
2021-12-06
1.2K0
安装rJava包
当我们安装rJava时发现,载入不了报错。这是因为电脑没有JAVA运行环境,故需要下载安装JAVA,并配置环境变量。
用户1359560
2020-12-22
9910
美化cytoscape图片
首先我们进入STRING网站的官网(网址为https://string-db.org/),选择好蛋白的输入方式后,输入一列差异基因,STRING网站对基因的限制条件是不超过2000个基因,格式也是每行
用户1359560
2020-10-29
2.9K0
stringr包基础操作
stringr构建在stringi之上,stringr专注于最重要且最常用的字符串操作函数,而stringi提供了涵盖几乎所有可以想象的内容的全面集合。 如果发现stringr缺少所需的功能,请尝试查看stringi。
用户1359560
2020-10-28
4240
R语言整理string数据库
(1)下载string数据框记录文件 Downloads/STRING: functional protein association networks https://string-db.org
用户1359560
2020-09-01
6760
使用R语言绘制string蛋白互作图
STRING(https://www.string-db.org)是已知和预测的蛋白质-蛋白质相互作用的数据库。交互包括直接(物理)关联和间接(功能)关联。数据库包含来自众多来源的信息,包括实验资料库,计算预测方法和公共文本集。每次互动都与组合的置信度相关综合各种证据的分数。目前,涵盖了来自5090的超过24百万种蛋白质生物。STRING数据库可用于在基因列表中添加含义。STRINGdb R软件包,以方便用户访问STRING中的数据库。在本指南中,以示例说明了该软件包的大多数功能。此外,iGraph包作为代表蛋白质-蛋白质相互作用网络的数据结构。
用户1359560
2020-09-01
2.3K0
R语言meta分析(10)功能强大的metafor
Metafor 程序包由Viechtbauer 开发,除可完成 二分类及连续性变量的Meta 分析外,还可行Meta 回归分析、累积Meta 分析及对发表偏倚的Begg’s 检验和Egger’s 检验,同时可以绘制森林图(forest plot)、漏斗图(funnel plot)、星状图(radial plot)、 拉贝图(L’Abbé plot)以及 Q-Q 正态分位图(Q-Q normal plot)。此外,Metafor 程序包是R 软件Meta 分析程序包中唯一可以进行混合效应模型(包括单 个、多个分类或连续性变量)拟合运算的程序包, 还可以检验模型系数并获得可信区间,以及对参数 进行精确检验如置换检验(permutation tests)。
用户1359560
2020-08-28
3.3K0
R语言之可视化(31)扫地僧easystats(2)相关性分析
相关性是一个专注于相关性分析的easystats软件包。 它轻巧,易于使用,并允许计算许多不同类型的相关性,例如偏相关性,贝叶斯相关性,多级相关性,或Sheperd的Pi相关性(鲁棒相关性的类型),距离相关(一种非线性相关性)等等,还允许它们之间进行组合(例如,贝叶斯局部多级相关性)。
用户1359560
2020-05-08
1.6K0
寻找核心基因+子网络
一般做完差异基因,或者使用其他方法找到想要的biomarker时,想要知道这些基因的调控网络,或者哪些基因在调控网络中处于核心位置,比较常见的方法就是wgcna或者mcode、Cytohubba。这篇主要介绍mcode和Cytohubba。
用户1359560
2020-05-04
2.2K0
Python数据处理从零开始----第四章(可视化)(20)华夫饼图
华夫饼图(Waffle Chart),有的人也会叫它“Square Pie Chart”,是饼图的一种变形,擅长展示部分在整体中的占比关系。一般来说,华夫饼图是由100个格子组成,一个格子代表“1%”。用不同颜色的格子区分不同的分类数据,以展示各部分在整体中的占比。华夫饼图(Waffle Chart),或称为直角饼图,可以直观的描绘百分比完成比例情况。与传统的饼图相比较,华夫饼图表达的百分比更清晰和准确,它的每一个格子代表 1%。
用户1359560
2020-02-25
6610
Python数据处理从零开始----第四章(可视化)(18)一文解决柱状图barplot or barchart
柱状图(或条形图)是最常见的图类型之一。 它显示了数值变量和类别变量之间的关系。 (1)绘制基础柱状图
用户1359560
2020-02-18
5960
Python数据处理从零开始----第四章(可视化)(17)一文解决箱型图box plot
Boxplot是对数据分布进行可视化的绝佳方法。但是,请注意,箱型图可以隐藏单个数据的值。因此,强烈建议在箱线图中显示所有观察结果值。而如果有许多观察结果,小提琴图可能是一个有趣的选择。 (15)在箱型图上添加数据点
用户1359560
2020-02-18
9970
Python数据处理从零开始----第四章(可视化)(16)一文解决小提琴图violin plot
(1)输入数据 所使用的是经典的iris数据, 包括有sepal_length, sepal_width, petal_length,petal_width和 species五个变量,其中前四个为数字变量,最后一个为分类变量 import seaborn as sns df = sns.load_dataset('iris') df.head() Out[25]: sepal_length sepal_width petal_length petal_width species 0
用户1359560
2020-02-18
7420
R语言naniar包(新名词:阴影矩阵;Shadow matrices)
因为ggplot2不能处理缺失值,所以我们得到了一个warning message ,我们可以使用geom_miss_point() 去展示缺失数据。
用户1359560
2020-02-11
1.6K0
入门和初级R语言使用者的界限??
记得刚开始学编程的时候,总有同学问我怎么学写循环,在一些人心中,入门和初级的R语言使用者的界限似乎就是能否熟练写循环或者函数,所以今天这个教程就是写的专门针对如何开始写循环。
用户1359560
2020-01-02
8930
使用Tidyr重塑数据
虽然R中存在许多基本的数据处理函数,但它们至今仍有一点混乱,并且缺乏一致的编码和容易地将流一起的能力。这导致很难记忆和操作。因此我们需要更有效的代码、更容易记住语法和易于阅读的语法。而tidyr正是一个这样的包,它的唯一目的是简化创建[tidy data]的过程。本教程使您基本了解tidyr提供的数据整理的四个基本功能:
用户1359560
2019-10-24
8250
一文解决筛选低变化的基因/变量(R语言)
(1)在日常生信分析中,经常遇到的问题是需要在做差异分析或者生存分析或者相关分析、WGCNA等等分析时,经常一个卡住许多分析者的步骤是基因或者变量太多,导致分析速度太慢或者无法分析。所以这一次的笔记是提供一个初筛的过程,在做其他的生信相关分析以前,筛选掉一些几乎在样本中没有变化或者变化较低的基因或者变量,从而大大的缩减生信分析所需的时间或者资源。 (2)在大规模生信分析时,当基因数目很大时,对每一个基因进行单因素分析比较慢,所以一个比较能够节省资源的做法是,将原先为数值类型的表达矩阵转化为‘low’,‘high’样式的表达矩阵。这样的优势为:第一可以大大的节省生信分析所需的资源或者时间,对笔记本要求比较低。第二这样做出来的生存分析与KM生存曲线是相对应的,这样不会遇到某些基因在连续型变量的单因素分析与KM生存曲线法生存分析所得到的的P值存在典型差异。
用户1359560
2019-10-10
1.5K0
数据处理神器tidyverse(2)ggplot2
tidyverse包其中包含着一个重要的可视化包---ggplot2。 Ggplot2是由Hadley Wickham制作的数据可视化软件包,它基于一组称为图层的原则。 基本思想是ggplot2将数据的几何对象(圆圈,线条等),主题和比例放在上面。 几何对象的形式由geom_xxx()函数定义,基于数据变量的几何对象的属性(位置,大小,颜色)由美学(aes())函数指定( 在geom_xxx()函数中)。任何ggplot图的基础层都是由ggplot()函数定义的空ggplot层,它描述了用于绘图的数据框。
用户1359560
2019-08-29
2K0
一文解决列线图(nomogram)
列线图,又称诺莫图(Nomogram),它是建立在多因素回归分析的基础上,使用多个临床指标或者生物属性,然后采用带有分数高低的线段,,从而达到设置的目的:基于多个变量的值预测一定的临床结局或者某类事件发生的概率。
用户1359560
2019-08-12
11.1K0
重复一篇3分左右纯生信文章(第三部分)
本文目的:一文解决WGCNA分析问题。 原文章使用了自己识别的五个lncRNA,与mRNA合并做WGCNA分析,目的是为了得到lncRNA相关的mRNA。所以这里,我们做WGCNA,所需要的数据可以推测其包括:lncRNA表达量,mRNA表达矩阵,一些临床参数数据。 代码WGCNA_prepare.R(给WGCNA分析做前期数据准备) # ======================================================= ##########################
用户1359560
2019-07-22
1.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档