首页
学习
活动
专区
工具
TVP
发布

生信宝典

专栏作者
731
文章
1322848
阅读量
335
订阅数
基因共表达聚类分析及可视化
共表达基因的寻找是转录组分析的一个部分,样品多可以使用WGCNA,样品少可直接通过聚类分析如K-means、K-medoids (比K-means更稳定)或Hcluster或设定pearson correlation阈值来选择共表达基因。 下面将实战演示K-means、K-medoids聚类操作和常见问题:如何聚类分析,如何确定合适的cluster数目,如何绘制共表达密度图、线图、热图、网络图等。 获得模拟数据集 MixSim是用来评估聚类算法效率生成模拟数据集的一个R包。 library(MixSim)
生信宝典
2018-02-05
2.6K0
CIRCOS圈图绘制 - 最简单绘图和解释
Circos是绘制圈图的神器,在http://circos.ca/images/页面有很多CIRCOS可视化的示例。 Circos可以在线使用,在线使用时是把表格转为圈图,不过只允许最大75行和75列
生信宝典
2018-02-05
4.6K0
GO、GSEA富集分析一网打进
富集分析是生物信息分析中快速了解目标基因或目标区域功能倾向性的最重要方法之一。其中代表性的计算方式有两种: 一是基于筛选的差异基因,采用超几何检验判断上调或下调基因在哪些GO或KEGG或其它定义的通路富集。假设背景基因数目为m,背景基因中某一通路pathway中注释的基因有n个;上调基因有k个,上调基因中落于通路pathway的数目为l。简单来讲就是比较l/k是否显著高于n/m,即上调基因中落在通路pathway的比例是否高于背景基因在这一通路的比例。(实际计算时,是算的odds ratio的差异,l/(k
生信宝典
2018-02-05
4.3K0
Cytoscape之操作界面介绍
Cytoscape 简介 Cytoscape是一个专注于开源网络可视化和分析的软件。软件的核心部分提供了网络显示、布局、查询等方面的基本功能。软件的核心可以通过插件架构进行扩展,这样就能快速地开发出新的功能。 Cytoscape 源自系统生物学,用于将生物分子交互网络与高通量基因表达数据和其他的分子状态信息整合在一起。虽然Cytoscape也能适用于其他分子构件和相互作用,但其最强大的功能还是用于大规模蛋白质輭蛋白质相互作用、蛋白质-DNA和遗传交互作用的分析。各种物种(包括人类)的这方面的实验数据都在迅速
生信宝典
2018-02-05
3.2K0
TCGA数据库在线使用
最近做培训时整理的一部分TCGA相关数据库的使用总结。在线数据库更新改版都比较快,使用时需要参照最新的线上数据教程。不过癌症相关的数据库操作起来也都比较类似,输入一个或多个关注的目的基因,查看基因的功能注释,基因在哪些样品中存在突变,突变位点的分布,共表达网络,生存分析等。 本文包括了TCGA本站中数据的浏览、下载,尤其是TCGA改版后的功能介绍(增加了OncoGrid展示),然后是cBioPortal,TCGA数据在线提供的分析类型最多的一个平台,再是FIREBROWSE,比较不错的在线展示和方便的数据下
生信宝典
2018-02-05
4K0
ICGC数据库使用
TCGA是不错的癌症研究数据资源,但癌症研究不只是有TCGA。ICGC国际癌症基因组联盟,有亚洲、澳大利亚、欧洲、北美和南美17个行政区的89个项目,包括25,000个肿瘤基因组。目的是To obtain a comprehensivedescription of genomic, transcriptomic and epigenomic changes in 50 different tumor types and/or subtypes which are of clinical and societ
生信宝典
2018-02-05
5.8K0
psRobot:植物小RNA分析系统
psRobot:植物小RNA分析系统 简介 官网:http://omicslab.genetics.ac.cn/psRobot/ PsRobot是中科院遗传发育所王秀杰组的作品,主要实现小RNA的ma
生信宝典
2018-02-05
1.6K0
NGS基础 - GTF/GFF文件格式解读和转换
GFF 文件 GFF全称为general feature format,这种格式主要是用来注释基因组。 从 Ensembl 导出的GFF文件示例: X Ensembl Repeat 2419108 2419128 42 . . hid=trf; hstart=1; hend=21 X Ensembl Repeat 2419108 2419410 2502 - . hid=AluSx; hstart=1; hend
生信宝典
2018-02-05
10.9K0
NGS基础 - 高通量测序原理
NGS系列文章包括NGS基础、转录组分析、ChIP-seq分析、DNA甲基化分析、重测序分析五部分内容。 NGS基础系列文章包括高通量测序原理,测序数据获取和质量评估,常见文件格式解释和转换4部分。
生信宝典
2018-02-05
1.5K0
生信宝典之傻瓜式 (三) 我的基因在哪里发光 - 如何查找基因在发表研究中的表达
还在为不会分析大数据发愁吗? 还在为无法查询和比较发表文章中感兴趣基因表达值抱怨吗? 使用genevestigator,高效利用已经有研究结果,轻松与同行研究结果比较!!! GENEVESTIGATO
生信宝典
2018-02-05
1.9K0
生信宝典之傻瓜式 (一) 如何提取指定位置的基因组序列
为了一件小事也不得不写程序时,你是否会觉得心里很烦?本栏目旨在分享生物信息分析中的一些小技巧,纯傻瓜式操作,助你事半功倍,心情倍儿爽。 想要提取拟南芥1号染色体,正义链6666-8888位置的序列?你
生信宝典
2018-02-05
1.2K0
NGS基础 - FASTQ格式解释和质量评估
FASTQ文件格式和命名 高通量测序之后用于下游分析的数据一般存储在FASTQ文件中。为了节省空间,又不影响下游使用,也一般用gzip压缩的格式。 单端测序每个文库只返回一个FASTQ文件,双端测序两个FASTQ文件,左端一般命名为_1或R1,右端命名为_2或R2。 假如样品名字为ehbio,双端测序三个重复。习惯命名为ehbio_1_1.fq.gz ehbio_1_2.fq.gz, ehbio_2_1.fq.gz ehbio_2_2.fq.gz, ehbio_3_1.fq.gz ehbio_3_2.f
生信宝典
2018-02-05
2.9K0
不是原配也可以-对接非原生配体
Docking非原生配体 在前面的例子中,AutoDock Vina能把配体构象调整到几乎原生的构象,验证了这一预测方法的准确度。下面,我们尝试docking另外一个配体药物nelfinavir奈非那韦,来展示如何寻找小分子在蛋白内的结合位点。这个过程可以进一步地凝练和扩展作为“虚拟筛选(virtual screening)”的步骤。 重复上述步骤执行docking 获取nelfinavir.pdb:为教程提供的pdb文件(可从1OHR.pdb获得) 按照上述步骤对配体文件进行预处理获得pdbqt格式文件。
生信宝典
2018-02-05
1.1K0
测序数据可视化 (四)- Epigenomebrowser
Epigenomebrowser是华盛顿大学王艇教授团队开发的强大的基因组浏览器,可以显示Hi-C和ChIA-PET等三维基因组结构的数据。同时还带有比较多的小工具方便在线获取信息、分析和作图。 Ep
生信宝典
2018-02-05
7500
测序数据可视化 (一)
测序reads比对回基因组后,可以通过多种方式查看比对结果。直接查看bam文件可查看测序序列比对的信息和测序序列的碱基突变信息,在检查比对结果或分析全基因组或外显子组测序时会有帮助。但BAM文件比较大
生信宝典
2018-02-05
1.5K0
基因组分析中多物种同源基因的鉴定和筛选
OrthoMCL能做什么 Orthologs are homologs separated by speciation events. Paralogs are homologs separated by duplication events. Detection of orthologs is becoming much more important with the rapid progress in genome sequencing. OrthoMCL is a genome-scale algor
生信宝典
2018-02-05
2.3K0
本地安装UCSC基因组浏览器
UCSC基因组浏览器在大规模高通量数据的可视化和比较分析研究中发挥着重要的作用。 本文详细介绍了如何一步步在本地安装、配置、高级使用UCSC浏览器。 安装UCSC浏览器 1. 安装mysql+apache #For Ubuntu user sudo apt-get install tasksel sudo apt-get install lamp-server #For readhat or centos user yum install httpd mariadb-server mariadb 2. 新
生信宝典
2018-02-05
2.1K0
分子对接简明教程 (4)
文件格式解释 PDB文件 (详细格式描述) 基本信息部分 HEADER记录: 包括分子的分类、提交日期、PDB ID TITLE记录: 为该结构的描述,如果有多行,除第一行外,其它行有连续的数字标示。 COMPND记录: 包含分子数目、名字、链特征、分子是如何获得的等。 SOURCE记录: 大分子的生物或化学来源 KEYWDS记录:关键字 EXPDTA记录:实验信息 JRNL记录:文献引用信息 REMARK记录:更为丰富的记录信息 HEADER HYDROLASE (ACID PROTEINASE)
生信宝典
2018-02-05
2.9K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档