首页
学习
活动
专区
工具
TVP
发布

生物信息云

旨在传播生物医学科研实验技能和生物信息学基础知识及应用技巧
专栏作者
251
文章
1054545
阅读量
399
订阅数
美国德州理工大学健康科学中心(TTUHSC)生物信息学、计算基因组学博后及博士生招聘
德州理工大学健康科学中心 Texas Tech University Health Sciences Center 全美医学排名前一百,其中临床全美排名19(U.S. News)。德州理工大学是R1大学。它是全美第二大大学(1900英亩),也是德州唯一包含本科和研究生院及法学院和医学院于一体的综合性大学。
DoubleHelix
2023-09-06
2800
生信数据库 | 最新的刚刚发布的癌症单细胞分析数据库
单细胞RNA测序(scRNA-seq)技术的发展大大促进了对肿瘤微环境(TME)的破译。大量独立的scRNA-seq研究已经发表,代表了一种宝贵的资源,为Meta分析研究提供了机会。然而,大量的生物信息、研究之间明显的异质性和变异性,以及处理异质数据集的技术挑战为充分开发scRNA-seq数据带来了重大瓶颈。作者开发了IMMUcan scDB(https://immucanscdb.vital-it.ch),这是一个完全集成的scRNA-seq数据库,专门用于人类癌症,非专业人士也可使用。IMMUcan scDB包含了56种不同癌症类型的144个数据集,在50个领域进行了注释,包含精确的临床、技术和生物学信息。开发了一个数据处理管道,并分四个步骤组织。(i) 数据收集;(ii) 数据处理(质量控制和样本整合);(iii) 用TME的细胞本体分类器进行监督细胞注释;(iv) 以特定癌症类型或全球方式分析TME的接口。这个框架被用来以基因为中心(CXCL13)和以细胞为中心(B细胞)的方式探索不同肿瘤位置的数据集,以及进行元分析研究,如对免疫细胞类型和与恶性肿瘤转化相关的基因进行排序。这种综合的、可自由访问的、用户友好的资源代表了一种前所未有的详细注释水平,为下游利用人类癌症scRNA-seq数据进行发现和验证研究提供了巨大的可能性。
DoubleHelix
2023-02-27
6390
Biopython | 介绍和安装
Biopython是Python的最大,最受欢迎的生物信息学软件包。它包含许多用于常规生物信息学任务的不同子模块。它由Chapman和Chang开发,主要使用Python编写。它还包含C代码,以优化软件的复杂计算部分。它可以在Windows,Linux,Mac OS X等操作系统上运行。
DoubleHelix
2022-12-16
1.1K0
CoMutDB数据库工具 | 分析共突变与预后、药物敏感性
数据库地址: http://www.innovebioinfo.com/Database/CoMutDB/Home.php
DoubleHelix
2022-11-24
6790
单细胞专题 | 10.细胞周期分析
A cell cycle is a series of events that takes place in a cell as it grows and divides.即描述细胞生长、分裂整个过程中细胞变化过程。最重要的两个特点就是DNA复制、分裂成两个一样的子细胞。如下图,一般分成4个阶段
DoubleHelix
2022-11-24
1.3K0
生信分析中常见的数据文件格式
前面我们介绍了各种测序技术的原理:illumina、Sanger、第三代和第四代测序技术原理,我们测序得到的是带有质量值的碱基序列fastq格式,参考基因组是fasta格式。⽤⽐对⼯具把fastq格式的序列回帖到对应的fasta格式的参考基因组序列,就可以产⽣sam格式的⽐对⽂件。把sam格式的⽂本⽂件压缩成⼆进制bam⽂件可以节省空间。如果是记录某些位点或者区域碱基的变化,就是VCF⽂件格式。如果对参考基因组上⾯的各个区段标记它们的性质,⽐如哪些区域是外显⼦,内含⼦, UTR等等,这就是gtf/gff格式。如果只是为了单纯描述某个基因组区域,就是bed格式⽂件,记录染⾊体号以及起始终⽌坐标,正负链即可。
DoubleHelix
2022-06-13
2.2K0
cSurvival:一个癌症生存分析的新工具
生存分析是一种用于鉴定癌症研究中预后生物标志物和遗传缺陷的技术。癌症相关的数据库很多,例如TCGA。这些数据库提供了大量的生存数据,这为使用临床相关性研究分子水平的癌症病因提供了资源。也有很多相关的生存分析工具被开发,尽管癌症通常来自多种遗传缺陷并且具有失调的基因集(GS),但现有的生存分析工具只能分析单个基因。此外,没有系统的方法将临床结果与实验(细胞系)数据联系起来。为了解决这些差距,Xuanjin Cheng等人开发了cSurvival(https://tau.cmmt.ubc.ca/cSurvival)。
DoubleHelix
2022-06-13
4170
单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ
SRAtoolkit是NCBI提供的SRA文件处理工具集, SRA文件是NCBI的SRA数据库数据的储存格式,许多公开的scRNA-seq数据都会上传到该数据库。SRAtoolkit将NCBI的SRA数据库中SRA文件转换为FastQ文件。
DoubleHelix
2022-06-13
2.7K0
文本挖掘——TCGA project文章的词云
http://www.sthda.com/english/wiki/text-mining-and-word-cloud-fundamentals-in-r-5-simple-steps-you-should-know
DoubleHelix
2021-09-29
7990
生信工具 | TIGA: Target Illumination GWAS Analytics
全基因组关联研究(GWAS)可以揭示重要的基因型-表型关联,但数据质量和可解释性问题必须得到解决。对于根据现有证据确定目标靶点的药物发现科学家来说,这些问题已不是单一的药物发现研究。作者开发的TIGA(Target Illumination GWAS Analytics)通过对全基因组关联研究(GWAS)中与性状相关的蛋白质编码基因进行评分和排序,促进药物靶点的发现。TIGA可以用相同的基因-性状关联指标对性状进行评分和排序。这一重点应用提供了一种合理的方法,通过该方法,GWAS的发现可以被聚合和过滤,以获得适用的信息,并为药物发现科学家提供可用的证据,为确认药物靶点的优先级,以便于研究。
DoubleHelix
2021-06-17
4710
分子对接教程 | (7) AutoDock对接中易错问题
首先就是准备受体的时候,加氢的问题,其实在前文已经有过介绍,在选择一个分子作为配体或受体之前,必须把所有的氢都加到这个分子上,而且是全氢。如果你操作是用我选择的蛋白或者受体,前面可能你没有发现一个问题,那就小分子配体,我们下载的sdf文件和mol2文件,其中的sdf文件在PubChem数据库下载的,在3D Conformer处左侧有一些选项勾选,比如是否显示氢键,我当时是勾选的。
DoubleHelix
2021-02-26
5.3K0
分子对接教程 | (3) 配体分子文件格式转换
还有一个数据库能下载mol2格式的文件。ZINC(http://zinc.docking.org/),这里就不介绍了,你要是能从上面的数据库下载到你配体小分子的mol2格式文件,就直接用,如果不能,那就是去PubChem数据库(https://pubchem.ncbi.nlm.nih.gov/)下载sdf文件,然后进行转换,这也是我这里要介绍的。
DoubleHelix
2021-02-26
6K0
Linux笔记【001】| 初识Linux
Linux 内核最初只是由芬兰人林纳斯·托瓦兹(Linus Torvalds)在赫尔辛基大学上学时出于个人爱好而编写的。
DoubleHelix
2020-10-23
16.1K0
Linux笔记【002】| 远程登录服务器软件:MobXterm与FileZilla
在实际开发或者计算的时候可以使用一些第三方的工具对远程的服务器进行控制。目前常用的Linux远程登录工具有:putty、xshell、secureCRT等等。我推荐使用MobXterm。secureCRT其实也是一款很强大的终端工具,但是,它毕竟是收费软件。Putty非常小巧,而且免费,因此也有不少人使用,但Putty真的不好用,不支持标签,开多个会话的话就需要开多个窗口,窗口切换也很不方便。当然还有其它终端工具,比如XShell,XShell6是一款高效专业的实用型免费SSH客户端。XShell5简单强悍,支持标签式的环境,动态端口转发,自定义键的映射关系,用户定义的按钮,VB脚本,显示2字节字符和国际语言支持UNICODE的终端。我这里介绍MobaXterm,其他的自己百度下载,看自己适合哪种。MobaXterm是一款集万千于一身的全能型终端神器,先说说这款神器的优点:
DoubleHelix
2020-10-23
2.8K0
PanGPCR | 预测多个潜在的GPCR靶标及其在组织中的表达位置,副作用以及GPCR药物的可能用途
靶向G蛋白偶联受体(GPCR)(已知的最大治疗靶标)的药物发现具有挑战性。为了促进GPCR药物的快速发现和开发,Yufeng J Tseng等人构建了PanGPCR系统(https://gpcrpanel.cmdm.tw/index.html),以预测多个潜在的GPCR靶标及其在组织中的表达位置,副作用以及GPCR药物的可能用途。使用PanGPCR,将目标化合物对接到包含36个实验确定的晶体结构的文库中,该库包含46个人类GPCR docking 位点,并且从对接中生成了一个排序列表,以评估所有GPCR及其结合亲和力。你可以确定给定化合物的GPCR目标以及相应的潜在用途。此外,通过linking predicted off-targets及其表达的序列标签图谱,可以提供从SIDER数据库收集并映射到45个组织和器官的潜在副作用。使用PanGPCR,只需上传一个小的配体,就可以确定多个靶点,重新定位的潜力和副作用。
DoubleHelix
2020-09-29
8190
转录组分析 | 使用Hisat2进行序列比对
转录组分析 | 使用trim-galore去除低质量的reads和adaptor
DoubleHelix
2020-09-23
22.8K2
转录组分析 | 使用SAMtools将SAM文件转换为BAM文件、排序、建立索引
转录组分析 | 使用trim-galore去除低质量的reads和adaptor
DoubleHelix
2020-09-23
19.2K0
转录组分析 | 使用RSeQC软件对生成的BAM文件进行质控
RSeQC是发表于2012年的一个RNA-Seq质控工具,属于python包。它提供了一系列有用的小工具能够评估高通量测序尤其是RNA-seq数据,比如一些基本模块,检查序列质量, 核酸组分偏性, PCR偏性, GC含量偏性,还有RNA-seq特异性模块: 评估测序饱和度, 映射读数分布, 覆盖均匀性, 链特异性, 转录水平RNA完整性等。该软件的使用命令非常多,但很多功能并不是用来诊断转录组测序的,所以不在我们的考虑范围内。你可以参考官方教程文档:
DoubleHelix
2020-09-23
4.9K0
UCSC数据库下载TCGA数据需要注意的细节
前面关于TCGA的教程我介绍很多,包括数据下载和一些简单的分析以及数据的处理,这里介绍还是介绍数据的下载,前面介绍过从网页下载后直接整理,或者利用R包下载,这里介绍基于TCGA数据开发的一些工具——UCSC。从UCSC下载TCGA数据比较简单。
DoubleHelix
2020-08-20
4.4K1
Linux系统下Anaconda的安装和使用教程
去官网下载:https://www.anaconda.com/products/individual
DoubleHelix
2020-08-10
13.2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档