首页
学习
活动
专区
工具
TVP
发布

生信宝典

专栏作者
729
文章
1312487
阅读量
335
订阅数
NAR | 董波/王师/李语丽合作建立首个横跨动物界的进化发育组学数据库平台
进化发育生物学(EvoDevo)是近年来国际上迅速崛起的新兴前沿交叉学科,旨在通过研究生物界高度多样化的发育过程,从而深刻归纳阐释发育过程背后隐藏的进化驱动机制和规律,以解答被Science杂志评为125个最具挑战性的科学难题之一的生物多样性决定机制问题。在过去的几十年里,利用经典模式生物(如黑腹果蝇、秀丽隐杆线虫、斑马鱼和小鼠)所开展的广泛研究给我们带来了生物学领域诸多重大发现和突破,奠定了目前遗传、发育和进化等领域的基本知识构架体系。然而,为数甚少的模式动物无法涵盖动物界高度多样化发育过程的全部信息,更无法提供对整个动物界发育进化过程的全景式解读和归纳。为填补这一极大的知识空白,利用具有关键系统发育位置和全谱系覆盖的新兴模式生物来描述整个生命树的发育进化,对驱动进化发育学领域的跨越式发展具有极为重要科学价值和意义。高通量测序技术的革命性突破及各类组学技术广泛应用,为生命科学领域带来前所未有的发展契机。基因组学、转录组学以及单细胞技术加速了许多传统的非模式生物转变成新兴的模式生物(如栉水母、丝盘虫、玻璃海鞘、侏儒蛤等)。尽管近些年非经典模式动物类群已积累了海量的多组学资源,并仍以史无前例的规模快速增长,但对这些储存分散的组学资源进行整合和综合分析仍是目前国际上动物进化和发育研究领域共同面临的重大挑战,迫切需要系统建立面向整个动物界的进化发育综合组学数据库和相应的分析工具和平台。
生信宝典
2022-11-29
3990
竟然被awk生成的随机数给整蒙了,也谈随机数生成种子
我们现在主要的一个业务是给科研单位等提供数据库构建服务,目前承接的数据库已经发表了3篇NAR文章,具体见你的数据也可以-三篇NAR的数据库。
生信宝典
2022-03-25
6080
生物大数据时代,如何做好数据管理和再利用,发IF10+的数据库文章?
生物信息分析离不开数据资源和数据库,生物信息学数据库分类概览 (第一版)系统梳理了常用功能数据库。
生信宝典
2022-01-19
2430
临床基因组分析相关数据库汇总
一、人群SNV频率数据库 数据库名称 网站 简介 dbSNP https://www.ncbi.nlm.nih.gov/snp/ dbSNP 包含人类单核苷酸变异、微卫星和小片段插入和缺失,以及常见变异和临床突变的发表、群体频率、分子结果以及基因组和 RefSeq 映射信息。 gnomAD http://gnomad.broadinstitute.org/或http://www.gnomad-sg.org/ gnomAD(v3.1.2)基于GRCh38,其中短变异(short variant)数据集涵盖了7
生信宝典
2022-01-19
1.5K0
河南农大姚文与中科院北京基因组所章张课题组合作发布真核生物长链反向重复序列数据库
近日,河南农业大学生命科学学院姚文教授(校聘)课题组联合中国科学院北京基因组研究所章张研究员在国际知名期刊《Nucleic Acids Research》在线发表了题为《LIRBase: acomprehensive database of long inverted repeats in eukaryotic genomes》的研究论文。该研究系统鉴定了424个真核生物基因组中的长链反向重复序列(long invertedrepeat,LIR),并构建了数据库LIRBase。LIRBase不仅提供了数据检索与下载等功能,还提供了多个在线分析LIR的功能模块,包括LIR序列的鉴定、LIR表达量分析、LIR二级结构预测、BLAST分析、高通量小RNA测序数据比对LIR序列、小RNA靶标基因预测等。
生信宝典
2022-01-18
3360
国家生物信息中心在核酸研究发表单细胞DNA甲基化数据库—scMethBank
DNA甲基化是表观遗传研究的一个重要层面,且与发育、衰老和疾病的发生发展密切相关。为了更好地利用已公开的海量甲基化数据,此前,中国科学院北京基因组研究所国家基因组科学数据中心(以下简称基因组数据中心)已经发布了一个DNA甲基化的综合性数据库MethBank(https://ngdc.cncb.ac.cn/methbank/),涵盖了多物种高质量的全基因组单碱基精度甲基化图谱、健康人参比甲基化组以及人工审编的甲基化分析工具集。这里,我们介绍基因组数据中心最新发布的单细胞甲基化数据库——scMethbank(https://ngdc.cncb.ac.cn/methbank/scm/)。
生信宝典
2022-01-18
4330
NAR | 陈加余/陈亮合作建立R-loop全基因组分布与调控的专家数据库
R-loop是由RNA:DNA杂合链和非模板单链DNA构成的三链结构,广泛存在于从细菌到人类等物种的基因组中。R-loop结构主要随细胞转录活动产生,受细胞精细调控而处于高度动态变化当中。生理水平下的R-loop结构密切参与转录调控、组蛋白与DNA的表观遗传修饰调控、DNA损伤修复、免疫球蛋白类型转换等生物学过程,并作为调控网络的一环,与蛋白因子协同发挥着重要的调控作用。另一方面,R-loop调控异常会造成染色质状态改变,基因转录失调和基因组稳定性下降等。研究表明R-loop调控蛋白的突变与R-loop的异常积累是导致神经退行性疾病、癌症、自身免疫性疾病等的潜在诱因之一。
生信宝典
2022-01-18
7140
不用做实验也可以轻松找到癌症组织特异性基因
组织特异性基因(Tissue-specific Genes)是指在不同类型的细胞中特异性表达的基因,其调节细胞特异的形态结构或生理功能。组织特异性基因的表达是理解生物学过程、生理环境和疾病产生的关键,对TissGenes的研究将有助于深入了解致病机制和特异性治疗靶点,同时可以促进对临床相关的突变基因的发现。
生信宝典
2022-01-18
2450
你的数据可也可以发三篇NAR的文章
生物信息分析离不开数据资源和数据库,生物信息学数据库分类概览 (第一版)系统梳理了常用功能数据库。
生信宝典
2022-01-18
6070
一文掌握GSEA通路富集分析,超详细教程!
生信宝典之前总结了一篇关于GSEA富集分析的推文——GSEA富集分析:从概念理解到界面实操,介绍了GSEA的定义、GSEA原理、GSEA分析、Leading-edge分析等,是全网最流行的原理+操作兼备教程,不太了解的朋友可以点击阅读先理解下概念 (为了完整性,下面也会摘录一部分)。
生信宝典
2021-12-27
3.2K0
GPB | 陈润生/何顺民团队发布新版SmProt数据库,提供小蛋白丰富、可靠的系统性注释
小蛋白是翻译自小开放阅读框(small open reading frame, sORF)、长度低于100个氨基酸的蛋白质,在此前的基因组注释中通常被忽略。sORF广泛存在于人类等多种生物的基因组中,包括mRNA的非翻译区(untranslated regions, UTR)以及多种非编码RNA (non-coding RNA, ncRNA)区域,部分能够翻译成小蛋白。近年来,越来越多的研究发现小蛋白在胚胎发育、细胞凋亡、肌肉收缩等多种生物学过程中行使功能,并在肿瘤等疾病进展中发挥作用。
生信宝典
2021-10-21
7950
推荐几个常用的通路数据库
生物通路是细胞内分子之间的一系列相互作用,导致细胞内的某种产物或改变。这种通路可以触发新的分子的组装,比如脂肪或蛋白质。通路也可以开启或关闭基因,或者刺激细胞移动。一些最常见的生物通路涉及到新陈代谢、基因表达的调节和信号的传递。通路在基因组学的高级研究中起着关键作用。
生信宝典
2021-03-10
1.5K0
人类长非编码RNA表达数据库,整合9种重要生物学场景(发育、癌症、病毒侵染等)
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)表达数据库正式上线。该研究成果以`LncExpDB: an expression database of human long non-coding RNAs`为题在国际学术期刊《核酸研究》(`Nucleic Acids Research`)在线发表。 `LncRNA`通过复杂多样的分子机制发挥重要调控功能,在多个生物学过程以及疾病发生发展中均发挥重要作用。目前,人类基因组中已鉴定出十万多个lncRNA基因,但有功能研究的仅有数千条,因此全面注释lncRNA功能是人类基因组研究的重要内容和巨大挑战。近年来,高通量测序技术的迅速发展促进了正常组织、疾病、胚胎发育、器官分化、病毒侵染、亚细胞区室等多种生物学场景的研究,积累了丰富的组学数据,尤其是转录组测序数据,为从多角度发现和研究lncRNA的生物学功能提供了重要的数据基础与研究思路。 LncExpDB数据库致力于提供多生物学场景的lncRNA表达谱,鉴定具有潜在功能的lncRNA,促进lncRNA的功能实验研究。在LncBook数据库构建的人类lncRNA数据集基础上,研究人员整合CHESS、RefLnc、FANTOM等10余个专业数据库鉴定的lncRNA,基于严格审编标准,获得全面的高质量人类lncRNA参考数据集,包含101,293个基因/33,1244个转录本。LncExpDB数据库进一步整合9种重要生物学场景(正常组织/细胞系、器官发育、植入前胚胎发育、细胞分化、亚细胞定位、外泌体、癌症细胞系、病毒侵染、昼夜节律)的1,977个样本的转录组数据,通过标准化的转录组数据分析流程,系统分析并鉴定每种生物学场景的特征基因(管家基因/组织特异性基因、差异表达基因、节律基因、动态表达基因、亚细胞区室富集基因)集合,共计25,191个特征lncRNA基因和28,443,865对相关的lncRNA-mRNA共表达关系。此外,LncExpDB鉴定了具有表达证据支持的92,016个lncRNA基因,评估了lncRNA的表达水平与表达潜力。
生信宝典
2021-01-12
4710
微生物组常用数据库国内备份站点来啦!再也不用为数据库无法下载发愁啦!
每一个微生物学组的研究者在分析数据的时候都会遇上各种数据的问题:做16S分析发现数据库定制格式不会,做宏基因组有参分析发现依赖数据无法下载,宏基因组注释分析时用的NT,NR数据库从NCBI下载太慢了,建软件索引时计算资源不足,甚至要担心有一天国际数据库切断了,我们该从哪里下载数据?
生信宝典
2020-10-10
1.2K0
NC文章详解 | 鼠成纤维细胞单细胞分析发现成纤维细胞在心肌细胞成熟中起关键作用
Cardiac maturation lays the foundation for postnatal heart development and disease, yet little is known about the contributions of the microenvironment to cardiomyocyte maturation. By integrating single-cell RNA-sequencing data of mouse hearts at multiple postnatal stages, we construct cellular interactomes and regulatory signaling networks. Here we report switching of fibroblast subtypes from a neonatal to adult state and this drives cardiomyocyte maturation. Molecular and functional maturation of neonatal mouse cardiomyocytes and human embryonic stem cell-derived cardiomyocytes are considerably enhanced upon co-culture with corresponding adult cardiac fibroblasts. Further, single-cell analysis of in vivo and in vitro cardiomyocyte maturation trajectories identify highly conserved signaling pathways, pharmacological targeting of which substantially delays cardiomyocyte maturation in postnatal hearts, and markedly enhances cardiomyocyte proliferation and improves cardiac function in infarcted hearts. Together, we identify cardiac fibroblasts as a key constituent in the microenvironment promoting cardiomyocyte maturation, providing insights into how the manipulation of cardiomyocyte maturity may impact on disease development and regeneration.
生信宝典
2020-06-16
9130
cellassign:用于肿瘤微环境分析的单细胞注释工具
NGS系列文章包括NGS基础、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述))、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集)等内容。
生信宝典
2020-04-21
2.9K0
纳尼?Genbank中超200万条序列受污染!蛋白污染主要来源于一只蜘蛛?
Metagenomic sequencing allows researchers to investigate organisms sampled from their native environments by sequencing their DNA directly, and then quantifying the abundance and taxonomic composition of the organisms thus captured. However, these types of analyses are sensitive to contamination in public databases caused by incorrectly labeled reference sequences. (Nature综述:2万字带你系统入门鸟枪法宏基因组实验和分析) Here we describe Conterminator, an efficient method to detect and remove incorrectly labelled sequences by an exhaustive all-against-all sequence comparison. Our analysis reports contamination in 114,035 sequences and 2,767 species in the NCBI Reference Sequence Database (RefSeq), 2,161,746 sequences and 6795 species in the GenBank database, and 14,132 protein sequences in the NR non-redundant protein database. Conterminator uncovers contamination in sequences spanning the whole range from draft genomes to “complete” model organism genomes. Our method, which scales linearly with input size, was able to process 3.3 terabytes of genomic sequence data in 12 days on a single 32-core compute node. We believe that Conterminator can become an important tool to ensure the quality of reference databases with particular importance for downstream metagenomic analyses. Source code (GPLv3): https://github.com/martin-steinegger/conterminator.
生信宝典
2020-03-02
9510
功能强大的TCGA再分析平台
TCGA是研究肿瘤相关机制的重要资源。在线数据库更新改版都比较快,使用时需要参照最新的线上数据教程。不过癌症相关的数据库操作起来也都比较类似,输入一个或多个关注的目的基因,查看基因的功能注释,基因在哪些样品中存在突变,突变位点的分布,共表达网络,生存分析等。
生信宝典
2020-02-13
7500
生物AI插图素材获取和拼装指导 | 文末有中奖信息
人靠衣装,佛靠金装,科研成果靠图装。如今做科研不仅只需要会做实验,如何将成果美美地展示出来也是一门需要培养的技能。科研海报、项目PPT、论文插图、通路图……这些直接刺激人感官的展示都可以帮助升华我们的科研内容。
生信宝典
2020-01-16
1.7K0
20W+喜爱的Pathview网页版 | 整合表达谱数据KEGG通路可视化
前段时间介绍了一个R包 — Pathview。它可以整合表达谱数据并可视化KEGG通路,操作是先自动下载KEGG官网上的通路图,然后整合输入数据对通路图进行再次渲染。从而对KEGG通路图进行一定程度的个性化处理,并且丰富展示信息。
生信宝典
2019-12-12
3.5K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档