首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

NAR | 董波/王师/李语丽合作建立首个横跨动物界的进化发育组学数据库平台

进化发育生物学(EvoDevo)是近年来国际上迅速崛起的新兴前沿交叉学科,旨在通过研究生物界高度多样化的发育过程,从而深刻归纳阐释发育过程背后隐藏的进化驱动机制和规律,以解答被Science杂志评为125个最具挑战性的科学难题之一的生物多样性决定机制问题。在过去的几十年里,利用经典模式生物(如黑腹果蝇、秀丽隐杆线虫、斑马鱼和小鼠)所开展的广泛研究给我们带来了生物学领域诸多重大发现和突破,奠定了目前遗传、发育和进化等领域的基本知识构架体系。然而,为数甚少的模式动物无法涵盖动物界高度多样化发育过程的全部信息,更无法提供对整个动物界发育进化过程的全景式解读和归纳。为填补这一极大的知识空白,利用具有关键系统发育位置和全谱系覆盖的新兴模式生物来描述整个生命树的发育进化,对驱动进化发育学领域的跨越式发展具有极为重要科学价值和意义。高通量测序技术的革命性突破及各类组学技术广泛应用,为生命科学领域带来前所未有的发展契机。基因组学、转录组学以及单细胞技术加速了许多传统的非模式生物转变成新兴的模式生物(如栉水母、丝盘虫、玻璃海鞘、侏儒蛤等)。尽管近些年非经典模式动物类群已积累了海量的多组学资源,并仍以史无前例的规模快速增长,但对这些储存分散的组学资源进行整合和综合分析仍是目前国际上动物进化和发育研究领域共同面临的重大挑战,迫切需要系统建立面向整个动物界的进化发育综合组学数据库和相应的分析工具和平台。

03

人类长非编码RNA表达数据库,整合9种重要生物学场景(发育、癌症、病毒侵染等)

近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)表达数据库正式上线。该研究成果以`LncExpDB: an expression database of human long non-coding RNAs`为题在国际学术期刊《核酸研究》(`Nucleic Acids Research`)在线发表。 `LncRNA`通过复杂多样的分子机制发挥重要调控功能,在多个生物学过程以及疾病发生发展中均发挥重要作用。目前,人类基因组中已鉴定出十万多个lncRNA基因,但有功能研究的仅有数千条,因此全面注释lncRNA功能是人类基因组研究的重要内容和巨大挑战。近年来,高通量测序技术的迅速发展促进了正常组织、疾病、胚胎发育、器官分化、病毒侵染、亚细胞区室等多种生物学场景的研究,积累了丰富的组学数据,尤其是转录组测序数据,为从多角度发现和研究lncRNA的生物学功能提供了重要的数据基础与研究思路。 LncExpDB数据库致力于提供多生物学场景的lncRNA表达谱,鉴定具有潜在功能的lncRNA,促进lncRNA的功能实验研究。在LncBook数据库构建的人类lncRNA数据集基础上,研究人员整合CHESS、RefLnc、FANTOM等10余个专业数据库鉴定的lncRNA,基于严格审编标准,获得全面的高质量人类lncRNA参考数据集,包含101,293个基因/33,1244个转录本。LncExpDB数据库进一步整合9种重要生物学场景(正常组织/细胞系、器官发育、植入前胚胎发育、细胞分化、亚细胞定位、外泌体、癌症细胞系、病毒侵染、昼夜节律)的1,977个样本的转录组数据,通过标准化的转录组数据分析流程,系统分析并鉴定每种生物学场景的特征基因(管家基因/组织特异性基因、差异表达基因、节律基因、动态表达基因、亚细胞区室富集基因)集合,共计25,191个特征lncRNA基因和28,443,865对相关的lncRNA-mRNA共表达关系。此外,LncExpDB鉴定了具有表达证据支持的92,016个lncRNA基因,评估了lncRNA的表达水平与表达潜力。

01

小白零基础编程到大佬级别是怎么学习Python的?

程序员在普通人眼里就像魔法师,一个脚本轻松抢几十盒月饼(虽然最后被开除),一个插件解决春运抢票难题,几十行代码搭建一个 Web 网站,用微信自动和妹纸聊天,在程序员眼里这些事太稀松平常了,他们只不过是利用编程语言指挥计算机去自动完成一些需要人类重复操作的繁琐过程,等你会编程也就不觉得大惊小怪了。 📷 有些人学习编程刚一开始头脑发热,买了很多书,下载很多视频,收藏上100G的资料,没过几天,热情就褪去了,最后完成了从入门到放弃的全过程,究其原因主要是缺乏清晰的目标,没有方向,或者方向不明确。如果你真正想把编程

08

Cell专题发表全球首批生命时空图谱,国家基因库发布时空组专辑数据库开启文献“可视化解读”新模式!

深圳华大生命科学研究院联合多家机构的研究者们,利用华大堪称“超广角百亿像素生命照相机”的时空组学技术Stereo-seq,首次绘制了四种模式生物胚胎发育或器官的时空图谱,包括和人的基因相似度高达80%的实验室明星小鼠、参与高中课本里著名的摩尔根杂交实验的果蝇、胚胎发育研究的重要模式生物斑马鱼和植物研究的“网红”拟南芥。这是首次从时间和空间维度上对生命发育过程中的基因和细胞变化过程进行超高精度解析,为认知器官结构、生命发育、人类疾病和物种演化提供全新方向。

01

物种保守行能说明它是目标分子吗

但是在高通量测序大行其道的这10年,困扰大家的问题在于如何从繁多的基因定位到少量的几个基因,这也就是数据挖掘的核心,缩小目标基因!各种数据挖掘文章本质上都是要把目标基因集缩小,比如表达量矩阵通常是2万多个蛋白编码基因,不管是表达芯片还是RNA-seq测序的,采用何种程度的差异分析,最后都还有成百上千个目标基因。如果是临床队列,通常是会跟生存分析进行交集,或者多个数据集差异结果的交集,比如:多个数据集整合神器-RobustRankAggreg包 ,这样的基因集就是100个以内的数量了,但是仍然有缩小的空间,比如lasso等统计学算法,最后搞成10个左右的基因组成signature即可顺利发表。

03

该基因具有跨物种保守性质能说明它是目标分子吗?

但是在高通量测序大行其道的这10年,困扰大家的问题在于如何从繁多的基因定位到少量的几个基因,这也就是数据挖掘的核心,缩小目标基因!各种数据挖掘文章本质上都是要把目标基因集缩小,比如表达量矩阵通常是2万多个蛋白编码基因,不管是表达芯片还是RNA-seq测序的,采用何种程度的差异分析,最后都还有成百上千个目标基因。如果是临床队列,通常是会跟生存分析进行交集,或者多个数据集差异结果的交集,比如:多个数据集整合神器-RobustRankAggreg包 ,这样的基因集就是100个以内的数量了,但是仍然有缩小的空间,比如lasso等统计学算法,最后搞成10个左右的基因组成signature即可顺利发表。

01
领券