首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

孟德尔随机化之遗传学概述

许多生物的遗传信息(或基因组)由长长的一串遗传密码组成,这些遗传密码以DNA(脱氧核糖核酸)的形式存在,DNA是编码生命的分子,被包装成染色体。人类有23对染色体,每对染色体中的一条来自母亲,一条来自父亲。染色体包含基因,这些基因是遗传密码的可定位区域,编码一个可遗传信息单元,但是并非所有的遗传序列都属于基因区域,并且染色体的大部分由称为非编码DNA的中间遗传物质组成。每个染色单体有两条链,每条链由一个可以由字母A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)和G(鸟嘌呤)表示的核苷酸序列组成。这些核苷酸链以互补方式配对(A与T配对,C与G配对),这样每个链包含相同的信息,因此仅考虑其中一个链。

03
您找到你想要的搜索结果了吗?
是的
没有找到

《你问我答》第二期 | 解答关于TubeMQ、TBase、Oceanus与数据湖的疑问

各位小伙伴们大家好,我们又见面啦~ 上一期的《你问我答》中 我们的专家解答了大伙对于腾讯大数据团队的开源项目,以及技术实践等方面的一些疑问 与此同时,我们在后台收到了更多的问题 所涉及的话题和专业领域也更加广泛 遗憾的是,由于篇幅限制 我们每期只能挑选5个问题进行答复 没有被选上的小伙伴也不要灰心 本栏目将继续进行下去 大家有任何关于ABCD(人工智能、大数据、云计算、数据库)领域的疑问 或者在工作中遇到了难以解决的相关技术问题 尽管在文章下方留言 您的问题越难,就越有可能得到专家的答复哦! (

01

Nat Biotechnol | 大神李恒团队开发不依赖于亲本的单倍型基因组组装工具hifiasm

对基因组相关研究而言,单倍型基因组组装是研究结构,进化与变异的最理想方式。随着长读长测序技术的进步,高质量单倍型组装已经成为了可能。然而,大部分组装算法的结果仍是混合多个单倍型的压缩序列,而不是完整的单倍型。对二倍体基因组而言,这种做法不可避免的损失了至少一半的单倍型信息。目前有一些组装算法对此进行了尝试,但是这类算法要么依赖难以获取的亲本信息进行分型 (trio-binning),要么无法生成高质量的单倍型组装结果。因此,如何在不依赖亲本信息的情况下,自动进行高质量的单倍型组装,是一个亟待解决的问题。

03

使用CCS序列数据改进宏基因组拼接效率和物种分类注释

DNA组装是用于研究微生物群落结构和功能的宏基因组流程中的核心方法学步骤。在这里,我们调查太平洋生物科学长期和高精度循环共识测序(CCS)的宏基因组项目的实用性。我们比较了PacBio CCS和Illumina HiSeq数据的应用和性能以及使用代表复杂微生物群落的宏基因组样本的组装和分类分类算法。8个SMRT细胞从沼气反应器微生物组合样品中产生大约94Mb的CCS读数,其平均长度为1319nt,精度为99.7%。CCS数据组合产生了大于1 kb的相当数量的大型重叠群,与从相同样本产生的约190x较大的HiSeq数据集(〜18 Gb)组装的大型重叠群组成(即约占总重叠群的62%)。使用PacBio CCS和HiSeq重叠群的混合组件在装配统计数据方面进行了改进,包括平均重叠体长度和大型重叠群数量的增加。CCS数据的并入产生了两个显性系统的分类学分类,基因组重建的显着增强,使用HiSeq数据单独组合则分类不佳。总而言之,这些结果说明了PacBio CCS在某些宏基因组应用的价值。

02

多基因风险评分2

众所周知,人体的染色体是由A、T、C、G四种碱基组成的DNA双螺旋结构,其中A碱基与T碱基相对,C碱基与G碱基相对。换言之,如果一条DNA单链某位置上的碱基是A,那么与之配对的另一条单链DNA在相同位置上的碱基就是T。由于人类是一个二倍体生物,这也就意味着人的染色体基因型是由两种碱基组成,如果一个人在染色体某一位置上的基因型(SNP)是AA,并且AA就是野生型,突变的情况是A突变成G,那么基因型AG就是杂合型,GG就是纯合突变型,为了方便计算,我们规定基因型为AA的人的等位基因剂量为0,AG的等位基因剂量为1,GG的等位基因剂量为2,我们也称该SNP的等位基因剂量分别是0、1、2,其他相关知识点可参考往期遗传学概述。

02
领券