SYSU星空

LV1
发表了文章

Nature:原核生物基因的生物地理学研究

文章导读:近十几年来,随着测序技术的飞速发展与快速应用,生物信息学数据得到大量积累。以往研究多集中于新数据的挖掘,在系统化分析上仍然存在很大不足。接下来很可能会...

SYSU星空
生物基因
发表了文章

序列比对:替换计分矩阵

当研究一条DNA或蛋白质序列时,主要关注的是其包含的遗传信息;当研究两条或多条DNA或蛋白质序列时,则主要关注不同序列之间的差别与联系。在生物信息学中,对生物大...

SYSU星空
发表了文章

为了更精确的定量:宏基因组gene丰度分析工具的比较

之前常有做宏基因组的朋友问我,为什么他们计算基因丰度获得的结果中,有些基因的丰度为零。理论上所有的contig序列均由reads拼装而得,而基因作为contig...

SYSU星空
发表了文章

Nature子刊:微生物组数据转换以提高宏基因组定量准确度

文章导读:宏基因组研究日益广泛,但其定量分析一直面临很多困难。这篇文章系统的总结了宏基因组流程中影响定量分析的各个方面,尤其是数据的组合性以及样品微生物负荷的变...

SYSU星空
数据分析数据结构
发表了文章

SCI写作:色盲友好色板

色盲是并不罕见的一种遗传性疾病,我国男性色盲患病率可达5%,而白人男性更是高达8%。这些色盲患者和我们一样工作在各种领域,在论文送审中也可能会遇到色盲审稿人。假...

SYSU星空
发表了文章

如何判断多个检验属于多重比较,从而需要p值校正?

数学上的假设检验从根本上来说是基于哲学上的反证法,目的是为了确定差异。我们说一个检验对应一个零假设,p值实际上是零假设发生的概率,p值过低则拒绝零假设;1-p则...

SYSU星空
发表了文章

DNA与蛋白质的序列比对原理

当研究一条DNA或蛋白质序列时,主要关注的是其包含的遗传信息;当研究两条或多条DNA或蛋白质序列时,则主要关注不同序列之间的差别与联系。在生物信息学中,对生物大...

SYSU星空
发表了文章

耗散结构为什么能解释生命系统与生态系统

设想光秃秃的地球,太阳的光芒照耀在地球表面,能对地球表面做什么?地球表面的岩石或水体(如果有的话)会吸热,岩石几百年的暴晒可能会开裂,水可能会变热或者变成水蒸气...

SYSU星空
发表了文章

基因组CRISPR序列及Cas酶预测

CRISPR也即Clustered regularly interspaced shortpalindromicrepeats(成簇的、规律间隔的、短回文、重复...

SYSU星空
HTTPhttps网络安全安全
发表了文章

决策树的构建原理

决策树(Decision Tree)是一种简单但是广泛使用的分类预测模型。通过训练数据构建决策树,可以高效的对未知的数据进行分类并作出决策。决策树有两大优点,一...

SYSU星空
决策树机器学习神经网络深度学习AI 人工智能
发表了文章

聚类树的合并展示

层次聚类(hierarchical clustering)就是通过对数据集按照某种方法进行层次分解,直到满足某种条件为止,常用的方法有UPGMA、ward.D2...

SYSU星空
发表了文章

宏基因组基因集去冗余:CD-HIT

很多情况下由于内存限制等原因无法将多个样本混合在一起拼接,这样每个样品单独拼接、预测获得的基因集在合并分析时可能会有很多冗余。要构建多个样品、多个项目的非冗余基...

SYSU星空
数据库SQL
发表了文章

关于生态学,研究者们存在哪些分歧?

关于生态与进化,科学家们已经探讨了数百年,然而至今在很多核心问题上仍难以达成共识。著名生态与进化学者论坛Eco-Evo Evo-Eco上曾发起关于最具争议的一些...

SYSU星空
发表了文章

Iqtree2:新模型高效构建系统发育树

系统发育推断(phylogenetic inference)的算法五花八门,从最简单的UPGMA法,到邻接法(neighbor joining)、最大简约法(m...

SYSU星空
编程算法Bootstrap机器学习神经网络深度学习
发表了文章

Nature综述:噬菌体多样性、基因组学与系统发育

噬菌体是地球上丰度和多样性最高的生物学实体,大规模病毒宏基因组学和培养极大的推动了人们对噬菌体的了解。本篇综述从四个方面总结噬菌体研究进展,并结合研究现状给出自...

SYSU星空
网络安全
发表了文章

RDA-PLS:多数据集关联分析

在现代微生物组学分析中,高通量的测试方法使得研究者可以一次性获取大量的数据信息,这时候所获得的数据里可能存在大量“冗余”;此外,在实际操作中,研究人员为避免遗漏...

SYSU星空
编程算法R 语言
发表了文章

MUMmer共线性分析与SNP检测

系统发育相关的基因组之间既存在保守性又存在可变性。有些序列片段的数目以及顺序具有保守性,这种保守性可以使用共线性(synteny)或同线性(colinearit...

SYSU星空
发表了文章

宏基因组binning:MetaBAT

基于reads比对注释的物种binning可以获得宏基因组微生物群落的物种组成信息,但无法获得组成物种的基因组。要获得这些基因组数据,还需要基于不同基因组的特征...

SYSU星空
发表了文章

宏基因组binning原理

在宏基因组中分离单基因组,可利用序列特征或序列组装信息,常见的可用信息主要有以下几种:

SYSU星空
HTML数据分析
发表了文章

零代码计算Contigs与Genes丰度!

在宏基因组分析中,一个最常见的任务就是计算contigs和genes的丰度,这是我们后续定量分析的基础。原理大家都懂,无非就是将reads序列map到conti...

SYSU星空
网络安全

个人简介

个人成就

扫码关注腾讯云开发者

领取腾讯云代金券