首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用Y叔神包ggtree进行基因家族基因进化构建

转录入门传送门 考虑到技能过于偏重于肿瘤等疾病领域经验分享,我有必要自告奋勇推荐一下自己的我们植物学领域的生物信息学应用心得体会,会以4个头条的形式发布,也欢迎大家点击原文直达我的博客!...系列目录 基于全基因的基因家族分析(1):数据准备 基于全基因的基因家族分析(2):SlNRAMP家族基因成员鉴定 基于全基因的基因家族分析(3):SlNRAMP家族基因CDS和Genomic...# 读取newick,在当前工作目录中的nramp.nwk文件,并赋值tree tree <- read.newick("nramp.nwk") # 可视化树结构,这里用环形来展示 p1 <- ggtree...分组给分支上色 在别人的文章中,也经常会看到将tiplabel分为不同的颜色来进行上色,以更好的区分不容的clade。...希望能够帮助需要的人,同时我也能够不断继续摸索前行,永无止境。

8.2K30

ggtree-给你的进化盛世美颜

导语 GUIDE ╲ ggtree是ggplot2的拓展包,可以应用于进化的绘制,还能对进化丰富的注释分析。...atlas of colonic CD8+ T cells in ulcerative colitis.Nature Medicine.2020 系统发育用于描述一组生物之间的家谱关系,可以根据这些生物的遗传序列进行构建...ggtree是一个功能强大的系统发育可视化及注释R语言软件包,在Bioconductor中发布,是ggplot2的扩展包。ggtree可以读取多种数据格式的系统发育,并对其进行注释分析。...可实现的一些绘图展示 在这里,小编大家分享一些ggtree可以实现的绘图结果展示(当然只是一部分,ggtree还有非常多的功能可以满足大家的需求) 基本树状图绘制 绘制SNP和特征的数据...,在这一部分展示中使用了微生物数据进行绘图。

8.9K41
您找到你想要的搜索结果了吗?
是的
没有找到

我筹划了近10年的书,终于出中文版了!

每一次撰写论文的时候,都需要同样进行这样的机械式重复性操作。...以及如何呈现用户的操作与可视化能够更加符合直觉,减少学习成本?...ggtree一直处于比较活跃的开发状态,在开发的过程中也孕育了不少R包,包括ggtree本身被拆分为tidytree(将和相关数据以表格形式呈现,以tidyverse的方式进行操作)、treeio(用于和相关数据的输入输出...相信我们团队在未来,将会基于和数据集成开发出更多的工具,满足更多的应用场景,也相信ggtree系列包将来能够在学数据上得以广泛应用。...ggtree的可视化功能,不仅仅是对数据进行可视化呈现,更重要的是它了你通过图形进行数据探索的能力,而这一点再怎么强调都不为过,正如著名统计学家 John Tukey 说的:“图形的最大价值就是使我们注意始料未及的信息

38220

你的GAN再不听话,就把它暴力肢解了吧,有用 | Demo · 代码

这里有一只GAN,可以把耸的屋顶刷成圆的。 天上的云换个姿势,一秒种起一棵。 还可以,把草拔光。 ?...△ 消除大法:触草木,尽死 MIT、IBM、港中大以及谷歌的科学家,用念力一组一组控制了GAN的神经元,才支配了生成过程。 团队说,他们对GAN内在原理的了解程度,是前所未有的。...每个元素,都对应GAN的其中一组神经元。 只要激活某一组神经元,抑制其他神经元,就可以有选择生成想要的元素。 长期以来,人类任由GAN胡乱涂鸦,不大去追究它们作画的原理。 ?...Bau, et al, 2017) 结合,达成的 首先,把跟某个物体 (比如) 相关的、可解释的GAN单元 (Interpretable GAN Units) 挑出来。

49030

科研人的R速成利器,读这两本就够了!

相比之下,《R速成》采用了更为基础的向量和矩阵等数据结构,并且较为全面介绍了常见的统计方法,使得初学者可更轻松入门和理解R语言的数据科学应用,也方便他们阅读他人的代码。...02 《R实战:系统发育的数据集成操作及可视化》 这本书是南方医科大余光创教授写的关于ggtree数据整合和可视化的书,全书90%以上是代码和图,贴近实战,展示了很多数据可视化探索的方式。...《R实战:系统发育的数据集成操作及可视化》系统介绍使用treeio、tidytree、ggtree 和ggtreeExtra 等R软件包操作系统发育的全套流程,包括对文件的解析,以及与其相关数据的操作...关于ggtree也无须太多介绍,如果用R画进化,应该都会有一些了解。具体见南医大余光创ggtree最新文章(在iMeta上发表)。 这本书在京东预售期间便荣登畅销榜第一,且售空了货源。...一直专注于生物信息学方法工具开发及应用,在系统发育、学数据分析和数据可视化上开发了多款广受同行认可的生物信息学工具。

72230

HTML5-Canvas初探(1)

通常我们在js通过getElementById来获取要操作的canvas(这意味着咱得canvas设个id): 注意最好在一开始的时候就canvas设置好其宽高(若不设定宽高,浏览器会默认设置canvas...对于有些浏览器是不支持canvas功能的,我们可以直接在canvas标签中写一些替换内容,在浏览器不支持canvas时显示: ---- 接着在聊如何在canvas上绘图前,咱得先说说.getContext...,canvas也一样,想要运动路径轨迹能有视觉效果,需要使用相应的上色/描边方法 ---- 自此我们很轻松绘制了一条黑色的直线,但如果我们想要绘制一条红色的或者其它颜色的线段,该怎么做呢?...你会很自然做如下处理: 但运行脚本会发现,折线除了被描了一遍蓝色,也被描了一遍红色: ?...这是因为canvas在第二次路径上色时,是把之前的所有路径轨迹合在一起来上色的,除非咱们让canvas知道那折线和直线应该是独立开来的俩路径。

1.4K20

业界 | 谷歌和 OpenAI 强强联手找到了神经网络「黑盒子」的正确打开方式!

尽管它们在各类问题上都取得了成功,但我们仍无法直观地理解它们是如何在内部做出决策的。随着人工智能系统被应用到更多重要的场景中,更好了解其内部决策过程将有助于研究者能够及时发现其中的缺陷和错误。...这些激活图由一组复杂的高维向量表示,通过 UMAP 投影到有用的二维布局中,其中 UMAP 是一种保持原始高维空间局部结构的降维技术。...左:通过网络输入一组一百万张随机图像,每个图像收集一个随机空间激活图。中间:通过 UMAP 提供激活以将其降维到二维。然后绘制,相似的激活图彼此临近。...这张图集第一眼看上去气势虹——感觉很多东西在一起涌过来!这种多样性反映了模型所演化出来的各种视觉抽象和概念。 ? 总览多层(mixed4c)Inceptionv1 网络中其中一层的的激活图集。...这里,我们可以更清楚看到网络正在用什么标准来分类「红狐狸」。他们有的耳朵,被红色的皮毛包围的白色嘴鼻,以及繁茂树木或雪域的背景。 ? 这里,我们可以看到「瓦屋顶」探测器的许多不同尺度和角度。

53720

人人都是画家:朱俊彦&周博磊等人的GAN画笔帮你开启艺术生涯

研究者首先通过基于分割的网络剖析方法(network dissection method)识别出一组和对象概念很相关的可解释单元。...左边每个按钮( door、brick 等)都对应 20 个神经元。该 app 表明,通过学习绘画,GAN 网络还能学习、门还有屋顶等对象。...(b) 给定一个预训练的 GAN 模型( Progressive GAN),首先识别一组可解释单元,其特征图与不同图像中的对象类别区域高度相关。...例如,layer4 中的一个单元可以定位视觉外观不同的区域。(c) 通过强制激活为零来消融这些单元,量化消融的平均偶然效果。在这里,被成功从教堂图像中移除掉。...(d) 可以把这些单元插入到其它位置。同一组单元可以合成外观与周围环境兼容的不同的。此外,该方法可以通过识别引起视觉假象的单元来诊断并改进 GAN。

87920

小孩都看得懂的 GMM

更多的点上色,没问题。 ? 5 为了能更清晰的了解上色原理,假象我们从侧面看上面的立体图 ? 这样可以“看到”下面一维的高斯分布 (从一个侧面看二维高斯分布就是一维高斯分布)。...给定一组属于同类别数据点,即同种颜色,我们能很容易计算出质心 (center of mass),即统计学上的均值 (average) 点。 ?...7 上节的结论也适用于非完整点,即非完整点 ( 25% 的点,10% 的点) 也可以拟合出高斯分布。 ? 8 GMM 的两步弄清后,让我们完整来看如何用 GMM 来给数据聚类。...2 - 根据两个高斯分布,所有点上色 ? 3 - 根据每个点的颜色 (或混合颜色),拟合两个高斯分布 ? 拟合黄色高斯分布 ? 拟合蓝色高斯分布 ?...4 - 再根据两个高斯分布,所有点上色 ? ? 5 - 再根据每个点的颜色 (或混合颜色),拟合两个高斯分布 ? ? 6 - 再根据两个高斯分布,所有点上色 ? 直到收敛。

85710

联邦计算:不暴露真实数据如何完成合作建模?

而运营商、卡组织(银联、VISA)等拥有大量数据的机构,有意愿跟金融机构合作建模。 但是,因为金融机构与数据拥有方都有商业保密和政策合规的需要,因此无法把数据对方来执行传统建模程序。...如果线人手上信息可靠,那高低两的犯案者比例应当明显不同,高购毒量一组犯案占比更大。...同态加密基本性质的衍生 前文所述的通过条件组合,购毒量高且零工收入高,这种方式来组合多个线索,就得到了模型。...当然,这样子不知道要到何年何月才能猜出足够好的一组权重了,所以科学家想出了很多让这个猜测过程更快的办法,其中一种就叫做梯度下降法。 逻辑回归 线人先瞎猜一组权重,然后告诉探长结果。...结语 在本文中,我们从电影中探长与线人的博弈场景延伸展开,探讨如何在双方都不透露具体数据对方的情况下如何进行数据合作。

1.2K10

联邦计算:不暴露真实数据如何完成合作建模?

而运营商、卡组织(银联、VISA)等拥有大量数据的机构,有意愿跟金融机构合作建模。 但是,因为金融机构与数据拥有方都有商业保密和政策合规的需要,因此无法把数据对方来执行传统建模程序。...如果线人手上信息可靠,那高低两的犯案者比例应当明显不同,高购毒量一组犯案占比更大。...image.png 同态加密基本性质的衍生 前文所述的通过条件组合,购毒量高且零工收入高,这种方式来组合多个线索,就得到了模型。...当然,这样子不知道要到何年何月才能猜出足够好的一组权重了,所以科学家想出了很多让这个猜测过程更快的办法,其中一种就叫做梯度下降法。 image.png 线人先瞎猜一组权重,然后告诉探长结果。...结语 在本文中,我们从电影中探长与线人的博弈场景延伸展开,探讨如何在双方都不透露具体数据对方的情况下如何进行数据合作。

2.9K417298

佛罗里达州2021年春假:用Wolfram语言根据2月COVID-19数据预测3月变化

当然,黄金标准(用于分类)是在给定序列中检测其中一组突变。为此,人们需要仔细了解需要寻找的内容。搜索可以在"喧闹"的环境中进行:其他突变可能在附近,一些特征突变本身可能因进一步突变而稍有改变,等等。...相反,我依赖一种通用的基因比较方法,这种方法恰好能够很好实现当前的目的。 方法概要 这使我们对这里用于分析SARS-CoV-2的基因序列的策略进行了简要的描述。...一旦我们有了一组使用DCT减维的这些图像,下一步就是使用一种被称为主成分分析(PCA)的方法,它又是基于一种被称为奇异值分解(SVD)的线性代数矩阵函数。...例如,已发表的论文显示了基因何在沙贝科罗那病毒家族中的位置,但那些使用FCGR的论文并没有(据我所知)试图比较和/或聚类SARS-CoV-2的不同变体。...系统进化 系统进化图可以更好了解序列是否相关。除了放置的近似性,还有将给定的一对序列与其最接近的共同分支点分开的树枝长度。我们在下面的中利用了这一点。

45310

Github上评价最高的几个机器学习项目

基本上,如果你一个存储库打上星号,你就表示了你对这个项目的欣赏,同时也记录下了你感兴趣的存储库。 ? 这样,星级评定就可以成为了解最受关注项目的良好指标之一。...文本分类是许多应用程序的核心问题,垃圾邮件检测、情绪分析或智能回复。文本分类的目标是将文档(电子邮件、帖子、文本消息、产品评论等)分配到多个类别。 ?...03 很棒的TensorFlow-14,424★ 这是一组帮助您理解和使用TensorFlow的资源。github repo包含一系列很棒的TensorFlow实验、库和项目。...使用it开发人员可以轻松构建和部署ML支持的应用程序。 ?...这是一个非常有趣的概念,人工智能被用来给图像上色。 他们声称style2paint V4是目前最好的人工智能驱动的线条艺术着色工具。

51230

【每天一个 Linux 命令】tree命令

tree程序可以在Unix和类Unix系统(Linux)中使用,也可以在DOS、Windows和许多其他操作系统中使用。...-C 在文件和目录清单加上色彩,便于区分各种类型。 -d 显示目录名称而非内容。 -D 列出文件或目录的更改时间。 -f 在每个文件或目录之前,显示完整的相对路径名称。...-n 不在文件和目录清单加上色彩。 -N 直接列出文件和目录名称,包括控制字符。 -p 列出权限标示。 -P 只显示符合范本样式的文件或目录名称。 -q 用”?”...tree -f --prune tree还支持一些有用的文件选项,-p,它以类似ls -l命令的方式打印每个文件的文件类型和权限。...tree -f -p 此外,要打印每个文件的用户名(如果没有用户名,则为UID),使用-u选项,而-g选项打印名(如果没有名,则为GID)。

1K30

咦!这样画基因结构图够好看!(结尾有送书福利)

make_alignment_dummies()会根据给定的数据和待对齐的基因,生成一组空基因;再使用geom_blank()将这些空基因添加到绘图中,就可以填充两侧的空白,以在图上直观对齐所选的基因...如果forward为FALSE,或者任何强制为假的值(-1),则该基因将按暗指方向的相反方向绘制。...配合geom_gene_arrow()不给基因上色,而只标记子区域。...使用geom_subgene_label()子区域在图上加标签,它的工作原理类似于geom_gene_label(),但主要的区别是它需要xsubmin和xsubmax属性 (而不是xmin和xmax...如果还想可视化具有基因基因座结构的系统进化,推荐阅读Y叔根据gggenes包数据写的扩展:https://yulab-smu.github.io/treedata-book/chapter11.html

5.1K33

《数据可视化基础》第三章:图形颜色如何选择

我按人口增长的顺序排列了州,并按地理区域为州上色。下图使用的这四个颜色,都不一样,但是也不会让人觉得说哪一个颜色会特别的突兀。 ? 2....这些颜色清楚显示(i)哪些值大于或小于其他值,以及(ii)两个特定值之间的距离。顺序刻度可以基于单个色调(例如,从深蓝色到浅蓝色),也可以基于多种色调(例如,从深红色到浅黄色)。 ?...当我们想显示数据值如何在地理区域内变化时,将数据值表示为颜色特别有用。在这种情况下,我们可以绘制地理区域的地图并通过数据值对其进行着色。这样的地图被称为choropleths。...可视化清楚显示了在哪个县中白人占多数,在白人中占少数,在白人和非白人中所占比例大致相等。 ? 3. 使用颜色突出显示 颜色也可以是突出显示数据中特定元素的有效工具。...它是一类既包含一组柔和的颜色,同时也包含一组更强,更暗和/或更饱和的颜色。 ? 以上上面统计各个州人口的例子,在文字描述当中,如果想要强调说明德克萨斯州和路易斯安那州。就可以这么绘制图形。 ?

1.1K40

GAN为百年旧照上色

如何黑白旧照上色 在解释电脑程序如何上色之前,我们先来看一下人类如何图像上色上色是一份非常耗时且对技能要求很高的工作。...同样,计算机程序也需要完成两项任务: 识别黑白照片中的目标并基于之前见过的照片推断出适合目标的颜色; 黑白照片上色 使用生成对抗网络进行上色 为了黑白照片上色,我们运用了深度学习中已知的生成对抗网络技术...我们基于一组超过 50 万张关于新加坡的旧照片的数据集进行训练,我们使用装有英伟达 V100 GPU 的本地 GPU 集群编译了这些照片。...上色之后,这些照片上的人似乎又变得鲜活起来。 ? 利用 Colourise.sg 1880 年的汤加(太平洋岛国)旧照上色。 ?...网友利用 Colourise.sg 自己祖父母的结婚照上色,惊呼「So so awesome」 ? 网友利用 colourise.sg 技术旧风景照上色,效果惊人。直呼:盘它!

68120

GAN为百年旧照上色

如何黑白旧照上色 在解释电脑程序如何上色之前,我们先来看一下人类如何图像上色上色是一份非常耗时且对技能要求很高的工作。...同样,计算机程序也需要完成两项任务: 识别黑白照片中的目标并基于之前见过的照片推断出适合目标的颜色; 黑白照片上色 使用生成对抗网络进行上色 为了黑白照片上色,我们运用了深度学习中已知的生成对抗网络技术...我们基于一组超过 50 万张关于新加坡的旧照片的数据集进行训练,我们使用装有英伟达 V100 GPU 的本地 GPU 集群编译了这些照片。...上色之后,这些照片上的人似乎又变得鲜活起来。 ? 利用 Colourise.sg 1880 年的汤加(太平洋岛国)旧照上色。 ?...网友利用 Colourise.sg 自己祖父母的结婚照上色,惊呼「So so awesome」 ? 网友利用 colourise.sg 技术旧风景照上色,效果惊人。直呼:盘它!

1K10

黑白照片修复亦可「如假包换」,华人学者提出实例感知着色新方法

选自arXiv 作者:Jheng-Wei Su等 机器之心编译 参与:Racoon、蛋酱、小舟 为黑白照片上色不难,但难在如何实现「以假乱真」。...黑白图像自动上色一直是个很有趣的话题,这方面的技术可广泛应用于旧照片和旧视频的修复,使百年旧照重新焕发生机。...以往的方法虽然也能在某些图像中达到相当不错的生成效果,但还没有一种方法能够很好解决包含多个物体的图像着色问题,主要原因是现有的模型都是在整个图像上学习然后着色,在图形和背景无法清晰分离的情况下,这些模型无法很好地学习到有用的对象语义...colab.research.google.com/github/ericsujw/InstColorization/blob/master/InstColorization.ipynb 现有方法的缺陷在于无法预测多对象实例图像中的合理颜色,上面一组图的滑雪者和下面一组图中的车辆都属于此类...在实例层面上的定量比较 上色视觉效果比较结果 下图展示了论文中提出的方法与其他基线方法在上色效果上的比较结果。

57910

R包reshape2 |轻松实现长、宽数据表格转换

2013/10/19/reshape/ R语言 - 入门环境Rstudio R语言 - 基础概念和矩阵操作 一、reshape2 简介 reshape2是由Hadley Wickham编写的R包,可以轻松在宽格式...长数据矩阵中一列代表变量类型,另外一列表示对用的变量值。...包 利用ComplexHeatmap绘制热图(一) ggplot2学习笔记之图形排列 用R在地图上绘制网络图的三种方法 PCA主成分分析实战和可视化 附R代码和测试数据 iTOL快速绘制颜值最高的进化!...冲击图展示间时间序列变化ggalluvial 桑基图riverplot 微生物环境因子分析ggvegan 五彩进化与热图更配ggtree 多元回归分析mvpart 随机森林randomForest...冲击图展示间时间序列变化ggalluvial 桑基图riverplot 微生物环境因子分析ggvegan 五彩进化与热图更配ggtree 多元回归分析mvpart 随机森林randomForest

10.8K12
领券