前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >动植物基因组大小粗略比较

动植物基因组大小粗略比较

作者头像
用户7010445
发布2020-03-03 15:03:25
1.7K0
发布2020-03-03 15:03:25
举报

在知乎看到问题 为什么植物基因组比动物基因组大(为什么植物基因组似乎比脊椎动物拥有更多的基因?)? 印象里好像也不一定,因为拟南芥的基因组也才100多M,自己之前也看到过有些鱼的基因组也可以达到1G的级别。所以到NCBI网站上查了一下,找到了459个陆生植物(land Plants)植物的基因组信息,264个鱼(Fishes)418个昆虫(insects),377个哺乳动物(Mammals)的基因组信息。

我们分别看一下基因组大小的分布范围
library(ggplot2)
library(ggthemes)

landPlant<-read.csv("Genome_Size/landPlantsgenomes.csv",header=T)
landPlant$group<-"LandPlant"

fishes<-read.csv("Genome_Size/fishesgenomes.csv",header=T)
fishes$group<-"Fishes"

insects<-read.csv("Genome_Size/insectsgenomes.csv",header=T)
insects$group<-"Insects"

mammals<-read.csv("Genome_Size/mammalgenomes.csv",header=T)
mammals$group<-"Mammals"

df<-rbind(landPlant,fishes,insects,mammals)

dim(df)
colnames(df)
ggplot(df,aes(x=Size.Mb.))+
  geom_density(aes(fill=group))+
  facet_grid(group~.)+
  theme_gdocs()+
  theme(axis.text.y=element_blank())+
  scale_fill_manual("Species",
                    values=c("#FFCC33","#FF3300",
                             "#990000","#0066FF"))+
  labs(x="Genome Size (MB)")

image.png 总体来看还是哺乳动物的基因组更大,上图看起来不太美观,我们去掉一些极端值

ggplot(df,aes(x=Size.Mb.))+
  geom_density(aes(fill=group))+
  facet_grid(group~.)+
  theme_gdocs()+
  theme(axis.text.y=element_blank())+
  scale_fill_manual("Species",
                    values=c("#FFCC33","#FF3300",
                             "#990000","#0066FF"))+
  xlim(0,5000)+labs(x="Genome Size (MB)",y="")

image.png

接下来在分别看看最大和最小
library(dplyr)
df1<-df%>%
  group_by(group)%>%
  summarise(value=max(Size.Mb.))
ggplot(df1,aes(x=group,y=value))+
  geom_col(aes(fill=group))+
  labs(x="Species",y="Genome Size (MB)")+
  theme_bw()
df2<-df%>%
  group_by(group)%>%
  summarise(value=min(Size.Mb.))
ggplot(df2,aes(x=group,y=value))+
  geom_col(aes(fill=group))+
  labs(x="Species",y="Genome Size (MB)")+
  theme_bw()
df2

最大

image.png 最大的是

df[which(df$Size.Mb. > 27600),]

Pinus lambertiana

最小

image.png 最小基因组出现了0,应该是数据出现了问题,有时间再来检查吧

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-12-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 我们分别看一下基因组大小的分布范围
  • 接下来在分别看看最大和最小
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档