首页
学习
活动
专区
工具
TVP
发布

生物信息学

专栏作者
59
文章
155848
阅读量
22
订阅数
如何选择测序类型
测序(Sequencing)是一种实验技术,用来识别和确定 DNA 分子中碱基的顺序。不同的测序类型应该使用不同的方法来分析,最后的结果解读方式也会不同。在实际应用中,具体选择哪一种测序类型,由研究的科学目标、成本及实际限制来决定。例如,在临床应用上,对已知突变位点的检测是时间敏感的,即测序和分析越快越好,而群体的基础研究更侧重于挖掘新的变异。因此,测序类型的选择是成本和信息广度之间权衡的结果。
阿凡亮
2023-03-02
8250
大环境下还有多少公司在招生信
最近两个月,不断地听到国内外,各大科技公司都有大规模裁员的消息,不少基因测序公司也放缓了招聘。在疫情等因素影响的大环境下,还有多少公司在招生信相关的岗位呢,小编做了些收集和统计。
阿凡亮
2023-03-02
2870
关于k-mer与基因组(组装)的那些事
随着越来越多物种的基因组被测序发表,极大丰富了我们对物种起源、进化等方面的认知,同时也为各种物种的研究打下了基础。但是在面对复杂基因组时或者参考基因组并未发表的情况下,我们通常会对这个物种的基因组进行De Novo组装,在得到一个相对完整的基因组图谱以后,接着进行接下来的分析如基因功能预测、物种间进化关系等。在这个过程中,我们经常会遇到k-mer这个名词,然而这个抽象的名词是什么意思呢?它又有什么用呢?接下来,就随着小编一起去探究这k-mer背后的含义吧!
阿凡亮
2020-04-14
8.9K0
基于机器学习的蛋白质亚细胞定位预测
蛋白质是生命活动的主要承担者,也是组成人体一切细胞、组织的重要成分。研究表明,所有蛋白质有对应的亚细胞器,不同功能的蛋白质只有存在于特定的亚细胞器,才能正常发挥其作用。因而寻找一种简单高效的方法对蛋白质亚细胞器进行定位,即获取其特定的亚细胞区间,对了解蛋白质的功能和性质,研究蛋白质之间的相互作用具有重要意义。随着高通量测序时代的来临,大部分生物数据需要通过理化实验对其结构及功能进行注释,传统标注方法如细胞分馏、电子显微镜和荧光显微镜等,成本较高,且耗时费力,借助先进高效的计算机技术,基于统计预测或理论计算的方法从海量数据中挖掘出有效信息已成为了当今时代的迫切需要。
阿凡亮
2020-04-14
7220
深入浅出介绍植物miRNA预测软件miRDP-2
上期介绍了植物miRNA的鉴定标准, 通过这些标准就可以通过sRNA-Seq对植物的miRNA进行鉴定, 但自己通过写代码完成这个标准不仅费时费力,而且还会出现考虑不周的情况。本期介绍一款2019年发表在bioinformatics上的植物miRNA鉴定软件miRDP-2, 它不仅通过上期介绍的miRNA鉴定标准进行miRNA的鉴定,而且相比其它软件具有更快的运行速度以及更加准确的miRNA鉴定率。具体性能图如下所示:
阿凡亮
2020-04-14
1.1K0
密码子使用偏性的分析方法介绍
DNA通过转录,控制着mRNA的合成,而mRNA是蛋白质合成的模板,它决定了蛋白质的序列结构、功能等信息。把mRNA看作一种语言,它由4种不同碱基的核苷酸组成(A、U、C、G),蛋白质序列则是完全不同的另外一种语言,它由20种基本氨基酸组成。在生命体内就有一种机制,它通过识别这4种碱基的不同排列组合来翻译成对应的氨基酸,因此碱基在mRNA中的顺序称为遗传密码(Genetic Code),mRNA中每三个核苷酸组成的三联体称为一个密码子(Codon),遗传密码子表见下图。
阿凡亮
2020-04-14
3.5K0
植物miRNA的鉴定原理
由上面的介绍我们知道miRNA是由可以折叠成茎环结构的的RNA产生的,由此我们可以想到只要预测基因组序列中可以折叠成茎环结构的区域就可以对miRNA进行预测了,但是只通过这一个标准来预测难免会带入太多的假阳性;我们又想到由于miRNA一般为21-22nt,所以miRNA的前体应该不会特别长,通过查阅文献得知miRNA的前体序列一般不超过300nt,那我们通过长度再次过滤是不是就可以了呢?答案是不行的,两个特征还是太少了。因此我们接着对miRNA的二级结构进行具体分析, 下图是拟南芥miRNA MIR399b的二级结构:
阿凡亮
2020-04-14
1.4K0
git:分布式备份你的代码
Git是目前世界上最先进的分布式版本控制系统(没有之一)。参见:https://www.liaoxuefeng.com/wiki/896043488029600/896202815778784
阿凡亮
2020-04-14
6360
教你用clusterProfiler实现其它来源富集结果的可视化
在对功能富集分析的结果进行可视化的时候,大家肯定都听过Y叔的R包clusterProfiler,这个包可以说是富集分析结果可视化的神器,不仅画出来的图好看,而且种类繁多,可以满足各种需求;但要想用clusterProfiler进行可视化就必须用它进行富集分析;对于其他软件的富集结果,是不能够进行可视化的。那么能不能通过clusterProfiler对其他软件的富集结果进行可视化分析呢?答案是肯定的,本期就给大家分享一下怎么通过clusterProfiler对其他软件的富集结果进行可视化。
阿凡亮
2020-04-14
3.2K2
只用一行来颠覆你处理文件的方式
引言:生物信息学文件多样,通常我们会遇到各种将不同格式进行转换或者把文件修改成我们想要的那种格式的需求,不懂生信的小伙伴们会请教会生信的小伙伴,其实会生信的同学面对这些问题时往往也会很头大(OS:我们也不是万能的呀!
阿凡亮
2020-04-14
1.8K0
Numba向量运算的强大
Hi! 大家好,又和大家见面了。上次给大家介绍了Numba中一句话加速for循环的@jit加速你的python脚本,今天继续给大家介绍另外一个我觉得很不错的Numba的用法。
阿凡亮
2020-04-14
1.1K0
Linux入门之文件权限解密
Linux系统中的每个文件和目录都有访问许可权限,用以确定谁可以通过何种方式对文件和目录进行访问和操作。要想流畅的使用Linux系统,掌握文件权限管理必不可少。今天给大家介绍这方面的知识,希望能帮助大家更好的入门Linux。
阿凡亮
2020-04-14
1.3K0
如何使程序在Linux后台运行
这样一来,test程序就在后台运行了。但是,这样处理还不够,因为这样做虽然程序是在后台运行了,但log依然不停的输出到当前终端。因此,要让终端彻底的清静,还应将log重定向到指定的文件:
阿凡亮
2020-04-14
8.4K0
ChIPseeker对ChIP-seq数据进行注释与可视化
这里我们主要介绍ChIPseeker包用于ChIP-seq数据的注释与可视化,主要分为以下几个部分。
阿凡亮
2020-04-14
7.4K0
BioMart下载多个基因的同源基因
上期介绍了怎么通过Ensembl网站下载单个基因的同源基因序列,这期顺着上期的留言介绍一下怎么通过Ensembl网站下载多个基因的直系同源基因,用到的工具是Ensembl网站的Biomart功能。
阿凡亮
2020-04-14
1.4K0
一步到位-把生信分析装在“盒子”里
每一个做生信的人在安装新软件之前都曾有过期待,这个软件要一次性安装好,可现实往往是残酷的...可见有一个良好的分析环境,对我们的研究效率是有多么的高!
阿凡亮
2020-04-14
4660
5个超棒的在线配色神器
在我们做图表或者做PPT的过程中,好的配色可以让人心情愉悦,也可以帮助我们更好的传达出想表达的意思。作为非设计专业的人,现成的的优秀配色方案或者好用的配色工具就显得十分重要了!
阿凡亮
2020-04-14
1.7K0
谈癌色变?no! 用科学的视角战胜恐慌
中国癌症的发病率现阶段在世界排名近70,发病率最高的国家是欧美等发达国家,中国的发病率并不是最高的,但是中国的发病人数是全球最多的。下图是2018年北京大学公共卫生学院王润田教授统计的全球癌症发病率:
阿凡亮
2020-04-14
2680
R入门?从Tidyverse学起!
很多人推荐《R语言实战》这本书来入门R,当然,这本书非常不错,我也是通过这本书开始接触的R。这种入门的学习路径属于base R first,学习的流程基本是先了解变量的类型、数据的结构,再深入点就会学到循环与自定义函数。有些类似于先认识编程,再按照数据处理、可视化、统计分析等应用方向开始下一个学习的旅程。
阿凡亮
2020-04-14
2.5K0
蛋白质亚细胞定位分析
亚细胞定位是指某种蛋白或某个基因表达产物在细胞内的具体存在部位,包括细胞核、细胞质和细胞膜等部位。传统的实验方法有,利用一些荧光蛋白如GFP、YFP,通过其在激光照射下发出的绿色或黄色荧光,从而精确确定编码蛋白的定位。如果面对质谱打出来很多蛋白,传统的实验方法显得十分乏力。如果能利用生物信息学手段基于一些算法如机器学习等开发的方法进行亚细胞定位预测分析辅助于实验,这样就能省时省力节约成本。
阿凡亮
2020-04-14
3.6K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档