SIFT是Sortig Intolerant From Tolerant的缩写, 是一款软件,基于氨基酸序列的同源性和物理性质来预测氨基酸的替换对蛋白质功能是否造成影响,用来评估基因变异的有害程度。
官网链接如下:
http://sift.bii.a-star.edu.sg/
对于一个变异位点,最终会给出一个具体的打分。sift score
的取值范围为0-1,可以划分为两个范围。0-0.05范围内,认为这个变异位点是有害的,会导致蛋白质功能的改变。数值越小,引起蛋白质功能改变的可能性越大;0.05-1范围内,认为这个变异位点是良性的,数值越接近1,对蛋白质功能的影响越小。
官网提供了两种方式对变异位点进行评估
下载链接如下
http://sift.bii.a-star.edu.sg/sift4g/AnnotateVariants.html
安装程序是基于java 语言开发的,是带图形界面的。界面如下
Variant File
指定输入的变异位点文件,格式为VCF,必须按照染色体名称和位置排过序。同时还需要物种对应的数据库。对于常见的物种,官网提供了下载链接
直接点击Database
,在下拉菜单中选择Select database to download ,选择参考物种即可。
对于常见物种,也提供了在线服务,直接上传VCF文件到网站上进行分析,链接如下
http://sift.bii.a-star.edu.sg/www/SIFT4G_vcf_submit.html
不论是本地运行,还是在线服务,最后都会给出对应的sift score
以及变异位点有害程度的描述,输出结果列数较多,截取了SIFT_SCORE
和SIFT_PREDICTION
两列的结果
SIFT_PREDICTION
对变异位点的有害程度进行了描述,TOLERATED
代表良性,对蛋白质功能影响不大;DELETERIOUS
代表有害,对蛋白质功能造成了影响。