随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率;直接法(GBLUP为代表)计算效率较高,但是计算准确性略差于间接法(BayesB为代表),虽然学者对直接法进行了改进,但是由于改进的策略中人为设定参数较多,因此模型的预测准确性受主观因素影响较大;间接法计算准确性较高,但是由于参数求解过程中计算量庞大,且无法实现并行运算,而育种讲求时效性,所以难以高效指导育种实践;因此,如何优化模型,尽可能减少人为设定参数,与机器学习方法有效结合,并融入高效可并行运算,既能保证较高准确性的同时,大大提升计算效率,是未来全基因组选择模型优化的方向。
尹立林, 马云龙, 项韬, et al. 全基因组选择模型研究进展及展望[J]. 畜牧兽医学报, 2019, 50(02):9-18.
全基因组选择是一种利用覆盖全基因组的高密度标记进行选择育种的新方法,可通过早期选择缩短世代间隔,提高育种值估计准确性等加快遗传进展,尤其对低遗传力、难测定的复杂性状具有较好的预测效果,真正实现了基因组技术指导育种实践。
关键词:
统计模型是全基因组选择的核心,极大地影响了基因组预测的准确度和效率。根据统计模型的不同,全基因组选择的模型大体可分为两大类:
直接法公式:
间接法公式:
性状遗传构建复杂多样,目前还没有一种模型能广泛适用于所有性状[56-57]。随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率;直接法(GBLUP为代表)计算效率较高,但是计算准确性略差于间接法(BayesB为代表),虽然学者对直接法进行了改进,但是由于改进的策略中人为设定参数较多,因此模型的预测准确性受主观因素影响较大;间接法计算准确性较高,但是由于参数求解过程中计算量庞大,且无法实现并行运算,而育种讲求时效性,所以难以高效指导育种实践;因此,如何优化模型,尽可能减少人为设定参数,与机器学习方法有效结合,并融入高效可并行运算,既能保证较高准确性的同时,大大提升计算效率,是未来全基因组选择模型优化的方向。
尽管测序技术对于全基因组选择具有众多好处,但也存在一些问题,测序技术已经经历了3代技术革新,检测质量及完整性越来越高,高质量的测序结果需要更高的测序深度,意味着测序成本更昂贵,并且测序数据庞大,主流的分析软件处理速度较慢,使用复杂繁琐,对于计算资源的配置需求较高,因此如何快速、有效地储存、处理及分析数据是测序技术应用于全基因组育种的重要挑战,另外,测序只能检测参考基因组中已知的序列和基因信息,对于未知的基因序列和基因还不能进一步深入研究。当然,随着测序方法和芯片技术的不断成熟,未来个体分型费用将不断降低,分型准确性不断提高,全基因组选择将逐步替代传统育种方法,为动物育种改良带来一次新的技术革命。