前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >动物育种数据分析的效益和挑战

动物育种数据分析的效益和挑战

作者头像
邓飞
发布于 2019-07-12 04:02:37
发布于 2019-07-12 04:02:37
9440
举报

推荐语: 育种数据分析的效益很高,也存在一些难点。这个PPT讲了育种数据计算中现状以及挑战,讲了动物育种中效率的提升依赖于工具的进步,这些工具目前的进一步发展也存在一些挑战. 很全面的讲述。文字中,我加上了自己的理解和翻译。

PPT链接

https://www.interfacesymposia.org/I03/I2003Proceedings/MisztalIgnacy/MisztalIgnacy.presentation.pdf

1. 题目及作者

题目及作者

2. 育种为什么在现代农业中如此重要

人工受精和胚胎移植在动物育种中广泛应用,一个公牛可以有超过10万个雌性后代(奶牛)。工业化养殖(牧场, 养猪场, 农作物机械化)时代,育种的效益更加明显,任何细节的优化,效率的提升,放大规模后都会产生显著的效益。

现代化育种需要的条件:基因组信息、大量的表型数据、系谱数据。还包括环境数据, 家系数据等等,用于预测基因组育种值。

3. 不同物种的育种现状

奶牛 显著的特点是精液市场全球化,优秀的公牛,后代从产奶,肉质, 蛋白产量,料肉比都有巨大的效益。

肉牛

家禽 家禽育种,特别是鸡育种,规模非常大,而且分层育种结果,比如三交种,五交种。最终使用的是最后的杂交种,一个个体有效的记录可以追溯20万只鸡,考虑各种经济性质比如产蛋,肉质等等。

猪育种

典型的公司, PIC.

之前,我以为作物育种中,先锋,孟山都可望而不可及,中国种业落后。了解动物育种后,更让人绝望。

植物还可以直接使用自交系,可以使用二环系进行改良,本地资源由于环境的特殊适应性,国外品种还不能一统天下。

但是动物育种,都是在猪场,鸡场中养殖,工业化养殖环境更可控,不同于植物可以自交,动物的种质更难利用。

4. 基因组选择的效果

牛奶产量提升了2倍,鸡的成熟周期缩短了2倍,饲料转化率提升了2倍。效果十分显著

5. 基因组选择的模型

基因型育种值的构成

动物模型的构成

混合线性模型的矩阵形式

不同的模型

  • 公畜模型
  • 单性状动物模型
  • 多性状动物模型
  • 随机回归模型
6. 育种数据计算的挑战

两大挑战:

  • 估算方差组分
  • 求解混合线性方程组

稀疏矩阵, hash结构, 指向列和值的行指针

高效储存的方式, 指针

求解方程组的方法:PCG

方差组分估算, 迭代方法

7. 两种方法估算方差组分

如何估算方差组分?

  • REML
  • 贝叶斯

REML

REML的挑战

贝叶斯

贝叶斯的挑战

8. 育种数据的软件

SAS不能处理大数据混合模型

其它软件:

  • PEST, VCE(很旧的软件)
  • ASREML(商业软件)
  • DMU
  • MATVEC(没用过)
  • BLUPF90

平台

WindowsLinux, Unix都可以. 但是并行和向量化运算不是最重要的.

随机回归模型, 应该是最复杂的计算量最大的模型, 研究显示, 相比较于并行化运算, 标量优化(Scalar optimization)更重要.

不同的语言, 不同的算法, 结果可能是半个小时和半年的差别, 时间和内存的提升是线性的, 算法的提升确实指数型的. 好的工具加上好的算法才能事半功倍.

数量遗传的其它模型 这些模型, 未来也可以用于基因组选择育种:

  • 截距模型(Censored model)
  • 生存模型(Survival model)
  • 阈值模型(Threshold model)
9. 结论
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 育种数据分析之放飞自我 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
动物育种统计发展的百年--翻译版
Daniel Gianola1–5 and Guilherme J.M. Rosa1,2
邓飞
2023/09/06
3600
动物育种统计发展的百年--翻译版
植物碰撞动物的火花--数据分析进阶
本来,植物育种的数据分析都是随机区组、增广试验、空间分析之类的,当碰到动物育种的领域,系谱信息、个体动物模型就出来了,更别提多性状模型、基因组选择、基因与环境互作,这些都是进阶的内容。
邓飞
2022/12/12
4610
植物碰撞动物的火花--数据分析进阶
我的农学转数据分析之花花草草
数据分析界育种知识最好、育种界编程最扎实、段子讲得最好的数据分析师,所以:编程+数据分析+育种,就是我的日常工作了。
邓飞
2022/12/12
5460
我的农学转数据分析之花花草草
GWAS和GS的结合:SSGWAS的应用
满血复活。注意:这个blupf90的新功能,貌似有点问题,好几个人测试显示SSGWAS结果P-value不显示。还未坐实,待我测试后公布。
邓飞
2019/09/04
1.7K0
GWAS和GS的结合:SSGWAS的应用
会议回顾 | 基因组育种技术助力畜禽水产等动物育种的选择及产业应用
2022年12月8日,由影子基因、华大智造和翌圣生物联合举办,农业动物遗传育种与繁殖教育部重点实验室、深圳国家基因库、国家畜牧科技创新联盟以及基因组育种前沿支持的动物基因组育种前沿与产业应用线上研讨会成功召开。本次研讨会得到动物遗传育种领域专家学者的广泛关注,组织单位6个平台同步直播,累计观看人数达到1.2万人次,听会师生踊跃提问交流,均表示通过此次学术研讨会受益匪浅。
尐尐呅
2023/03/02
6070
会议回顾 | 基因组育种技术助力畜禽水产等动物育种的选择及产业应用
基因组选择分析软件调研
目前, 基因组选择进入了一个高速发展的阶段, 各种新的算法和模型被提出。为了解相关软件应用的整体情况,也为选择合适的软件进行全基因组选择分析提供决策,这里对基因组选择的软件进行一个汇总。
邓飞
2019/06/13
1.9K0
ASReml文献解析|如何分析猪繁殖性状遗传参数估计
asreml软件功能非常强大,使用简单,遗传评估和基因组选择的利器,5月份有个遗传评估和基因组选择的培训班(见文末),
邓飞
2024/05/11
2990
ASReml文献解析|如何分析猪繁殖性状遗传参数估计
读文献:全基因组选择模型进展及展望
随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率;直接法(GBLUP为代表)计算效率较高,但是计算准确性略差于间接法(BayesB为代表),虽然学者对直接法进行了改进,但是由于改进的策略中人为设定参数较多,因此模型的预测准确性受主观因素影响较大;间接法计算准确性较高,但是由于参数求解过程中计算量庞大,且无法实现并行运算,而育种讲求时效性,所以难以高效指导育种实践;因此,如何优化模型,尽可能减少人为设定参数,与机器学习方法有效结合,并融入高效可并行运算,既能保证较高准确性的同时,大大提升计算效率,是未来全基因组选择模型优化的方向。
邓飞
2019/12/05
1.1K0
一步法中混合线性模型方程组构建和控制--blupf90
参考文献 http://nce.ads.uga.edu/wiki/lib/exe/fetch.php?media=singlestepblupf90.pdf 1,ABLUP VS SSGBLUP 传统
邓飞
2019/07/07
1K0
一步法中混合线性模型方程组构建和控制--blupf90
育种数据分析中转化数据对结果的影响
在模型假定中,数据需要符合正态分布,在动物模型分析中,如果对数据进行转化,对育种值和方差组分变化的情况,进行测试。
邓飞
2019/12/05
6570
全基因组选择介绍及实践-1
这篇是基因组选择的理论加实践,因为我看到一句话,Talk is cheap. Show me the code,很有感触,有感而写。使用的包是R的sommer和asreml,其实强健的还是成熟的软件,比如DMU,BLUPF90,PIBLUP,ASreml等,但sommer作为基本功能的演示,非常合适。
邓飞
2019/06/13
2.1K0
农学的为何要学习神经网络???
在我刚开始学习GS的时候,我是从混合线性模型(LMM)的基础上理解的,因为动物模型BLUP,所以基因组选择GBLUP,再所以一步法ssGBLUP。
邓飞
2022/12/13
3270
农学的为何要学习神经网络???
育种数据分析神器:线性混合模型
这里使用sleepstudy数据集,看一下免费的R包lme4和付费包asreml如何处理不同的混合线性模型,以加深对混合线性模型的理解。
邓飞
2022/12/13
9060
育种数据分析神器:线性混合模型
丢失的遗传力是个什么鬼?
这两天被黄三文老师的团队刷屏了(2022年6月8日,中国农业科学院深圳农业基因组研究所(“基因组所”)黄三文团队在Nature 杂志同时在线发表了两篇研究论文),报道了该团队在植物基因组学领域的两项重要研究成果,为实现泛基因组在作物育种的应用提供了新的解决方案。其中一篇《Graph pangenome captures missing heritability and empowers tomato breeding》介绍了通过图泛基因组(Graph Pan-genome)解释了重要的数量遗传学的问题:丢失的遗传力。
邓飞
2022/07/27
8710
丢失的遗传力是个什么鬼?
环境遗传相关 | 育种中的基因与环境互作
基因与环境互作,植物中同一个品种多年多点种植,评价基因与环境互作,找到品种最适合推广的区域。
邓飞
2022/12/13
1.1K0
环境遗传相关 | 育种中的基因与环境互作
通过基因组选择预测杂交水稻的表现(数据挖掘)
基因组选择,预测杂种优势,在水稻可以用,在玉米,高粱中也可以用,在动物选择配套系时也可以用,根据加性效应和非加性效应进行预测,前景广阔。
邓飞
2019/06/13
9640
农业数据分析师的职业规划
农业的数据分析以后会越来越重要,因为分子数据的落地,包括分子标记辅助、GWAS和GS的应用,特别是基因组选择(GS)的落地,使得育种的效率大大提升,以后使用数据去育种将不再是纸面上冠冕堂皇的话,而是事实。
邓飞
2022/12/13
3530
农业数据分析师的职业规划
学习一个PPT:育种中混线性模型的应用
可以看出,GS的方法比传统系谱的方法准确性要高。对于一些甚至系谱也没有应用,只靠家系或者表型选择的中低遗传力性状,GS呈现碾压式优势。所谓的降维打击既是如此。
邓飞
2019/12/19
8930
文献阅读: 林木中遗传参数评估
这篇文章, 非常具有代表性, 可以为林木和作物的数据分析提供思路, 不一定非要有系谱才可以计算育种值和遗传相关, 混合线性模型代替一般线性模型进行育种值的筛选, 是大势所趋, 必须推而广之.
邓飞
2019/06/13
6390
文献阅读: ABLUP-GBLUP-SSGBLUP模拟数据比较
全基因组选择, 参考群需要建多大, 这篇文章用实际数据和模拟数据证明, 参考群至少要有500才有效果. 另外, 多性状SSGBLUP比单性状SSGBLUP要好. 所以, 学好传统的数量遗传学对于基因组选择也是有帮助的.
邓飞
2019/06/13
2.1K0
相关推荐
动物育种统计发展的百年--翻译版
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档