数字农科院2.0

机器学习在动物基因组选择中的研究进展

文献类型: 中文期刊

作者: 李棉燕;王立贤;赵福平

作者机构:

关键词: 机器学习;深度学习;基因组选择;动物育种

期刊名称:中国农业科学

ISSN: 0578-1752

年卷期: 2023 年 18 期

页码:

收录情况: 北大核心(2020版) ; ; CSCD(2023-2024年度) ; ; 科技核心(2023版) ; ; 农林核心(2020版)

摘要: 基因组选择是指利用覆盖在全基因组范围内的分子标记信息来估计个体育种值.利用基因组信息能够避免因系谱错误带来的诸多问题,提高选择准确性并缩短育种世代间隔.根据统计模型的不同,基因组选择方法可大致分为基于BLUP(best linear unbiased prediction,BLUP)理论的方法、基于贝叶斯理论的方法和其他方法.目前应用较多的是GBLUP及其改进方法ssGBLUP.准确性是基因组选择模型最常用的评价指标,用来衡量真实值和估计值之间的相似程度.影响准确性的因素可以从模型中体现,大致分为可控因素和不可控因素.传统基因组选择方法促进了动物育种的快速发展,但这些方法目前都面临着多群体、多组学和计算等诸多挑战,不能捕获基因组高维数据间的非线性关系.作为人工智能的一个分支,机器学习是最贴近生物掌握自然语言处理能力的一种方式.机器学习从数据中提取特征并自动总结规律,利用该规律与新数据进行预测.对于基因组信息,机器学习无需进行分布假设,且所有的标记信息都能够被考虑进模型当中.相比于传统的基因组选择方法,机器学习更容易捕获基因型之间、表型与环境之间的复杂关系.因此,机器学习在动物基因组选择中具有一定的优势.根据训练期间接受的监督数量和监督类型,机器学习可分为监督学习、无监督学习、半监督学习和强化学习等.它们的主要区别为输入的数据是否带有标签.目前在动物基因组选择中应用的机器学习方法均为监督学习.监督学习可以处理分类和回归问题,需要向算法提供有标签的数据和所需的输出.近年来机器学习在动物基因组选择中的应用不断增多,特别是在奶牛和肉牛中发展较快.本文将机器学习算法划分为单个算法、集成算法和深度学习 3 类,综述其在动物基因组选择中的研究进展.单个算法中最常用的是KRR和SVR,两者都是通过核技巧来学习非线性函数,在原始空间中将数据映射到更高维的核空间.目前常用的核函数有线性核、余弦核、高斯核和多项式核等.深度学习又称为深度神经网络,由连接神经元的多个层组成.集成学习算法则是指将不同的学习器融合在一起进而得到一个较强的监督模型.近十年来,有关机器学习和深度学习的相关文献呈现了指数型的增长,在基因组选择方面的应用也在逐渐增多.尽管机器学习在某些方面存在明显的优势,但其在估计动物复杂性状基因组育种值时仍面临诸多挑战.部分模型的可解释性低,不利于数据、参数和特征的调整.数据的异质性、稀疏性和异常值也会造成机器学习的数据噪声.还有过拟合、大标记小样本和调参等问题.因此,在训练模型时需要谨慎处理每一个步骤.文章介绍了基因组选择传统方法及其面临的问题、机器学习的概念和分类,探讨了机器学习在动物基因组选择中的研究进展及目前存在的挑战,并给出了一个案例和一些应用的建议,以期为机器学习在动物基因组选择当中的应用提供一定参考.

分类号:

  • 相关文献

[1]机器学习在植物病害识别研究中的应用. 王聃,柴秀娟. 2019

[2]基于无人机遥感的盛花期薇甘菊爆发点识别与监测. 孙中宇,荆文龙,乔曦,杨龙. 2019

[3]基于词向量的检索扩展方法与农业领域实证. 吴蕾,梁晓贺,乌吉斯古楞,王瑞. 2019

[4]基于深度学习的作物基因组学和遗传改良. 辛志奇,赵航,汪海,路铁刚. 2021

[5]基于面向对象与深度学习的榆树疏林识别方法研究. 陈昂,杨秀春,徐斌,金云翔,张文博,郭剑,邢晓语,杨东. 2020

[6]论现代动物育种新技术与我国主要畜禽育种目标的结合应用. 魏伍川,许尚忠,李俊雅. 2004

[7]国内外抗病育种技术研究进展. 李林召,张龙超. 2009

[8]现代畜禽育种新技术及发展趋势. 魏伍川,许尚忠. 2001

[9]两个黄鸡品种Ghrelin基因的PCR-SSCP分析. 王丽云,王金玉,陈宽维,于佳慧,杨燕,张跟喜. 2007

[10]代谢组学在动物育种中的应用现状与前景展望. 李文通,严善英,吴添文. 2022

[11]燕麦分子育种研究进展. 吴斌,郑殿升,严威凯,申状状,晏林,张宗文. 2019

[12]基因组选择在羊育种中的应用研究进展. 张统雨,魏霞,张勤,杜立新,王立贤,赵福平. 2018

[13]西门塔尔牛饱和脂肪酸含量的低密度芯片基因组预测. 齐欣,张静静,樊惠中,李娟,胡鑫,刘飞,朱波,高雪,陈燕. 2016

[14]畜禽基因组选择中贝叶斯方法及其参数优化策略. 朱波,王延晖,牛红,陈燕,张路培,高会江,高雪,李俊雅,孙少华. 2014

[15]新西兰苹果品种及砧木育种成就与对中国的启示. 张恒涛,BUSVincent G·M·,WHITEAllan G·,阎振立,过国南,张瑞萍,刘珍珍,YAO Jia-long,CHAGNé David. 2016

[16]中国肉牛种业整体发展现状与趋势. 高雪. 2021

[17]肉鸡种业技术发展趋势. 赵桂苹. 2021

[18]新西兰苹果品种及苹果砧木育种成就与启示. 张恒涛,BUSVincentG.M.,WHITEAllan,阎振立,过国南,张瑞萍,刘珍珍,YAOJia-long,CHAGNéDavid. 2016

[19]快速型黄羽肉鸡饲料利用效率性状的基因组选择研究. 李森,杜永旺,文杰,黄超,陈智武,赵桂苹,郑麦青. 2021

[20]基于GBLUP等模型对梅花鹿(Cervus Nippon)生长相关性状基因组选择的预测准确性比较. 李浩东,闵祥玉,周雅,张禾垟,郑军军,刘琳玲,王平,王艳梅,杨福合,王桂武. 2022

作者其他论文 更多>>