随着深度学习的快速发展和用于训练的数据集的增长,最近在直接从参考基因组序列中预测基因表达水平、3D基因组折叠以及表观遗传特征,如转录因子结合、组蛋白修饰和染色质可及性等取得了成功。...这个结果表明,对于任何给定的模型,对于负相关基因的遗传效应的方向的错误预测并不是由于模型在建模这些特定基因或其对应的变异体方面存在困难,而是由于这些类型的模型对变异体的效应进行归因时存在噪声。...重要的是,作者发现,在给定基因的预测与观察到的表达之间,这四个测试模型在相关性的大小上更加一致,而不是在相关性的方向上(图2b),这表明它们在识别引起调控变异体方面比在这些变异体对表达的效应方向上更一致...然而,MPRA缺乏内源基因表达的复杂基因组和染色质环境,而即使采用当前的精细定位方法,也很难在eQTL研究中确定原因变异体,导致与原因变异体在连锁不平衡中的变异体效应大小估计没有生物学意义。...., Shuai, R., Baokar, P., Chung, R., Rastogi, R., Kathail, P., & Ioannidis, N. M. (2023).