研究背景
山茶属茶组(Camellia sect. Thea)是重要的经济植物类群,包含广泛栽培的茶树(如C. sinensis)及其近缘野生种。然而,由于形态特征重叠、地理分布交错以及频繁的种间杂交和基因渗透,茶组的物种分类长期存在争议。传统分类系统基于形态学划分的物种数目差异显著(从12种到32种不等),且部分类群的分类地位(如变种或独立种)未达成共识。尽管叶绿体基因组数据在近年的研究中被用于解析系统发育关系,但其单亲遗传特性可能因杂交事件导致叶绿体捕获,从而模糊物种边界。此外,核基因数据的缺乏限制了综合分析的深度。此研究首次整合全基因组测序数据,通过叶绿体基因组、单拷贝核基因(SCNs)和低覆盖度基因组Skmer分析,全面评估茶组物种的界定,旨在揭示杂交和进化历史对物种分化的影响,并为茶树遗传资源保护和育种提供科学依据。
研究结果
多维度数据揭示物种界定的准确性
该研究对茶组12个物种(除C. sealyama外)的98个样本进行全基因组测序,构建了759个单拷贝核基因矩阵、98个叶绿体基因组以及基于低覆盖度基因组数据的Skmer距离树。结果显示,结合核基因与叶绿体数据可显著提升物种界定能力。其中,核基因数据成功界定了C. assamica(原C. sinensis变种)和C. remotiserrata(原C. tachangensis变种)的独立物种地位,而叶绿体数据则单独支持C. fangchengensis和C. gymnogyna的物种单系性。研究证实,仅依赖单一数据源(如叶绿体)可能因杂交事件导致误判,而多维度基因组数据能够更全面地反映物种进化历史。
叶绿体与核基因的冲突揭示杂交与叶绿体捕获
核基因与叶绿体系统发育树存在显著冲突。例如,核基因显示C. grandibracteata与C. sinensis var. assamica聚为一支,而叶绿体数据中其与C. taliensis关系更近。这种冲突被归因于历史上广泛的杂交和叶绿体捕获事件。研究还发现,基因组标注为C. sinensis的古老茶树“DASZ”实际为C. taliensis与栽培茶树的杂交后代,其叶绿体来源于C. taliensis,核基因则与栽培种混杂。类似现象在C. crassicolumna和C. kwangsiensis中也有体现,表明茶组物种边界存在高度渗透性。
栽培品种的复杂遗传背景与分类建议
对主要栽培变种C. sinensis var. sinensis和C. sinensis var. assamica的分析显示,两者在核基因树中形成独立分支,支持将其提升为独立物种(C. sinensis和C. assamica)。然而,传统分类中的C. sinensis var. pubilimba和C. sinensis var. lasiocalyx在系统发育中未形成单系群,推测为人工选育导致的形态变异,建议归并为C. sinensis的同物异名。此外,分布于东南亚的C. sinensis var. lasiocalyx(柬埔寨茶)显示出与多个野生种的基因渗透,暗示其可能为杂交起源。
网状进化与物种形成机制
通过基因树冲突分析和邻接网络构建,研究揭示了茶组物种间复杂的网状进化关系。例如,C. taliensis与C. sinensis var. assamica存在多次基因交流,而C. grandibracteata被推测为C. taliensis与C. assamica的同倍体杂交种。这些发现表明,茶组的快速辐射分化伴随频繁的杂交事件,导致传统形态分类与分子数据的不一致。研究提出,茶组的物种形成可能遵循“杂交-分化-再杂交”的动态模式,而非严格的二分式系统发育。
基因组DNA条形码的应用前景
此研究验证了基因组Skmer分析和SCNs作为新型DNA条形码的有效性。Skmer基于低覆盖度数据(2倍覆盖度)即可准确估算遗传距离,而SCNs通过高覆盖度测序(15倍以上)能解析深度分歧节点。两者结合可克服单一数据源的局限性,尤其适用于杂交频繁的类群。研究建议将茶组物种数修订为14种,包括新确认的C. formosensis和提升地位的C. assamica与C. remotiserrata,为全球茶树遗传资源的保护和利用提供了分子分类框架。
如何获取原文
法二: