基因组作图以提高油棕榈(Elaeis guineensis Jacq.)的高效标记辅助选择和育种
-
+
御姐音
大叔音
萝莉音
型男音
摘要:油棕 ( Elaeis guineensis )Jacq.) 是经济上重要的棕榈树种中的主要栽培作物之一。它的种植主要是为了它的食用油。对于像油棕这样的多年生作物,使用标记辅助选择 (MAS) 技术有助于缩短育种周期并提高经济产品。遗传和物理图谱对于测序实验很重要,因为它们显示了基因的确切位置和染色体 DNA 中的其他独特特征。本综述侧重于基因组作图在油棕育种中的作用。它评估了基因组作图在油棕育种中的作用,并讨论了影响这种作图的主要因素。生成由几个因素控制的高密度地图,例如,标记类型、标记密度、绘制人口的数量和使用的软件是处理的主要问题。一般的结论是,基因组作图是构建遗传连锁图谱的关键。它有助于检测 QTL 和识别控制油棕数量性状的基因。从长远来看,使用具有大量标记、大量作图种群和最新软件的高密度分子标记是油棕基因组作图所必需的。
关键词
.基因 组 作图,作物 改良,标记 辅助 选择,油棕,生物 技术
一、简介
油棕 ( Elaeis guineensis Jacq., Arecaceae) 起源于西非 [ 1 ] [ 2 ]。它是一种二倍体(2n = 2x = 32),多年生单子叶植物,是世界上产量最高的产油作物。它主要种植在世界上潮湿的热带地区 [ 3 ] [ 4 ]。它是自然异花授粉、雌雄同体和同种异体的。油棕的经济寿命约为 30 年 [ 5 ] [ 6 ]。
根据美国农业部 (USDA) [ 7 ],截至 2020/2021 年,世界植物油总产量为 72,769 吨,以大豆油(362.64 吨)领先,棕榈油(75.19 吨)和菜籽油紧随其后。油(69.17 公吨)和葵花籽(49.66 公吨)。油棕每年平均每公顷生产 4 公吨油 [ 8 ] [ 9 ];这大约是大豆的 10 倍。棕榈油分为两大应用:食品工业(占市场的 80% 以上),其余用于化学工业,用于配制油漆、油墨、树脂、清漆、增塑剂、生物柴油生产等。 [ 3 ] [ 10 ]。
尽管油棕具有广泛的适应性和重要性,但由于一些生物和非生物限制,油棕生产和生产力通常远未发挥其潜力。气候变化、土地和劳动力短缺是阻碍全球棕榈油产量和质量的主要因素 [ 11 ]。此外,由于作物的多年生特性限制了棕榈油产量和质量的提高速度,油棕的育种变得困难。同样,Herrero等 人。[ 12]报道油棕的育种可以通过使用常规方法进行,这需要更多的空间和时间来选择有前途的杂交种,主要是在增加亲本生物多样性时。为了缓解这一问题并提高油棕产量和质量,育种者需要实施油棕育种的分子技术。
在标记辅助选择 (MAS) 中,使用具有数量性状基因座 (QTL) 的分子标记有助于表型筛选,以解决传统育种方法的局限性。MAS [ 13 ]提高了选择的准确性和效率。该方法主要针对传统育种方法难以达到的低至中等遗传力性状取得显着效果。在大多数情况下,MAS 育种需要了解基因组内目标性状的 QTL 分布。在包括油棕在内的许多作物物种中,MAS 对几种农艺性状的遗传改良起到了重要作用 [ 13 ]。在油棕中,自 1990 年代以来一直在讨论使用 MAS 研究 [ 14]。在全基因组测序研究中,连锁图谱、分子标记和 QTL 图谱对于 MAS 至关重要。在几个作物物种中,连锁图谱、大量 DNA 标记和主要性状 QTL 的鉴定已被开发 [ 15 ]。
遗传连锁图根据减数分裂期间的重组模式表达基因座实际遗传给后代的方式 [ 16 ]。在油棕中,基于MAS育种研究,已经构建了来自众多油棕科的不同遗传连锁图谱,并取得了显著成果。使用扩增片段长度多态性 (AFLP) [ 17 ] [ 18 ]、限制性片段长度多态性 (RFLP) [ 14 ] [ 18 ]、随机扩增多态性 DNA (RAPD) [ 19 ]、简单序列重复 (SSR) [ 20 ] [ 21 ] [ 22 ] [ 23] 和单核苷酸多态性 (SNP) [ 12 ] [ 24 ] [ 25 ] [ 26 ] [ 27 ]。尽管如此,对于油棕,大量数量性状位点 (QTL) 作图报告揭示了许多性状的主效应 QTL [ 12 ] [ 15 ] [ 18 ] [ 19 ] [ 20 ] [ 23 ] [ 27 ] [ 28 ] [ 29 ] [ 30 ]。本综述的目的是评估和强调基因组作图在油棕育种中的作用,并讨论影响基因组作图的主要因素。
2. 基因组图的类型
存在几种类型的图谱,例如细胞遗传学图谱、物理图谱和遗传图谱。
2.1。细胞遗传学图谱
这是在显微镜下染色和/或标记时染色体的视觉外观 [ 31 ] [ 32 ]。细胞遗传学图的单位是染色体臂或 centiMcClintocks (cMc) 的一部分(图 1)[ 33 ]。这是通过可视化由亮带和暗带标记的不同区域来获得的,这些带使每个染色体具有独特的外观。该图显示了染色体在条带中的位置,即bandmap(基因组缺失面板)[ 33 ][ 34 ]。霍齐尔和戴维斯 [ 35] 表明,将这种作图方法与其他分子遗传作图方法相结合,可以对不同的哺乳动物基因组进行研究和作图。阿扎古维尔等 人。[ 36 ] 报道说,这种类型的地图是最早用于绘制果蝇和玉米作物的地图。Shah [ 34 ] 表明,细胞遗传学作图方法的应用有利于研究基因组分析、染色体作图和组织培养中体细胞克隆变异的分析。
2.2. 实物图
物理映射反映分子标记之间以碱基对 (bp) 或其倍数表示的实际物理距离(例如,千碱基 (kb),即bp × 1000)(图 1)[ 37 ][ 38 ]。此类图谱越来越多地用于了解基因及其进化的分子见解 [ 36 ]。根据 O'Rourke [ 16 ],物理图谱提供了一种分离和研究基因的有效工具:它们在哪里,它们做什么,以及它们如何相互关联?对这些图的更好理解允许标记在染色体中与着丝粒和端粒的位置,并允许检测一些突变现象,例如插入、缺失和易位。39 ]。由于当前序列技术的进步,人们对这些图谱的兴趣不断增加,这主要是因为在没有良好物理图谱的情况下难以组装大片段基因组 [ 40 ]。Dixit [ 33 ] 指出,与遗传图谱不同,物理图谱的构建需要分子生物学技术;实际上,它将整个基因组表示为一组重叠的克隆
图 1。物理、遗传图谱和染色体中标记位置的图示。
组成基因组的 DNA 片段,这是根据参考图谱(例如遗传图谱)排序的。同样,Deonier [ 38 ] 报道了构建广泛的物理图谱对于研究已测序和未测序的基因组特征的有用性。除了遗传图谱外,这些图谱还用于油棕的基因组研究。例如,Herrero等 人。[ 12 ] 报道说,该图可用于分析感兴趣的性状的数量性状基因座,通常用于作物,特别是油棕育种。
2.3. 遗传图谱
遗传图显示基因的位置和其他相关序列特征,如基因组中的 DNA 标记,基于基因或标记一起遗传的频率 [ 31 ] [ 32 ] [ 37 ]。它显示了以 cM 为单位的映射距离,它分隔了任何两个基因座,以及这些基因座相对于所有其他映射基因座的位置(图 1)[ 41 ]。它是基于同源染色体之间的减数分裂重组构建的[ 36 ]。高分辨率遗传图谱的使用非常重要,因为它们决定了育种和基因组测序之间的关系。同样,奥罗克 [ 16]概述了在植物或动物的遗传和基因组研究中,应用充满多态性标记的高密度遗传图谱是标记辅助选择的关键。相反,Li [ 42 ] 指出,构建高密度和高分辨率的遗传图谱对于通过连锁分析了解基因组和感兴趣基因的结构和功能至关重要。Dixit [ 33 ] 表明,遗传图谱的高分辨率取决于几个因素,例如已评分的植物物种中的交叉数量或人类中的大量后代。他们还表示,使用的分子标记类型也会影响地图的分辨率。
3. 遗传与物理图谱
遗传图和物理图分别展示了染色体上基因和 DNA 标记的排列。表 1列出了它们之间的差异细节。遗传图谱也称为连锁图谱。它根据重组率描述染色体内的基因或基因座[ 36 ]。这种映射概念首先由 Sturtevant [ 43 ] 提出,通过将五个性连锁基因线性放置在果蝇 ( Drosophila melanogaster ) 的 Y 染色体上而建立。它根据重组率提供基因组中基因座之间的近似距离,其确定基于交叉的数量 [ 33 ]。奥罗克 [ 16]表明基因或DNA标记之间的交叉频率与它们之间的染色体距离成正比。例如,基因越接近,交叉频率越少,反之亦然。它允许在基因或 DNA 标记之间建立连锁关联,它是建立物理图谱的基线,从而为基于图谱的基因组分离打开了大门。该图不允许研究基因组中的特定染色体,而是一组多态性遗传标记基因座或基因 [ 36 ]。在这张地图中,两个分子标记之间的遗传距离是根据重组事件的数量计算的,而没有精确的实际物理距离 [ 33 ]。为了解决上述问题,必须进行物理映射。
物理图谱具有一组线性有序的分子标记(DNA 片段),它们围绕整个基因组或特定的感兴趣的基因组区域 [ 31 ] [ 32 ]。Azhaguvel [ 36 ] 将这张地图分为两种类型。第一个是宏观限制图,它提供有关染色体水平 DNA 片段的信息。第二种称为有序克隆图,由克隆 DNA 片段的重叠集合组成,例如酵母和细菌人工染色体 (YAC)。它以碱基对的形式确定染色体上 DNA 标记的实际距离 [ 33]。遗传-物理图谱比率从一个染色体区域到另一个染色体区域显着变化。它主要取决于染色体的性质和该区域的重组频率[ 36 ]。例如,估计油棕的遗传与物理距离比为 68.44 Mb/cM 至 21.37 Mb/cM [ 25 ]。
遗传图谱
实物图
它是基于两个连锁基因之间的交叉百分比计算的图谱距离
连锁基因之间的实际物理距离
这个映射距离变化很大,因为交叉频率在不同的染色体片段中变化,它只是一个预测值
连锁基因的物理距离与基于交叉百分比计算的图谱距离没有直接关系
以地图单位测量的距离或
厘摩根
以碱基对(bp、Kbp、Mbp)为单位测量的距离
线性顺序与实物图相同
线性顺序与遗传图谱中的相同
两个基因之间的相对距离
基因在染色体中的确切位置
表 1。遗传图谱和物理图谱之间的差异。
在过去十年中,对物理遗传图谱的需求稳步增长。从那时起,这两张图被充分用于研究基因克隆和全基因组和特定基因组区域的 DNA 测序 [ 31 ] [ 32 ]。构建用于识别目标基因的遗传图谱和紧密连锁的 DNA 标记用于过滤用于构建物理图谱的大量文库 [ 36 ]。然后,新产生的DNA标记被用来识别克隆进行遗传精细定位。奥罗克 [ 16] 回顾了遗传图谱和物理图谱的相关性,发现物理图谱由有序的 DNA 库片段组成,覆盖整个基因组或染色体;基于分子标记的重组分析构建遗传图谱,主要目标是鉴定克隆基因。物理和遗传图谱整合用于识别具有高重组热点区域和抑制重组的基因组区域 [ 44 ]。Azhaguvel [ 36 ] 指出,这种整合揭示了所有关于基因组序列的信息。这为开发 DNA 标记、鉴定基因、数量性状基因座 (QTL)、表达序列标签 (EST)、调控序列和重复元件打开了一扇新的大门。
4. 用于绘制油棕种群的分子标记
如今,分子标记广泛用于各种植物育种计划中,以跟踪基因座和基因组区域 [ 36 ]。使用分子标记可以识别控制作物植物基因组中数量性状的主要基因。为此,遗传作图技术用于检索和定位与特定性状有关的重要基因和基因组信息 [ 31 ] [ 32 ]。使用各种分子标记系统,如 RFLP [ 45 ]、RAPD [ 46 ]、简单序列重复 (SSR) 或微卫星 [ 47 ]、序列标记位点 (STS),已经为多种植物物种建立了几个遗传图谱[ 48 ],AFLP [ 49]、单核苷酸多态性 (SNP) [ 50 ]、序列特征扩增区域 (SCAR) [ 51 ] 和切割的扩增多态性序列 (CAPS) [ 52 ]。根据基因作图的不同目的,每种分子标记都有其优点和缺点(表2)。然而,RFLP、RAPD、SSR 和 AFLP 标记最常用于植物物种的遗传作图 [ 16 ]。
在油棕中,不同的分子标记类型已被用于构建遗传连锁图谱(表 3)。它们包括 RFLP [ 14 ] [ 18 ] [ 29 ] [ 30 ]、RAPD [ 19 ]、AFLP [ 18 ] [ 19 ] [ 22 ] [ 23 ] [ 30 ]、SSR [ 3 ] [ 15 ] [ 18 ] [ 19 ] [ 20 ] [ 21 ] [ 23 ] [ 30 ] [ 53 ] [ 54 ] [ 55 ] 和 SNP [12 ] [ 15 ] [ 24 ] [ 25 ] [ 26 ] [ 27 ] [ 28 ] [ 53 ] [ 54 ] [ 55 ]。在本文中,我们首次回顾了油棕基因组图谱的主要结果,如表 3所示。该表概述了油棕基因组图谱的主要研究及其不同特征。
5. 油棕基因组图谱
遗传连锁图反映了基于减数分裂期间重组模式的基因座从父母到其后代的实际遗传。在油棕中
标记名称
基于PCR
多态性(丰度)
支配地位
再现性
自动化
运行成本
RFLP
不
低/中
共显性
高的
低的
高的
RAPD
是的
中等偏上
主导的
低的
中等的
低的
疤痕/帽子
是的
高的
共显性
高的
中等的
中等的
AFLP
是的
高的
主导的
高的
中等偏上
中等的
固态继电器
是的
高的
共显性
高的
中等偏上
低的
ISSR
是的
高的
主导的
高的
中等偏上
低的
STS
是的
高的
共性/显性
高的
中等偏上
低的
SRAP/EST
是的
中等的
共显性
高的
中等的
低的
IRAP/重映射
是的
高的
共显性
高的
中等偏上
低的
单核苷酸多态性
是的
极高
共性/显性
高的
高的
低的
表 2。评估最广泛使用的分子标记系统。
不。
年
标记类型
标记数
地图深度 (cM)
LG 数量
用于构建 LG 的软件
参考
1
1997
RFLP
97
860
24
地图制作者 2.0
[14]
2
2000
RAPD
48
399.7 - 449.3
12 - 15
地图制作者 2.0
[19]
3
2001年
RFLP
153
852
22
加入地图 2.0
[29]
4
2005年
多发性硬化症和 AFLP
255 + 688
1743
16
加入地图版本。3.0
[17]
5
2009
AFLP、RFLP、MS
252
1815
21
连接地图版本。4.0。
[18]
6
2010
固态继电器
251
1479
16
JoinMap v. 3.0
[20]
7
2011
AFLP
331
2274.5
16
MAPRF7
[22]
8
2013
AFLP、RFLP、SSR
148
798.0
23
加入地图 4.0
[30]
9
2013
固态继电器
362
1845.0
16
加入地图 v.4.0
[3]
10
2014
SSR、基因、SNP
190
1233.0
31
加入地图 v.4.0
[54]
11
2014
SSR、AFLP
423
1931年
16
加入地图 v 3.0
[23]
12
2014
SSR,单核苷酸多态性
1331
1867年
16
加入地图 v 4.1
[55]
13
2015
SSR,单核苷酸多态性
480
1565.6
16
加入地图 v 3.0
[15]
14
2015
单核苷酸多态性
1085
1429.6
16
加入地图 v 3.0
[27]
15
2015
固态继电器
281
1935.0
16
克里图
[21]
16
2018
单核苷酸多态性、SSR
10,023
2398.2
16
Lep-MAP v 2
[53]
17
2018
SNP、DArTseq
1399 - 1466
1873.7 - 1720.6
16
加入地图 v 4.1
[24]
18
2018
单核苷酸多态性
2413
1161.89
16
加入地图 v 4.1
[28]
19
2019
单核苷酸多态性
27,890
1151.7
16
Lep-MAP3
[25]
20
2020
SPET
3501
1,370
16
Lep-MAP3
[12]
21
2020
单核苷酸多态性
11,421
1151.70 - 1268.26
17 - 24
Lep-MAP3
[26]
22.
2022
单核苷酸多态性
-
-
16
Lep-MAP3
Essubalew等人。2022(审查中)
表 3。油棕中构建的连锁图总结。
在过去的 20 年中,已经构建了多个连锁图谱并用于检测不同的营养、产量和产量成分以及棕榈油品质性状 [ 25 ]。同样,RFLP、AFLP、SSR 和 SNP 等标记被广泛用于构建油棕的遗传连锁图谱。最近,限制性相关 DNA 标记 (RAD)、双酶切 RAD (ddRAD)、单引物富集技术 (SPET) 已被公认为产生大量具有显着图谱的 SNP [ 12 ]。
在油棕中,第一个基于基因组库中的 RFLP 标记构建的遗传连锁图谱于 1997 年发表。这张考虑了 97 个 RFLP 标记(84 个探针)的图谱绘制了一个自交的guineensis cross ( tenera x tenera ),总遗传距离为 860 cM,并使用 4 的 LOD 分数和 0.4 的重组分数产生总共 24 个连锁基团。根据研究 [ 14 ],超过 95% 的标记可以与至少一个其他标记相关联,这表明良好的基因组覆盖有助于在 9.8cM 的距离上检测壳厚基因 ( Sh ) 的位置。第 10 组。根据他们的结果,Mayes等 人。[ 14] 得出的结论是,该图有助于绘制负责控制主要商业油棕性状的基因。同样,Rance [ 29 ] 还使用 153 个 RFLP 标记构建了 84 个自交 F2 油棕种群的遗传连锁图,用于检测影响壳厚度的主要基因。结果证实,QTL作图有助于检测影响大小种群中大部分总表型变异的基因。
此外,RAPD 是另一种用于构建油棕遗传连锁图谱的标记。Moretzsohn [ 19 ] 开发了第一个 RAPD 标记图谱,以开发与 RAPD 测定相结合的伪测试交叉图谱策略。这是为了构建 F 1 tenera ( sh + sh -) x pisifera ( sh - sh -) 后代群体的不同果实类型(壳厚度)的遗传连锁图谱。该图谱共使用了 48 个 RAPD 标记和 308 个 F1 子代群体,在 LOD 分数为 5.0 的情况下,并考虑了预计的Elaeis ,共产生了 12 个图谱距离范围为 399.7 - 449.3 cM 的连锁群建立了总图谱距离和基因组大小、物理和遗传距离关系(分别为tenera和pisifera 1.06 Mbp/1 cM 和 1.09 Mbp/1 cM )。他们还通过两张图获得了有限的基因组覆盖率(tenera为 28.0%, pisifera为25.6% )。该结果描述了用于更接近sh + 基因座的遗传连锁作图标记的 RAPD 标记的重要性,有助于检测负责壳厚度的基因,并为油棕壳厚度的 MAS 向前迈进了一步。
AFLP 是另一个用于在油棕中构建遗传连锁图谱的显着标记。Billotte等 人开发了第一个基于 AFLP 的油棕遗传图谱。[ 17 ] 涉及薄壳的E. guineensis ( tenera ) 棕榈和厚壳的E. guineensis ( dura ) 棕榈之间的杂交,其主要目标是映射以检测负责壳的基因的存在和缺失。油棕果实。为此,他们总共使用了 944 个(255 个 SSR,688 个 AFLP,等位基因Sh_) 标记,图谱长度为 1743 cM,平均每 1.8 cM 有一个标记,LOD 得分为 3.0,共产生 16 个连锁群。连锁基团的长度在 59 cM 和 192 cM 之间变化。该图是油棕第一个具有16个独立连锁群的连锁图谱,对应于油棕中16号单倍体染色体数。他们在高密度连锁图谱上的发现可以推动对E. guineensis的 QTL 和物理作图的研究物种。此外,他们还报告说,与 AFLP 相比,SSR 标记具有更好的映射分辨率。这是因为像 SSR 这样的高密度标记比像 AFLP 这样的低密度标记具有更高的重组率。从结果中,他们观察到 SSRs 标记在基因组中的分布比 AFLPs 标记好。相反,Singh [ 18 ] 报道了一种涉及哥伦比亚油菜( UP1026 ) 和尼日利亚E. guinneensis的种间杂交。 (T128) 和来自该种间杂交的总共 118 棵棕榈树用于检测控制油质量的数量性状基因座 (QTL)(根据碘值和脂肪酸组成测量)。为了分析图谱,他们使用了总共 252 个标记(199 个 AFLP、38 个 RFLP 和 15 个 SSR),图谱长度为 1815 cM,相邻标记之间的平均间隔为 7 cM,总共产生了 21 个连锁群。每个连锁群平均有 12 个标记。再次,几乎在所有图谱中,除了连锁群 17 有 30cM 外,几乎所有图谱中的标记都以 25cM 的间隔分布,这表明图谱在标记分布方面相对均匀;这对于标记 MAS 的经济利益特征很有用。在该图中,各个连锁群的长度从 26.1 cM 到 168 cM 不等,平均为 94 cM。
同样,Seng [ 22 ] 的一份报告使用 AFLP 标记在高产硬脑膜(ARK86D) x pisifera (ML161P) 之间进行了总共 120 个杂交杂交。为了构建地图,他们使用了总共 479 个标记位点和 168 个锚点,地图长度为 2247.5 cM,平均地图密度为 4.7 cM,LOD 得分为 3.0。他们共构建了16个连锁群,每个连锁群有15-57个标记,每个连锁群平均有29个标记,长度从77.5 cM到223.7 cM,平均137 cM。与此一致,标记在 16 个连锁群中分布良好。根据他们的发现,Seng [ 22] 得出的结论是,在油棕中应用基因组图谱有助于针对密切相关的种群进行验证,并有助于识别与产量相关的 QTL。同样,Ting等 人。[ 30 ] 和 Ukoskit [ 23 ] 也使用 AFLP 标记构建油棕遗传连锁图谱。
简单序列重复 (SSR) 标记是区分油棕基因组中的多态性和作图的共显性分子标记。2005 年首次使用 SSR 标记构建油棕地图。为了构建地图,Billotte等 人。[ 17 ] 共使用了 255 个 SSR 标记,图谱长度为 1743 cM,平均标记密度为 7 cM。使用 3.0 的 LOD 分数并产生总共 16 个连锁群。根据他们的发现结果,使用像 SSR 这样的高密度制造商绘制油棕图为油棕 QTL 绘制和其他 MAS 研究提供了全面的信息。与此一致,比洛特 [ 20] 使用 SSR 标记进行 QTL 检测,其中包含两个油棕种群之间杂交的多亲本连锁图谱。他们在非洲 (LM2T) x 熟食店 (DA10D) 之间的受控杂交中总共使用了 150 只手掌。为了构建地图,总共使用了 251 个 SSR 标记。根据他们的发现,LM2T x DA10D 的 SSR 图有 16 个连锁群 (LG) 和 253 个位点,图谱长度为 1479 cM,平均标记密度为 6 cM。在 LG4 中发现了大作图基因组,其跨度为 134 cM,平均范围为 61-250 cM,大约 47% 的作图基因组具有三个或四个等位基因,基因组上的平均密度为 32 cM。总之,共有 156 个 SSR(45%)和Sh对基因座进行了定位,杂交油棕种群的定位有助于确定控制果壳的主要基因 ( Sh ) 的 QTL。出于同样的原因,蒙托亚等 人。[ 3 ] 共使用了 347 个分离 SSR,14 个基因 SNP,以及Sh位点建立连锁图谱并检测棕榈油脂肪酸组成的QTL。他们总共产生了 16 个 LG,相对图谱长度为 1485 cM,在 LOD 7.5 处平均标记密度为 4 cM,最大重组阈值为 0.3。根据它们在连锁群上的位置,LGs 的长度范围为 49.1 至 175.9 cM,平均为 92.8 cM。在QTLs方面,共获得了19个与棕榈油脂肪酸组成相关的QTL,该图谱有助于识别油棕基因组中与油酸C18:1相关的关键基因。总之,73% (253) 的映射 SSR 仅与杂交亲本 SA65T 分离,2% (7) 仅与 PO3228D 分离,27% (93) 是与双亲分离的常见 SSR。再次,大量映射的 SSR 位点具有准确的相对线性顺序,Elaeis育种材料。后来,科查德 [ 21] 使用 281 个 SSR 标记和总共 271 个基因分型的油棕种群构建了连锁图谱。他们共产生了 16 个连锁群,涵盖 A 组(2078 cM)和 B 组(1845 cM),平均每 9 和 7 cM 一个标记密度。一般来说,综合图谱总长度为1935 cM,共有281个标记,平均每7.4 cM一个标记的密度。此外,除了一些零星的标记外,物理图谱和遗传图谱之间的标记顺序一致。根据他们的发现,他们得出的结论是,该输出可能有助于在当前育种计划中使用第一代交叉世代进行有效的基于谱系的数量性状基因座 (QTL) 作图。使用 SSR 绘制油棕基因组图谱也进行了类似的研究。例如,30 ],非洲油棕产量QTL作图[ 54 ],性别比及相关性状的连锁图谱和QTL分析[ 23 ],两个独立油棕杂交种的遗传图谱构建[ 55 ],主要的连锁作图和鉴定茎高QTL基因[ 15 ]都为油棕基因组作图和分子育种研究带来了重要信息。
目前,油棕单核苷酸多态性 (SNPs) 是用于研究遗传多样性和种群结构、构建高密度遗传图谱以及为全基因组关联提供基因型的最受青睐和高密度的标记物 [ 56 ],和基因组选择研究 [ 5 ]。Jeennor 和 Volkaert 构建了第一个基于 SNP 标记的油棕基因组图谱 [ 54] 使用总共 190 个分离基因座(89 个 SSR、90 个基因和 11 个基于非基因的 SNP 标记),通过应用阈值 LOD 为 3 和重组分数为 0.45,将其映射到 31 个连锁群中。他们制作了总长度为 1233 cM 的地图,其中包含 2 到 20 个标记,长度在 1.5 到 103.5 cM 之间,标记之间的平均距离为 6.5 cM。这一发现有助于确定参与脂质生物合成的经过验证的候选基因,并为各种经济产量性状绘制接近重要的 QTL。这表明 MAS 标记可用于改善油棕育种计划所需的性状选择。
此外,Pootakham [ 27 ] 使用 GBS 方法在非洲油棕中开发了 SNP 标记,共 1085 个 SNP 构建连锁图谱。生成的地图跨越 1429.6 厘米,平均每 1.26 厘米有一个标记。他们还在 LG 10、14 和 15 上检测到三个影响树干高度的 QTL 基因,而在 LG 3 上发现了一个与果串重量相关的 QTL。他们得出结论,通过使用基因分型测序(GBS ) 方法有助于产生高密度图谱,并可以增强对基因组结构的了解,这对于绘制 MAS 的其他经济上重要的基因很有价值。白等 人。[ 28] 还使用来自 Deli Dura 和 Avros Pisifera 杂交的 145 个油棕育种种群,使用高密度 GBS 标记数据构建和检测与叶面积相关的 QTL。他们使用总共2413个SNP构建了遗传连锁图谱,共产生了16个连锁群,总长度为1161.89 cM,平均标记间距为0.48 cM。根据他们的结果,在 Chr 3 和 9 上检测到两个潜在的叶面积 QTL,位于 Chr 9 上的 QTL 区域的基因 ARC5 是最可能负责油棕叶片生长的候选基因。他们得出结论,使用高质量和基于 SNP 的图谱为油棕农艺性状和 MAS 产量提高的精细图谱 QTL 提供了基础。
此外,Gan [ 24 ] 使用两个密切相关的油棕种群报告了第一个基于 DArT 的遗传连锁图谱。为此,他们总共使用了 1399 个 DArT 和 1466 个 SNP 标记。他们共产生了 16 个主要的独立连锁群,图谱长度分别为 1873.7 和 1720.6 cM,平均标记密度分别为 1.34 和 1.17 cM。综合图谱长 1803.1 cM,有 2066 个标记,平均标记密度为 0.87 cM。综上所述,使用高密度标记 DArTseq 标记有助于生成油棕高密度遗传图谱,图谱的整合也有助于研究重要产量性状的 QTL 分析和其他 MAS 研究。同理,Ong [ 25] 还报道了油棕中基于连锁的基因组组装。为了构建图谱,他们总共使用了 27,890 个 SNP 标记,并生成了总共 16 个连锁群,图谱总长度为 1151.7 cM,平均作图间隔为 0.04 cM。这种作图有助于研究糖和脂质生物合成途径中的 QTL。它还有助于提高对商业油棕当前物理基因组的了解。
最近,单引物富集技术 (SPET) 标记被用于从两个油棕 ( Elaeis guineensis ) 基因型的受控杂交中构建高密度遗传连锁图谱[ 12 ]。为了构建地图,他们总共使用了 3501 个 SPET 标记,总长度为 1370 cM,每个 cM 有 1.74 个标记(0.57 cM/标记)。这导致共有 16 个连锁群,共有 1054 个基因座。从他们的工作中,他们得出结论,这些具有成本效益的 SPET 标记的应用适用于油棕的连锁图谱构建,也可能适用于其他物种。
6. 限制油棕基因组图谱的因素
在过去的二十年里,不同的学者已经报道了油棕基因组图谱领域的大量发现(表 3)。这些使用标记辅助选择策略显着提高了关于油棕遗传改良的知识。然而,油棕基因组图谱的成功很大程度上取决于几个因素。例如,Mayes等 人。[ 14] 报道称,作图种群的选择是油棕基因组作图的主要决定因素之一,指出要选择它们,需要考虑几个标准,例如交叉等位基因评分和连锁分析的简单性、育种材料中的等位基因,以及表型数据的可用性。亚洲和非洲类型的油棕遗传材料之间的差异非常明显。同样,影响基因组作图的另一个因素是用于作图的遗传标记类型。在这方面,一份报告(表 3)清楚地表明,标记多态性会导致遗传连锁群的结果发生变化。例如,Mayes等 人的第一个 RFLP 标记。[ 14] 共生产了 24 个 LG,而 Billotte等 人的第一个 SSR 标记。[ 17 ] 生产了 16 个 LG。最近,使用 SNP 等高密度标记为油棕的遗传作图带来了更多亮点。除了标记的类型,使用的标记密度也带来了油棕基因组图谱的变化。例如,Mayes等 人。[ 14 ] 总共使用了 97 个 RFLP 标记,而 Rance [ 29 ] 总共使用了 153 个 RFLP 标记。此外,总共 49 个额外的标记位点导致图谱分辨率从 24 个连锁群 [ 14 ] 提高到 22 个连锁群 [ 29] 不仅地图分辨率不同,而且地图总长度也不同;随着标记数量从 97 个增加到 153 个,图谱长度分别从 860 cM 减少到 852 cM。相反,Billotte等 人。[ 17 ] 使用了 255 个 SSR 和 688 个 AFLP 标记的组合,基于此并且由于使用了高密度标记 (AFLP);相对于基于 SSR 的地图,该标记覆盖了 23% 的填充间隙。同样,与 Billotte等 人的结果相比。[ 17 ]即255 个 SSR 与其他低密度标记相结合,导致总长度为 1743 cM,平均标记密度为 7 cM,Billotte [ 20] 最近使用了独立的高密度标记,即251 SSR,得到的总图谱长度为 1479 cM,平均标记密度为 6 cM。变化很明显,在后来,他们使用了一个单一的高密度映射标记。
此外,种群样本量是导致油棕基因组图谱变化的另一个因素。Singh [ 18 ] 报告说,即使他们使用了大量的标记,这也不会产生精细的地图。根据他们的结论,该结果是由于使用了 F1 后代的小样本。同样,Billotte [ 20 ] 报告说,由于种群大小的变化,图谱检测能力存在差异,并且根据他们的报告,多亲系统的大种群规模比双亲系统为 QTL 提供更大的检测能力和小人口。同样,Ukoskit [ 23] 还报告说,地图长度的差异是由于人口规模的变化。一般而言,具有大种群规模(谱系种群)的大量标记会导致更好的基因组作图 [ 57 ]。
最后但并非最不重要的一点是,基因组作图也受到用于作图的软件的高度控制。在油棕中,各种软件程序已被用于构建遗传连锁图谱(表 3),如 MAPMAKER 2.0 [ 58 ]、Join Map ver 2.0 [ 59 ]、CRI-MAP [ 58 ]、Join Map ver 3.0 [ 60 ] ],加入地图4.0 [ 61 ]、Lep-MAP 2 [ 62 ] 和 LepMAP 3 [ 57 ]]。由于油棕的多年生特性,其异交性和较长的世代时间导致难以获得足够的遗传材料或作图种群,为了克服这些限制,通过整合多个共享共同标记的不相关遗传图谱获得共识遗传图谱. 这种共识图可以通过不同的连锁图软件构建(表3)。如今,Lep-MAP3(LM3)是一种新颖的联动地图构建软件套件。它可以处理可能来自多个家庭的数百万个标记和数千个个体 [ 57 ]。
7. 结论
在油棕等多年生作物中,通过常规育种方法获得新品种或改良品种是困难的,因为它既费时又费钱,这都与长的世代周期、大的植株大小和长10-15年的评估期有关。在这种作物中应用标记辅助育种技术有助于最大限度地减少上述限制。遗传连锁图谱的构建在油棕遗传分析和分子育种计划中发挥着重要作用。这已被用于使用不同性状(如产量及其成分、油质和非生物胁迫)来识别遗传基因座,从而实现更好的遗传改良和更具成本效益的育种。如今,高通量分子标记测序技术通过提供增加的序列库来构建遗传图谱和组装基因组序列,有助于将遗传图谱和物理图谱提高到一个新的水平。在过去的二十年中,大多数研究结果表明,基因组图谱有助于识别控制油棕产量和质量等数量性状的主要基因。此外,关于这种作物的文献表明,由于多种因素,基因组图谱存在差异;例如,标记类型、标记密度、映射种群的大小和使用的软件。尽管有利有弊,但这种作物的基因组图谱起着至关重要的作用,为了在未来获得更明显的图谱,油棕基因组图谱应侧重于使用高密度分子标记类型,
作者的贡献
Essubalew Getachew SEYUM:提出了一个想法并撰写了手稿,而所有其他人都通过评论、建议和重新安排手稿的设置来参与其中。
致谢
作者感谢欧盟内部非洲学术流动计划的 GENES 计划以获得财政支持(EU-GENES:20172552/001-001)。
利益冲突
作者声明与本文的发表没有利益冲突。
参考
[ 1 ] Cros, D.、Denis, M.、Bouvet, JM 和 Sánchez, L. (2015) 杂交性状中无优势杂种优势的长期基因组选择:油棕丛生的案例研究。BMC 基因组学,16,第 651 条。
[ 2 ] Hartley, CWS (1988) 油棕 (Elaeis guineensis Jacq.)。纽约朗文科技公司。
[ 3 ] Montoya, C., Lopes, R., Flori, A., Cros, D., Cuellar, T., Summo, M., Espeout, S., Rivallan, R., Risterucci, AM, Bittencourt, D., Zambrano , JR, Alarcón, GWH, Villeneuve, P., Pina, M., Nouy, B., Amblard, P., Ritter, E., Leroy, T. 和 Billotte, N. (2013) 数量性状位点 (QTL)油棕 (HBK) Cortés 和油棕 (Elaeis guineensis Jacq.) 种间假回交中棕榈油脂肪酸组成的分析。树遗传学和基因组,9,1207-1225。
[ 4 ] Zhang, A., Wang, H., Beyene, Y., Semagn, K., Liu, Y., Cao, S., Cui, Z., Ruan, Y., Burgueno, J., San Vicente, F. , Olsen, M., Prasanna, BM, Crossa, J., Yu, H. 和 Zhang, X. (2017) 性状遗传力、训练种群规模和标记密度对 22 种双亲热带玉米基因组预测准确度估计的影响人口。植物科学前沿,8,第 1916 号文章
。
[ 5 ] Cros, D.、Tchounke, B. 和 Nkague-Nkamba, L.(2018 年)在多个育种周期中训练基因组选择模型增加了油棕在硅研究中的遗传增益。分子育种,38,第 89 条。
[ 6 ] Wong, CK 和 Bernardo, R. (2008) 油棕中的全基因组选择:在小种群中增加单位时间和成本的选择增益。理论和应用遗传学,116, 815-824。
[ 7 ] 美国农业部(2020)。
https://www.fas.usda.gov/data/oilseeds-world-markets-and-trade
[ 8 ] Babu, BK 和 Mathur, RK (2016) 油棕 (Elaeis guineensis) 的分子育种:现状和未来展望。进步园艺,48,123-131。
[ 9 ] Corley, RHV 和 Tinker, PB (2016) 油棕。威利-布莱克威尔,霍博肯。
[ 10 ] Soh, AC, Mayes, S. 和 Roberts, JA (2017) 油棕育种:遗传学和基因组学。第 1 版,CRC 出版社,博卡拉顿。