血吸虫AraC家族转录调节因子ACP92基因启动子区、基序和CpG岛的分析
-
+
御姐音
大叔音
萝莉音
型男音
摘要:启动子及其调控元件的鉴定是生物信息学中最重要的阶段。要了解基因表达的调控,启动子区域、基序和 CpG 岛的识别和分析是最重要的步骤。启动子的准确预测是正确解释基因表达模式、构建和理解遗传调控系统的基础。因此,本研究的目的是分析血清草本菌AraC家族转录调节因子ACP92基因的启动子区域、转录因子等基序和CpG岛。通过鉴定取自H的 ACP92 基因组序列中的转录起始位点进行分析。NCBI 基因组浏览器的seropedicae组装和 29 个 ACP92 基因序列。因此,确定了转录起始位点 (TSS),结果表明 37.9% 的人有一个以上的 TSS,而只有 62.1% 的人有一个 TSS。在分析中,从思想序列中鉴定出 7 个基序,并且 MV6 揭示了H. seropedicae ACP92 基因中所有 (100%) 的共同启动子基序,该基因作为转录因子的结合位点,共享至少 48.27%。基于一个共同的motif MV6,利用TOMTOM从原核生物DNA数据库中找出相似的motif,其中大部分是fur家族的转录因子。其他是细菌组蛋白样蛋白家族、matp 和 sigma-54 因子家族以及转录因子家族是与 MV6 结合的候选者。H. seropedicae ACP92基因是CpG岛,这意味着基因表达的调节起着重要作用。
关键词
基因 表达,基序,启动子,转录
一、简介
Herbaspirillum seropedicae 是一种存在于根、茎和叶中的细菌,与经济上重要的禾本科植物有关,例如玉米 (Zea mays)、水稻 (Oryza sativa)、高粱 (Sorghum bicolor)、甘蔗 (Saccharum officinarum) ) [ 1 ]。它常见于牧草,如象草和热带水果,如菠萝和香蕉 [ 2 ]。它是一种从几种重要经济植物的根际和组织中分离出来的固氮变形菌[ 3 ]。H. seropedicae 是一类具有良好特征的固氮菌,能够建立内生关联并促进重要谷物和牧草的植物生长 [ 4] . 它也被研究作为细菌进入寄主植物和促进植物生长的模型[ 5 ]。H. seropedicae 的基因组,参与固氮过程及其调控,这些基因可能参与建立与宿主植物的有效相互作用。多项研究表明,H. seropedicae 为相关植物提供固定氮并提高谷物生产力 [ 4 ]。根据 Munson 和 Scott [ 6] . 相应地,在 AraC 家族中,H. seropedicae 的转录调节因子 ACP92 基因也是一种潜在的转录调节因子,通过在转录和翻译后水平上与特定启动子区域结合,参与多种细胞过程、转录控制和基因表达。
启动子是参与蛋白质编码和RNA基因差异转录调控的关键区域[ 7 ]。启动子是包含复杂调控元件的功能区域,用于确定基因的转录起始 [ 8 ]。DNA 结合位点或基序是指由一种或多种 DNA 结合蛋白或蛋白复合物显式结合的短 DNA 序列(通常长 4 至 30 个碱基对,但重组位点长达 200 bp)[ 9 ]。它通常与称为转录因子的特殊蛋白质有关,因此与转录调控有关 [ 10] . 转录因子是 DNA 结合蛋白,与 RNA 聚合酶复合物相互作用以激活或抑制转录因子与特定顺式作用调节元件 (CARE) 上的 DNA 结合,并在基因表达的调节中启动转录,这是最重要的控制之一点[ 11 ]。CpG 岛也被报道为基因组启动子区域的重要调控元件[ 12 ]。CpG 是指通过磷酸键与 DNA 核苷酸序列中的碱基鸟嘌呤 (G) 相连的碱基胞嘧啶 (C) [ 13] . 已证明可用于检测启动子的一个结构特征是所谓的 CpG 岛,即富含 CpG 的区域,由于它们与基因调控密切相关,因此非常重要 [ 14 ]。CpG 岛通过表观遗传变化在基因调控中发挥着重要作用[ 15 ]。最近的研究表明,CpG 甲基化与某些基因的激活有关[ 16 ]。DNA 甲基化已显示通过直接干扰转录激活因子的结合或通过结合蛋白质间接抑制转录起始 [ 17 ]。
原核和真核启动子使用不同的 DNA 序列来调节基因表达 [ 18 ]。Anwar 等人已经使用 CpG 岛和转录因子结合位点 (TFBS) 开发了真核和原核基因组中的启动子。[ 19 ]。Gordon 等人报道的关于在基因上游 250 bp 长区域鉴定启动子的研究始于大肠杆菌[ 20 ],并且还提出在大肠杆菌中鉴定启动子。[ 21 ]。已经提出了许多方法来搜索绑定站点[ 22 ]。解释了主题查找器的大部分子集,其中 MEME 一是发现绑定主题的最重要工具 [ 23] . 神经网络启动子预测(NNPP 2.2 版)是一种广泛使用的在线工具,用于识别真核启动子 [ 24 ]。然而,在原核生物中,神经网络启动子搜索来自 https://www.fruitfly.org/seq_tools/promoter.html,并使用了启动子预测工具集 [ 25] . 启动子区域、转录起始位点和 CpG 岛的分析是基因表达中一些最重要的问题。对 Herbaspirillum seropedicae ACP92 进行识别和分析这些元素并揭示出作为结合位点的共同基序是非常关键的。因此,本研究的目的是分析 AraC 家族转录调节因子 ACP92 基因中的启动子区域、转录因子等基序和 CpG 岛。
2。材料和方法
基因组序列取自 NCBI 基因组浏览器的 H.seropedicae 组装。以 ATG(起始密码子)开始的基因组序列从 H. seropedicae 数据库的 AraC 家族转录调节因子 ACP92 基因中鉴定出来。在开始的序列中识别出包含起始密码子的序列,并在该分析中使用了编码序列。仅发现了29个AraC家族转录调节基因ACP92,左侧AraC家族为假基因,无ATG。将二十九条血清嗜血杆菌 ACP92 基因序列用于分析以确定它们各自的 TSS,从每个基因中切除起始密码子上游的 1 kb 序列。启动子区域定义为每个 TSS 上游的 1 kb 区域。来自 https://www.fruitfly.org/seq_tools/promoter 的神经网络启动子搜索。25 ] 。对于包含多个 TSS 的区域,考虑预测得分的最高值,以便进行更准确的预测。
H. seropedicae 的鉴定,使用 MEME(期望最大化算法)分析 ACP92 启动子序列;通过网络服务器 (http://bioinformatics.ubc.ca/resources) 寻找调节 ACP92 基因表达的常见基序和转录因子。MEME 有许多可选输入来修改其性能。使用了以下可能性:1) 选择每个序列模型出现 0 次或 1 次,2) 基序的最大宽度为 50,以及 3) 基序出现在输入 DNA 序列的两条链上。统计上,输入序列集中的重要基序正在研究 MEME 和 E 值,E 值是在随机序列中找到同样保守模式的概率。MEME 输出是 HTML,并将基序显示为输入序列的局部多对齐。MEME HTML 输出允许转发一个或所有主题以供进一步查询,通过其他基于 Web 的程序 TOMTOM 更好地表征识别的主题。选择了 TOMTOM 网络服务器,在其中搜索各种序列数据库以查找与识别的基序匹配的序列。TOMTOM 表明查询基序与结合基序非常相似 [26 ] 。
为了找到 H. seropedicae ACP92 启动子区域中的 CpG 岛,使用了两种算法。第一个 CLC 搜索,基因组学工作台版本。3.6.5 (http://clcbio.com, CLC bio, Aarhus, Denmark) 用于搜索限制性内切酶 MspI 切割位点(片段大小在 40 和 220 bp 之间),以及第二种算法,Takai 和 Jones 算法(严格) 搜索标准用于 GC 含量 ≥55%、观察到的 CpG/预期 CpG 比率 ≥ 0.65 和长度 ≥ 500 bp [ 27 ]。使用了可在网络链接 http://dbcat.cgm.ntu.edu.tw// 上获得的 CpG 岛搜索程序 (CpGi130)。
三、结果与讨论
3.1。转录起始位点 (TSS) 和启动子区域的确定
识别转录起始位点和启动子区域是了解基因表达调控机制以及与区域内遗传变异相关性的第一步[ 28 ]。因此,本研究首次确定了血清草本植物中每个 29 个转录调节因子 ACP92 基因的转录起始位点。对于包含多于一个TSS的基因的预测更可靠,最高预测分数的TSS被考虑和鉴定。结果表明,发现三个(在 ACP92_RS04670 和 ACP92_RS13185 中)、四个(在 ACP92_RS00045 中)和六个(在 ACP92_RS19695 中)的 TSS 数量最高,而在其余基因中获得的 TSS 数量较少。此外,37.9% 的人有不止一个 TSS,而 62.1% 的人只有一个 TSS(表 1)。
3.2. 常见的基序和转录因子
基于 H. seropedicae 的启动子区域,输入序列集中的重要基序通过网络服务器搜索 MEME 和 E 值,概率
不
基因识别
相应的
启动子区域名称
已识别的 TSS 数量
截止值为 0.8 时的预测分数
距离起点
密码子 (ATG)
1
29390694
亲ACP92_RS00045
4
0.88, 0.91, 0.97, 0.98
-12、-239、-715、-21
2
29392361
亲ACP92_RS00855
1
0.94
-4, 297
3
29390588
亲ACP92_RS01580
1
0.88
−258
4
29392080
亲ACP92_RS04595
1
0.84
55
5
29393722
亲ACP92_RS04620
1
0.90
196
6
29390157
亲ACP92_RS04670
3
0.82, 0.84.0.85
-2671、-2907、2445
7
29390499
ACP92_RS04680
2
0.84, 0.98
-33, -24
8
29391790
亲ACP92_RS04870
1
0.85
−7
9
29390103
亲ACP92_RS05285
2
0.93, 0.97
-232, -73
10
29393242
亲ACP92_RS08330
1
1.0
−27
11
29393201
亲ACP92_RS11865
2
0.86, 0.87
-5, 656, -5, 215
12
29392668
pro-ACP92_RS12020
1
0.84
3, 128
13
29389983
亲ACP92_RS12195
1
0.94
-1, 664
14
29389939
亲ACP92_RS12565
1
0.82
-2, 526
15
29393219
亲ACP92_RS12645
2
0.83, 0.85
1、935、1312
16
29390362
亲ACP92_RS13185
3
0.81, 0.84, 0.97
-58、-400、-76
17
29390889
亲ACP92_RS14465
1
0.91
-733
18
29389718
pro-ACP92_RS15060
1
0.91
1048
19
29391772
pro-ACP92_RS17440
1
0.96
-3909
20
29390087
亲ACP92_RS17545
2
0.89, 0.94
-200, -534
21
29394066
亲ACP92_RS18255
1
0.93
−356
22
29391333
亲ACP92_RS18865
2
0.84, 0.93
-4922, -4902
23
29393361
亲ACP92_RS19245
1
0.92
−1907
24
29390041
亲ACP92_RS19695
6
0.88、0.95、0.95、0.96、0.99、1.00
259、248、170、180、198、219
25
29393726
亲ACP92_RS19845
2
0.95, 0.99
2124, 2401
26
29391169
亲ACP92_RS19860
1
0.87
−46
27
29394235
亲ACP92_RS22515
1
0.94
48
28
29394160
pro-ACP92_RS22560
1
0.93
1347
29
29389690
pro-ACP92_RS23100
1
0.80
1247
表 1。确定了 H. seropedicae ACP92s 基因的 TSS 和预测评分值。
NNPP 工具的预测结果在原核生物的 0.8 截止值下被认为是可靠的[ 26 ]。
在随机序列中找到一个保守的模式。MEME 输出揭示了从思想序列中识别出的七个基序(MV1、MV2、MV3、MV4、MV5、MV6 和 MV7)。研究表明,基序六(MV6)被发现是所有(100%)血清斑蝥ACP92基因的共同启动子基序,作为转录因子的结合位点,共享最低48.27%(表2)。发现 Motif MV6 在基因表达和调控中充当转录因子的结合位点。在很大程度上定位和分布这些基序后,发现转录起始位点 (TSS) 在 -800 和 -100 bp 之间。相对地,在阳性链 (96) 中也发现比阴性链 (81) 更高的基序分布 H. seropedicae ACP92s 基因(图 1)。以类似的方式,由 MEME 生成 MV6 的序列徽标(图 2)。
图 1。不同 ACP92 亚科序列中基序相对于 TSS 的相对位置。注意:核苷酸位置在图表底部指定,从 +1(TSS 开始)到上游 1 kb (-1 kb) bp。
图 2。确定了 H. seropedicae ACP92 基因的基序 MV6 的常见启动子序列标识。
发现
主题
包含每个基序的 ACP92 启动子的数量 (%)
E值*
图案宽度
总数结合位点
MV1
14 (48.27%)
3.7e-005
20
14
MV2
29 (100%)
2.5e-002
21
29
MV3
29 (100%)
3.3e-006
14
29
MV4
21 (72.41%)
1.5e-008
29
21
MV5
27 (93.10%)
1.3e-010
23
27
MV6
29 (100%)
2.1e-007
20
29
MV7
28 (96.55%)
1.6e-005
19
28
表 2。H. seropedicae ACP92 基因启动子区域中的结合位点和共同基序的数量
*在随机序列中找到同样保守的基序的概率。
选择TOMTOM网络服务器是因为各种序列数据库可以很容易地搜索到已识别基序的序列匹配,基于共同基序MV6使用TOMTOM从原核生物DNA数据库中找出相似的基序,收集细菌转录因子。结果表明,在收集的细菌转录因子 (collectF) 原核生物数据库中使用和发现的 84 个基序中,有 24 个查询基序与结合基序 MV6 非常相似。此外,在 24 个匹配的基序中仅发现了四个 TF 家族,左侧查询基序是非转录因子家族。确定了四个转录因子家族,它们是 MV6 基序的结合候选者,即;细菌组蛋白样蛋白,毛皮(铁摄取调节蛋白),表 3)。在四个家族中,毛皮(铁摄取调节蛋白)在很大程度上与结合基序相匹配,该结合基序也称为 H. seropedicae ACP92s 基因调控的转录因子家族。
3.3. H.seropedicae ACP92 启动子区域中 CpG 岛的测定
在这项研究中,CpG 岛是使用血清 H. seropedicae 启动子中的 29 个确定的,并使用两种算法搜索基因体区域。使用 CLC 搜索算法并在每个
TF家族的分类
候选转录因子
基因
功能
细菌组蛋白样蛋白家族
整合宿主因子亚基α,
高铁
− 一种在基因重组以及转录和翻译控制中起作用的特定 DNA 结合蛋白
毛皮家族
铁摄取调节蛋白
毛皮
− 充当阻遏物,利用 Fe2+作为辅因子与铁转运操纵子的操纵子结合,参与外毒素 a 调节、铁载体调节和锰敏感性、转录激活子活性和序列特异性 DNA 结合
matp 家族
大结构域 Ter 蛋白
垫
− 细胞周期中染色体末端区域(Termacrodomain)的空间组织所必需的。
− 防止细胞分裂过程中重复的 Termacrodomains 的早期分离
− 与 matS 特异性结合,matS 是在 Termacrodomain 内重复的 13 bp 特征基序。
sigma-5 因子家族
RNA聚合酶sigma-54因子
VC_2529
− Sigma 因子是促进 RNA 聚合酶附着到特定起始位点并随后释放的起始因子
表 3。从收集的 TF 数据库中分类与 H. seropedicae ACP92s 启动子区域的基序 MV6 结合的转录因子家族。
基因; 启动子区域ACP92RS01580、ACP92RS04595、ACP92RS11865、ACP92RS12565、ACP92RS15060、ACP92RS17545、ACP92RS18255、ACP92RS18865、ACP92RS19245、ACP92RS22560、ACP92RS23100(表4)然而,在基因体区域中,除了基因 ACP92RS00045、ACP92RS08330、ACP92RS11865、ACP92RS12565、ACP92RS15060、ACP92RS17440、ACP92RS19845 和 ACP92RS19860 之外,在所有基因中都发现了一个可能的 CpG 岛(表 5)。使用限制性酶 MspI 位点切割的第二种算法被使用,并检查了 CpG 岛在启动子和基因体区域都有许多片段大小。启动子区域中的 CpG 岛在所有基因中都包含几个片段大小,除了 ACP92_RS17545 基因只有两个片段大小(62 和 70 bp)(表 6)。
类似地,在所有基因体区域也发现了CpG岛并且包含许多片段大小,除了在H. seropedicae的AraC家族转录调节因子ACP92基因中的基因ACP92_RS00045、ACP92_RS11865和ACP92_RS19695(表7)。这一事件暗示H. seropedicae 细菌具有CpG 岛和基因表达调控的重要作用。此外,还表明 H. seropedicae ACP92 基因在 CpG 岛中并不贫乏。与人类 [ 29 ]的这项研究相反,小鼠 [ 30 ] 和猪的 V1R 基因 [ 31 ] 在真核生物的 CpG 岛中表现不佳。然而,在脊椎动物中,大约 70% 的已知启动子是 Deaton 和 Bird [ 32 ] 报道的 CpG 岛。
4。结论
转录因子通过与通常存在于基因上游或它们控制的基因组学区域的特定 DNA 序列结合来调节基因表达。基因启动子区域与结合到编码序列上游区域的转录因子一起。CpG 岛也是基因组启动子区域的调节元件,可用于检测
基因名称
发现可能的 CpG 岛
N. of CpG island (s) found
GC含量(%)
ACP92RS00045
-
-
ACP92RS00855
-
-
ACP92RS01580
1
57
ACP92RS04595
1
66
ACP92RS04620
-
-
ACP92RS04670
-
-
ACP92RS04680
-
-
ACP92RS04870
-
-
ACP92RS05285
-
-
ACP92RS08330
-
-
ACP92RS11865
1
100
ACP92RS12020
-
-
ACP92RS12195
-
-
ACP92RS12565
1
53
ACP92RS12645
-
-
ACP92RS13185
-
-
ACP92RS14465
-
-
ACP92RS15060
1
56
ACP92RS17440
-
-
ACP92RS17545
1
53
ACP92RS18255
1
50
ACP92RS18865
1
56
ACP92RS19245
1
50
ACP92RS19695
-
-
ACP92RS19845
-
-
ACP92RS19860
-
-
ACP92RS22515
-
-
ACP92RS22560
1
65
ACP92RS23100
1
60
表 4。图中使用启动子区域显示了可能的 CpG 岛。
基因名称
发现可能的 CpG 岛
找到的 CpG 岛的数量
GC含量(%)
ACP92RS00045
-
-
ACP92RS00855
1
69
ACP92RS01580
1
50
ACP92RS04595
1
59
ACP92RS04620
1
61
ACP92RS04670
1
60
ACP92RS04680
1
63
ACP92RS04870
1
75
ACP92RS05285
1
57
ACP92RS08330
-
-
ACP92RS11865
-
-
ACP92RS12020
1
61
ACP92RS12195
1
67
ACP92RS12565
-
-
ACP92RS12645
1
71
ACP92RS13185
1
50
ACP92RS14465
1
68
ACP92RS15060
-
-
ACP92RS17440
-
-
ACP92RS17545
1
50
ACP92RS18255
1
64
ACP92RS18865
1
71
ACP92RS19245
1
72
ACP92RS19695
1
63
ACP92RS19845
-
-
ACP92RS19860
-
-
ACP92RS22515
1
70
ACP92RS22560
1
66
ACP92RS23100
1
62
表 5。图中使用基因体区域显示的可能的 CpG 岛。
地区
的名字
对应的 ACP92
MspI 位点的核苷酸位置
片段大小
发起人
地区
亲ACP92_RS00045
多重切割(在 26、80、177、219、231、572、839、1097、1117、1213、1285、1584、1734)
42、54、72、96、97、150
亲ACP92_RS00855
多重切割(97、112、262、335、424、508、751、775、811、844、1033、1068、1085、1192、1248、1596、1617、1691、1889、1947、1960、1974)
56、58、73、74、84、89、
107、150、189、198
亲ACP92_RS01580
多重切割(在 142、154、245、260、323、419、457、667、679、782、825、917、1239、1335、1724)
63, 91, 92, 96, 96, 210,
亲ACP92_RS04595
多重切割(46、83、90、122、161、173、274、480、486、519、695、815、959、1049、1185、1278、1307、1353、1406、1480、1583、1624、1640、 1656、1789、1820、1893)
41、46、53、73、74、90、93、101、103、120、133、136、144、176、206、
亲ACP92_RS04620
多重切割(在 243、357、410、439、579、584、728、1018、1040、1132、1229、1264、1272、1286、1330、1356、1696、1745、1902)
44、49、53、92、97 114、140、144、175
亲ACP92_RS04670
多重切割(在 460、673、798、883、1262、1454、1974)
85、192、213
ACP92_RS04680
多重切割(44、52、129、339、393、438、605、743、962、1057、1350、1394、1704、1720、1902)
44、45、54、77、95、138、167、182、210、219、
亲ACP92_RS04870
多重切割(在 189、312、336、510、694、837、859、1231、1416、1416、1498、1552)
54、82、123、174、184、185、
亲ACP92_RS05285
多重切割(在 36、47、263、315、332、353、438、956、1033、1109、1373、1594、1663、1677、1790、1876、1946)
52、69、70、76、77、85、86、113、216、
亲ACP92_RS08330
多重切割(在 21、53、65、104、189、227、389、535、597、680、701、721、752、832、922、1049、1300、1465、1482、1612、1639、1887、1980)
62、80、85、90、93、93、101、130、146、165、172、130、
亲ACP92_RS11865
多重切割(在 30、42、79、135、230、412、589、629、641、690、727、733、1024、1069、1225、1268、1528、1729、1969)
40、43、45、49、56、95、182、177、201、240
pro-ACP92_RS12020
多重切割(在 275、379、391、506、569、666、863、920、1341、1669、1733、1778)
45、57、63、64、104、115、197、
亲ACP92_RS12195
多重切割(在 39、45、171、379、638、694、740、968、998、1043、1152、1163、1296、1327、1364、1368、1442、1442、1442、1474、1591、1595、1 1918)
45、46、56、74、109、117、126、129、133、208、129
亲ACP92_RS12565
多重切割(在 37、120、165、185、208、236、297、324、450、487、618、738、1019、1024、1141、1265、1383、1408、1475、1632、1646、1817、18
45、61、67、67、83、117、118、120、124、126、131、157、171、
亲ACP92_RS12645
多重切割(在 355、459、804、837、1093、1361、1458、1469、1509、1556、1709、1743、1934)
40、47、97、104、153、191
亲ACP92_RS13185
多重切割(在 248、271、305、518、578、844、919、1013、1199、1230、1295、1424、1685、1701)
60、65、75、94、129、186、213、
亲ACP92_RS14465
多重切割(49、163、365、406、420、428、474、585、608、639、675、882、929、1017、1079、1250、1306、1338、1474、1744、1867、1960、1918)
41、46、47、56、62、88、93、111、114、123、136、171、202、207、
pro-ACP92_RS15060
多重切割(在 121、239、266、287、314、361、386、446、454、518、696、719、968、989、1270、1418、1432、1640、1877)
47、60、64、118、148、178、208
pro-ACP92_RS17440
多重切割(70、99、226、587、645、693、815、974、991、1097、1145、1198)
48、48、53、58、106、122、127、159
亲ACP92_RS17545
多重切割(在 166、236、529、910、1168、1445、1507、1973)
62, 70
亲ACP92_RS18255
多重切割(65、170、263、356、495、826、1098、1127、1158、1222、1343、1513、1574、1607、1707、1827)
93、93、64、105、100、120、121、139、170
亲ACP92_RS18865
多重切割(在 103、364、436、487、492、752、817、824、923、932、994、1034、1282、1345、1550、1733、1745、1873)
40、51、62、63、65、71、72、99、128、183、205
亲ACP92_RS19245
多重切割(在 1、20、47、65、100、119、181、265、337、351、401、445、580、593、682、725、797、964、1033、1339、1450、1501、1543、 1562、1646、1979)
42, 43, 44, 50, 51, 62, 69 72, 72, 81, 84, 89, 111, 135, 167
亲ACP92_RS19695
多重切割(70、292、524、608、625、722、751、958、982、997、1063、1088、1151、1342、1846、1897)
51、63、66、84、97、191、207、222、
亲ACP92_RS19845
多重切割(在 179、429、542、556、604、640、769、865、1082、1096、1212、1353、1443、1587、1690、1740、1770、1855)
48、50、85、90、96、103、113、116、129、141、217
表 6。H. seropedicae ACP92s 启动子区域分析结果的 MspI 切割位点和片段大小的确定。
亲推广者。
地区
对应 ACP92 的名称
MspI 位点的核苷酸位置
片段大小
基因体区
亲ACP92_RS00045
单刀(850)
-
亲ACP92_RS00855
多重切割(在 33、187、240、518、523、598、609、740、890、921、932 处)
53、131、150、154
亲ACP92_RS01580
多重切割(在 87、249、351、459、509、567、1005 处)
50、102、106、108、162
亲ACP92_RS04595
多重切割(在 135、293、413、461、504、603、651、685 处)
48、48、99、158、120
亲ACP92_RS04620
多重切割(在 111、457、580、764、811、841、869)
47, 123
亲ACP92_RS04670
多重切割(在 228、310、693、782、835)
82, 89
ACP92_RS04680
多重切割(在 255、312、380、537、572、622、795 处)
50、57、68、157、173
亲ACP92_RS04870
多重切割(在 206、406、450、459、477、684、813 处)
44、200、207、129
亲ACP92_RS05285
多重切割(99、175、193、249、486、664、877)
56、76、213
亲ACP92_RS08330
多重切割(72、85、407、465、486、549、616、763、786)
58, 63, 67, 147,
亲ACP92_RS11865
多重切割(在 592、880、1041 处)
161
pro-ACP92_RS12020
多重切割(在 214、276、472、494、808、868 处)
60, 62, 196,
亲ACP92_RS12195
多重切割(在 111、174、213、324、333、489、580、645)
63、65、91、111、156
亲ACP92_RS12565
多重切割(在 209、240、330、360、438、535、711、752 处)
41、78、90、97、176
亲ACP92_RS12645
多重切割(70、172、180、231、255、255、379、520、661、743、748、793、804、863、895、954、965、987、1024)
45、51、59、82、102、124、141、141
亲ACP92_RS13185
多重切割(在 145、190、195、277、305、350、457、769)
45、45、82、107
亲ACP92_RS14465
多重切割(在 180、273、310、339、423、617、640)
84, 93, 194
pro-ACP92_RS15060
多重切割(在 54、109、138、240、299、398、437、529、719、788、901、1029)
55, 59, 92, 95, 99, 102,
pro-ACP92_RS17440
多重切割(在 141、214、268、341、373、497、526、538、633、822、880、972 处)
54、58、73、92、95、124、189
亲ACP92_RS18255
多重切割(在 364、424、531、784、901)
60, 107, 117
亲ACP92_RS18865
多重切割(58、89、113、160、220、255、307、319、343、411、434、484、579、754、856、929)
47、50、52、60、68、95、73、102、175
亲ACP92_RS19245
多重切割(64、127、175、199、222、300、727)
48, 63, 78
亲ACP92_RS19695
多重切割(在 125、225、737 处)
100
亲ACP92_RS19845
多重切割(在 154、259、273、339、459、525、582、630、666、753、825 处)
48、57、66、66、72、87、105、120
亲ACP92_RS19860
多重切割(72、157、187、237、340、417、484、574、715、831、845)
50、67、85、90、103、116、141
亲ACP92_RS22515
多重切割(72、78、94、178、188、318、336、357、390、516、541、800、831、848)
84、126、130
pro-ACP92_RS22560
多重切割(在 156、167、380、388、406、420、453、468、709、839、871)
130, 213
pro-ACP92_RS23100
多重切割(88、104、301、313、466、478、574、759、857)
96、98、153、197、185
表 7。MspI 切割位点和片段大小的测定 H. seropedicae ACP92 基因体分析结果。
使用限制性酶 MspI 切割位点(片段大小 b/n 40 和 220 bp)搜索 CpG 岛。
发起人。在这项研究中,我们分析了 H. seropedicae 的 AraC 家族转录调节因子 ACP92 基因中的启动子区域、基序和 CpG 岛。该分析的结果有助于了解转录因子结合区域,并可以读取调节遗传密码,该密码预测一般细菌物种和特别是 H. seropedicae 的基因表达。因此,生物信息学方法的知识对于识别启动子区域中的基因调控区域非常重要,而基因体区域也有助于预测各种细菌物种中的基因表达谱。
利益冲突
作者声明与本文的发表没有利益冲突。
参考
[ 1 ] Gyaneshwar, P., James, EK, Reddy, PM 和 Ladha, JK (2002) Herbaspirillum 定殖增加了耐铝水稻品种的生长和氮积累。新植物学家,154、131-145。
[ 2 ] Cruz, LM, Souza, EM, Weber, OB, Baldani, JI, Dobereiner, J. 和 Pedrosa, FO (2001) 从香蕉 (Musa spp.) 和松苹果 (Ananascomosus) 中分离的固氮细菌的 16S 核糖体 DNA 表征(L.)梅里尔)。应用和环境微生物学,67,2375-2379。
[ 3 ] Baldani, JI, Baldani, V., Seldin, L. 和 Dobereiner, J. (1986) H. seropedicae Gen-Nov, Sp-Nov, 根相关固氮细菌的表征。国际系统细菌学杂志,36, 86-93。
[ 4 ] Pedrosa, FO 和 Elmerich, C. (2007) 结合和内生固氮细菌中固氮和铵同化的调节。在:Elmerich, C. 和 Newton, WE, Eds.,联合和内生固氮细菌和蓝藻协会,Springer,柏林,47-71。
[ 5 ] Monteiro, R.、Balsanelli, E.、Wassem, R.、Marin, A. 和 Brusamarello-Santos, L. (2012) Herbaspirillum-Plant Interactions: Microscopical, Histological and Molecular Aspects。植物和土壤,356, 175-196。
[ 6 ] Munson, GP 和 Scott, JR (1999) 由 AraC 家族中的毒力调节剂 RNS 进行的结合位点识别。细菌学杂志,181,2110-2117。
[ 7 ] Solovyev, V.、Shahmuradov, I. 和 Salamov, A. (2010) 启动子区域和监管位点的识别。分子生物学方法,674, 57-83。
[ 8 ] Abeel, T.、Saeys, Y.、Rouze, P. 和 Vande Peer, Y. (2008) Pro SOM:基于 DNA 物理图谱无监督聚类的核心启动子预测。生物信息学,24、24-31。
[ 9 ] Borneman, AR, Gianoulis, TA, Zhang, ZD, Yu, H., Rozowsky, J., Seringhaus, MR, Wang, LY, Gerstein, M. 和 Snyder, M. (2007) 跨相关转录因子结合位点的分歧酵母菌种。科学,317、815-819。
[ 10 ] Halford, ES 和 Marko, JF (2004) 位点特异性 DNA 结合蛋白如何找到它们的目标。核酸研究,32, 3040-3052。
[ 11 ] Gidekel, M.、Jimenez, B. 和 Herrera-Estrella, L. (1996) 延伸因子 1 的拟南芥基因编码的第一个内含子包含类似增强子的元素。基因, 170, 201-206。
[ 12 ] Rakyan,VK,等人。(2008) 全基因组鉴定和分析人类组织特异性差异甲基化区域 (tDMR) 的综合资源。基因组研究,18,1518-1529。