南京企业网站开发公司,网络推广技巧,国际新闻,网站源码大全最新Convergent evolution of berberine biosynthesis
小檗碱生物合成的趋同进化 摘要
小檗碱是一种有效的抗菌和抗糖尿病生物碱#xff0c;主要从不同植物谱系中提取#xff0c;特别是从小檗属#xff08;毛茛目#xff0c;早期分支的真双子叶植物#xff09;和黄柏属…Convergent evolution of berberine biosynthesis
小檗碱生物合成的趋同进化 摘要
小檗碱是一种有效的抗菌和抗糖尿病生物碱主要从不同植物谱系中提取特别是从小檗属毛茛目早期分支的真双子叶植物和黄柏属无患子目核心真双子叶植物中提取。与小檗属物种中已知的小檗碱生物合成路径相比其在黄柏属物种中的生物合成仍不清楚。通过使用染色体水平基因组组装、共表达矩阵和生化测定我们鉴定了黄柏属小檗碱生物合成中的六个关键步骤包括甲基化、羟基化和小檗碱桥形成。特别地我们发现了一类特定的O-甲基转移酶NOMT负责N-甲基化。对PaNOMT9的结构分析和诱变研究揭示了其独特的底物结合构象。此外与毛茛目经典的FAD依赖性小檗碱桥形成不同黄柏属使用NAD(P)H依赖性的单加氧酶PaCYP71BG29进行小檗碱桥的形成该过程源于色氨酸胺5-羟化酶的新功能化。综上所述这些发现揭示了小檗碱生物合成在小檗属和黄柏属之间的趋同进化并标志着趋同进化在植物特化代谢中的作用。
引言
植物来源的苄基异喹啉生物碱BIA是药物的一个重要来源。许多BIA如小檗碱1–4、吗啡5, 6和血根碱7, 8已经用于治疗各种疾病。关于BIA的分离和植物界中的分布已有大量研究完成。一方面令人感兴趣的是许多BIA主要集中在特定的被子植物目中例如早期分支的真双子叶植物如毛茛目和木兰目和木兰类植物如木兰目、月桂目和胡椒目9–12。另一方面少数BIA如小檗碱的分布则呈现不同的模式。小檗碱最初是从核心真双子叶植物无患子目的黄木Zanthoxylon clava树皮中分离出来的。后续的研究表明黄柏属Phellodendron spp.也能产生小檗碱13。截至目前小檗碱的生产主要依赖于如毛茛目Ranunculales中的小檗属Berberis和小檗属Coptis以及无患子目Sapindales中的黄柏属等植物来源14。
小檗碱是一种有效的广谱抗菌和抗糖尿病药物。过去的研究已经描述了小檗碱在小檗属植物根部和根茎中的主要生物合成步骤15。其生物合成途径始于多巴胺1和4-羟基苯乙醛4HPAA2的偶联反应生成S-去氢可克劳林3这一过程由去氢可克劳林合酶NCS催化NCS是PR10/Bet v1家族的成员16, 17。随后的修饰反应包括通过O-/N-甲基转移酶MTs进行的O/N-甲基化和通过细胞色素P450进行的羟化促使S-网状碱7的形成18–20它是BIA生物合成途径中的重要中间体。来自黄素腺嘌呤二核苷酸FAD依赖性氧化酶家族的小檗碱桥酶BBE催化7转化为四环小檗碱骨架S-可克劳林821。最后9OMT22、CYP719A23, 24和STOXBBE样25负责三个连续步骤——O-甲基化、亚甲基二氧桥形成和四电子氧化反应——将8转化为小檗碱11图1A。随着小檗碱生物合成的阐明最近的研究重点转向了代谢工程和体外环境可持续生产。尽管已经实现了小檗碱的全新微生物合成但由于催化效率和酶的多功能性限制目前的产量尚未达到工业生产的要求26, 27。寻找替代生物合成酶的研究结果将为实现高效生产BIA提供重要的遗传元素。 图 1. 黄柏属P. amurense中产生的原小檗碱和阿佛品类BIA。 (A) 小檗碱11的生物合成途径。黑色箭头表示来自小檗属的已报道酶虚线箭头表示这些步骤在黄柏属中仍不明确。1多巴胺24HPAA3S-去氢可克劳林4S-可克劳林5S-N-甲基可克劳林6S-3′-羟基-N-甲基可克劳林7S-网状碱8S-可克劳林9S-四氢哥伦比亚碱10S-加拿丁11小檗碱。Rt保留时间。 (B) 测试物种的系统发育树和BIA代谢物谱。该系统发育树是基于黄柏属P. amurense和其他18个物种的转录组或基因组数据表S1使用单拷贝直系同源基因构建的。代谢物是从17个物种的根部黄色和/或茎部绿色提取的还包括莲子N. nucifera的莲胚蓝色。热图显示BIA水平通过log10峰面积1的值表示。BIA类型1-BIA原小檗碱、前小檗碱和阿佛品类。12S-木兰啡13天贝他林15黄柏碱15格尔兰啡16哥伦比亚碱17贾托里赫辛18小檗啡19棕榈碱20前小檗碱21大花啡。 (C) 显微图像显示黄柏属P. amurense根部的横截面MALDI-MSI图像生成的热图显示了代谢物的积累模式。
尽管在小檗属物种中已明确了解上述的生物合成途径但是否在远缘关系的黄柏属物种中小檗碱的丰富物种也遵循相同的途径仍不清楚。基于黄柏属和小檗属之间不同的谱系我们假设黄柏属物种可能已经进化出不同的机制来合成小檗碱和其他BIA。为了验证这一假设我们采用了基因组组装、转录组学、诱变、基因组比较、系统发育分析、蛋白质结晶、酶学测定和代谢组学的综合方法解析了黄柏属P. amurense中小檗碱的生物合成途径。所得数据不仅确定了该谱系中小檗碱的六个生物合成步骤还揭示了先前未知的酶学功能和机制。来自黄柏属的OMT酶通过不同的机制催化BIA中间体的N-甲基化。与小檗属中的FAD依赖性BBE不同已鉴定出谱系特异性的CYP450酶催化黄柏属中的小檗碱桥形成。这些发现揭示了小檗碱的生物合成在小檗属和黄柏属中经历了不同的进化。小檗碱生物合成的分歧扩展了我们对植物BIA代谢的理解并为代谢工程提供了重要的见解。
结果
黄柏属P. amurense中小檗碱的丰度
为了了解黄柏属P. amurense和其他17个植物物种在六个不同目木兰目、月桂目、毛茛目、木兰目、葡萄目和无患子目中的BIA分布完成了液相色谱-质谱LC-MS分析以概述各种组织中的19种BIA代谢物表S1。结果显示这些BIA主要在木兰类植物木兰目和月桂目和早期分支的真双子叶植物中被检测到。数据还揭示了原小檗碱类和阿佛品类BIA尤其是小檗碱11[M H]质量/电荷比m/z336.1268、黄柏碱14[M H] m/z 342.1715、哥伦比亚碱16[M H] m/z 338.1410、贾托里赫辛17[M H] m/z 338.1410、棕榈碱19[M H] m/z 352.1560和大花啡21[M H] m/z 342.1721在黄木科物种如黄柏、粗榄、刺木和光木根部和/或茎部中高浓度积累图1B及图S1和S2。与这四个物种不同其他无患子目物种和葡萄Vitis vinifera中未检测到BIA。在毛茛目中像小檗属如马赫尔·比尔利、黄柏朱利安、南丁丁和中国小檗等也积累了高水平的原小檗碱类BIA这与黄柏属相似图1B。这些发现证实了原小檗碱类BIA特别是小檗碱在远缘的无患子目黄柏属和毛茛目小檗属物种中具有独立和谱系特异性的分布。小檗碱的生物合成途径尤其是在小檗属中已经得到了完全阐明图1A。基于黄柏属和小檗属BIA代谢谱的相似性我们提出这两种植物可能共享类似的小檗碱生物合成步骤。此外完成了基质辅助激光解吸/电离质谱成像MALDI-MSI用于空间定位黄柏属P. amurense根部的BIA。所得图像显示小檗碱途径代谢物和小檗碱衍生物定位于根部的外皮和韧皮部图1C及图S3。
基因组组装和P. amurense的全基因组重复倍增WGD
为了识别P. amurense中负责小檗碱生物合成的关键基因我们生成了137.52 Gb的Illumina测序数据、73.14 Gb的PacBio Sequel II长读长测序数据以及324.14 Gb的Hi-C配对末端读数基于这些数据组装了染色体级别的单倍型基因组图2A、图S4和表S2。基因组调查、初步组装和染色体锚定分析构建了38条假染色体覆盖了2.81 Gb的基因组大小支架N50长度为76.63 Mb图S5和表S3、S4。该基因组的Benchmarking Universal Single-Copy OrthologsBUSCO完整性值达到了97.7%表S5。此外P. amurense基因组中约87.03%由可转移元件组成其中长末端重复反转录转座子LTR-RTs是最丰富的重复序列类别表S6。在P. amurense基因组中共预测了41,414个编码蛋白的基因BUSCO完整性为97.60%这表明基因组组装和基因预测的高完整性表S5。系统基因组学和时间推断分析表明两种产生BIA的Zanthoxyloideae物种P. amurense和Z. armatum与未积累BIA的Aurantioideae和Rutoideae物种为姊妹关系图2B和图S6P. amurense与Z. armatum的分歧时间为2490万年前Ma95%置信区间CI为1833万至3153万年前图S6。 图2. P. amurense基因组的基因组特征、系统发育树和全基因组重复倍增WGD事件
(A) P. amurense的基因组特征。最外圈到最内圈的circos图展示了38条假染色体I基因密度每Mb基因数II1 Mb窗口中的GC含量III重复序列的密度IV以及circos图中心的每条连接线表示一对同源基因V。 (B) 基于P. amurense和12个候选物种的单拷贝直系同源基因构建的系统发育树。每个分支线上的绿色和红色数字分别表示扩展和收缩的基因家族数目。饼图展示了经历了基因家族收缩红色或扩展绿色的比例。分歧时间及其95%置信区间CI在分支节点上通过紫色水平条表示。WGT-γ表示gamma三重倍增事件。 (C) P. amurense和C. clementina基因组之间的共线性。以C. clementina基因组为参考识别P. amurense基因组中每条染色体的同源基因对和共线性区块。 (D) Z. armatum和C. clementina染色体之间的共线性。 (E) 根据候选物种与C. clementina染色体Chr1到Chr9之间的共线性图谱分别使用P. amurense子基因组和Z. armatum子基因组中的同源基因构建的系统发育树。P. amurense和Z. armatum中的红色、蓝色、绿色和橙色框代表与C. clementina的四种类型的共线性区块。 (F) P. amurense、Z. armatum、P. amurense子基因组、Z. armatum子基因组和C. clementina之间的直系同源基因和旁系同源基因的KS分布。 (G) P. amurense和Z. armatum的预测WGD事件。WGD1和WGD2分别表示P. amurense和Z. armatum基因组之间共享的WGD事件。
基因组内共线性分析揭示了P. amurense基因组中至少存在两次全基因组重复倍增WGD事件的遗迹图2A和图S7、S8。基因组间的共线性分析表明P. amurense和Z. armatum基因组中的四个旁系同源段与Citrus clementina基因组中的一个直系同源区域相对应图2C和D这表明P. amurense和Z. armatum基因组中的两轮WGD事件可能发生在与C. clementina基因组分歧之后。P. amurense和Z. armatum的基因组分别映射到C. clementina基因组中。该映射在系统发育上将它们分为四个子基因组PamuA、PamuB、PamuC和PamuD以及ZarmA、ZarmB、ZarmC和ZarmD图2E和图S9。为了进一步探讨P. amurense WGD的系统发育位置通过成对的子基因组对旁系同源基因的Ks同义替代每个同义位点的替代数分布分析显示了两个经过调整速率的Ks峰值PamuAC旁系同源基因的0.16和PamuBD旁系同源基因的0.18。这一结果确认了P. amurense和Z. armatum在分裂之前共享了两轮WGD事件图2F和G及图S10。这些结果表明Rutaceae物种中可能发生了广泛的WGD事件和复杂的染色体进化。
小檗碱生物合成途径的阐明
为了识别参与P. amurense中小檗碱生物合成的基因我们将先前对18个组织的转录组测序数据与小檗碱积累模式结合进行了Pearson相关系数r分析。结果显示了与小檗碱产生相关的高排名候选基因r 0.80。这些基因包括两个PaOMTs基因、一个PaNMT基因和四个PaCYPs基因这些基因被选为功能分析的对象图3A。 图3. 小檗碱生物合成途径的阐明
(A) P. amurense转录组数据与小檗碱含量之间的Pearson相关系数r 0.80。热图展示了从log10FPKM 1计算的z分数。灰色突出显示的CYP450s是未成功克隆的部分基因或报告的limonin生物合成同源基因图S21。FPKM表示每百万个比对片段中的每千碱基外显子模型的片段数。 (B) 使用3、4、6和8作为底物时由纯化的PaOMT1和PaOMT2催化的化合物的提取离子色谱图。 (C) 使用5和7作为底物时由PaCYP71BG29微体催化的化合物的提取离子色谱图。 (D) P. amurense转录组数据与PaOMT1基因之间的Pearson相关系数。灰色突出显示的基因是未成功克隆的或报告的limonin生物合成同源基因。 (E) 使用3、4、6和8作为底物时由纯化的PaOMT4/5/7/8/9催化的化合物的提取离子色谱图。 (F) 本图总结了本文报告中验证的催化步骤。PaCYP71BG29的催化活性通过酵母和烟草表达系统进行了双重确认。N-甲基化的OMT成员被重新命名为NOMTs。Tmin为分钟时间。
首先为了确定参与小檗碱生物合成的O-和N-甲基化反应我们诱导重组的PaOMT1、PaOMT2和PaNMT1进行体外甲基化活性测试使用了四种底物(S)-norcoclaurine (3)、(S)-coclaurine (4)、(S)-3′-hydroxy-N-methylcoclaurine (6) 和 (S)-scoulerine (8)。这些测试确定PaOMT1和PaOMT2具有甲基化活性而PaNMT1则没有。PaOMT1催化8号底物C-2和C-8羟基的连续O-甲基化生成(S)-tetrahydrocolumbamine (9)m/z 342和(S)-tetrahydropalmatine (26)m/z 356其功能与C. chinensis中的Cc9OMT相同图3B和图S11。意外的是PaOMT2没有表现出任何O-甲基化功能但出乎意料地表现出对4号底物的N-甲基化活性分别生成(S)-N-methylcoclaurine (5, m/z 300)和(S)-magnocurarine (12, m/z 314)通过单一和双重N-甲基化反应这与C. chinensis中的CcNMT的催化活性相当图3B和图S12。此外PaOMT2还催化了3、4和8号中间体上未饱和NH或NCH3基团的N-甲基化和N-去甲基化表现出明显的底物宽容性图3F。这些此前未识别的活性增进了对BIA生物合成中N-甲基化的理解。
其次使用CYP蛋白测试了BIA的氧化反应。根据已有报告CYP450酶CYP80B1/224, 28, 29、CYP80G129, 30和CYP719A124, 31分别催化5号底物的C-3′羟基化、7号底物的C-C苯基偶联反应以及(S)-tetrahydrocolumbamine (9)的美克伦二氧桥形成四种候选PaCYPs—PaCYP71BG28、PaCYP71BG29、PaCYP71D791和PaCYP716AC1—在体外进行了催化功能研究底物为5、7和9。结果表明PaCYP71BG29对5和7的催化活性被检测到而其他酶的活性没有被检测到图S13。PaCYP71BG29展示了在底物5的C-3′位上的羟化酶活性生成6m/z 316图3C和图S14。此外PaCYP71BG29还催化了7的黄连桥形成生成8m/z 328图3C和图S15这与Coptis spp.中FAD依赖的氧化酶BBE的活性相同。此外在Nicotiana benthamiana中瞬时表达PaCYP71BG29也确认了其对5的羟化活性图S16和对7的黄连桥形成活性图S17。
最后通过使用PaOMT1作为诱饵基因进行共表达分析阐明了小檗碱在黄檗属中的剩余生物合成步骤选择了七个OMTsPaOMT3到PaOMT9和三个CYPsPaCYP71BQ4、PaCYP71BE279v1和PaCYP87A38这些基因的表达与PaOMT1高度相似图3D。体外生化实验显示了三种类型的甲基化活性。(i) 如PaOMT2测试所述PaOMT7、PaOMT8和PaOMT9催化了N-甲基化活性并具有广泛的底物宽容性图3E和图S12。(ii) PaOMT4和PaOMT5催化了3号底物C-6羟基的甲基化生成4图3E和图S18。(iii) PaOMT3催化了6号底物C-4′羟基的甲基化生成7图3E和图S19。此外在不同底物的催化实验中未检测到PaOMT6和三种PaCYP450s的活性图S13和S20。总之这些生化数据阐明了黄檗属小檗碱途径中的6个酶催化步骤图3F。
PaNOMT9的晶体结构和催化机制
根据之前未识别的催化特性N-甲基化OMT成员已重新命名为NOMT组图3F。为了理解PaOMT在P. amurense中催化的N-甲基化机制我们解析了三元复合物PaNOMT9/S-腺苷甲硫氨酸SAM/4的晶体结构蛋白质数据银行PDBID8ZN0分辨率为1.8 Å图4A。PaNOMT9的蛋白质结构形成了二聚体标记为A和B。这两个不同的单体分别构成N端二聚体化域1到165氨基酸主要由α1到α10、β1到β3和η1组成和C端Rossmann折叠的SAM/S-腺苷高半胱氨酸SAH结合域199到359氨基酸α12到α16、β4到β10和η2两者通过α11螺旋166到198氨基酸连接图4A。在PaNOMT9的二聚体化域α6和α10、SAM/SAH结合域α15和η2以及α11螺旋的界面处17个残基距离底物4在5 Å范围内图S22A和S23。蛋白质-配体相互作用分析揭示H127与C6-甲氧基和C7-羟基之间形成氢键而Y159与NH基团之间形成氢键图4B。核心底物4被F123、F126、W262、I265、M312、I315、G316、V320和L325等疏水性残基环绕并与这些残基相互作用。此外距离活性位点较远的D185、D293和L295通过序列比对被鉴定为N-甲基化和O-甲基化OMT蛋白的差异残基图4C和图S22B及S23。 图4. PaNOMT9的晶体结构和催化机制
(A) PaNOMT9/4/SAM三元复合物的晶体结构总体视图。 (B) PaNOMT9与配体4之间的蛋白质-配体相互作用图。红色标记表示疏水性残基。 (C) N-甲基化活性OMT蛋白PaNOMT9/2/7/8与O-甲基化OMT蛋白PaOMT1/3/4/5之间的氨基酸序列比对。 (D) PaNOMT9及其20个通过定向突变得到的变体的催化活性以堆叠条形图表示。 (E) 由PaNOMT9/4/SAM形成的三元复合物的晶体结构其中突变这些关键残基会降低催化活性。用青色突出显示的残基表示这些残基与底物之间的距离小于5 Å而用橙色表示的残基超出了这一范围。灰色虚线表示4的N原子与SAM甲基化基团之间的距离为4.5 Å。 (F) 两个三元复合物晶体结构的叠加Tf6OMT/norlaudanosoline/SAH和PaNOMT9/4/SAM。这两个三元复合物的蛋白质-配体结合构象差异导致了O-/N-甲基化功能的差异。
上述PaNOMT9的20个残基被逐一用丙氨酸A替代生成了20个变体然后测试了每个变体以4为底物的活性。反应中甲基化产物5或二甲基化产物12的含量通过LC-MS分析估算图4D。一方面结果表明M312、I315和L319的丙氨酸替换几乎完全废除了N-甲基化活性图4D。另一方面四个变体—F126A、M176A、I265A和L325A—表现出明显高于野生型的5/12甲基化/二甲基化比值图4D。这些结果表明疏水相互作用对于底物结合口袋的构建至关重要图4E。此外位于远离活性位点的D293A和L295突变体几乎完全失去了N-甲基化活性这可能归因于蛋白质结构的扰动。PaNOMT9的H127A变体只能催化无效的N-甲基化反应表明H127与底物4之间的氢键对于底物结合构象的形成至关重要图4D和E。我们进一步生成了11个额外的H127突变体结果表明保守替换H127N和具有相似性质的替换H127K和H127R保留了对4的野生型N-甲基化活性。相比之下H127P突变体几乎完全失去了N-甲基化活性图S24A。H127A和H127P突变体位于远离C6-甲氧基和C7-羟基的地方导致活性口袋内出现较大的空腔这表明H127在底物结合构象中起着关键作用图S24B。
为了理解PaNOMT9催化的N-甲基化机制我们对晶体结构进行了比较。已报道的来自Thalictrum flavum的Tf6OMTPDB ID5ICE和来自Coptis japonica的CjCNMTPDB ID6GKV分别催化O-甲基化和N-甲基化并已详细解析了它们的晶体结构32, 33。基于这些数据我们将Tf6OMT和CjCNMT的蛋白质结构与PaNOMT9进行了比较图S22。一方面Tf6OMT和PaNOMT9的整体结构相似它们的SAM和SAH位置相对接近然而这两种结构有明显不同的蛋白质折叠图S22C。将Tf6OMT/norlaudanosoline/SAH和PaNOMT9/4/SAM的复合物结构叠加以比较它们的活性口袋和底物结合构象图4F和图S22C。构象比较揭示Tf6OMT和PaNOMT9的活性位点口袋中的底物定向不同图4F。底物4的NH基团与SAM供体的距离相对较近4.5 Å而在Tf6OMT复合物中C-6 OH基团则与SAM供体的距离较近3.4 Å。此外与PaNOMT9和底物3、6、8的对接模拟展示了与4相似的构象图S25。另一方面与CjCNMTPDB ID6GKV的蛋白质结构相比非同源的PaNOMT9呈现出完全不同的整体结构包括SAM和底物结合区域、氢键和疏水性残基的构象尽管这两种蛋白质展现出相似的N-甲基化活性。这些结果表明PaNOMT9在这些区域及其周围的构象灵活性和可塑性使得底物能够进行N-甲基化。
PaCYP71BG29在小檗碱桥形成中的新功能化和催化机制
通过同源基因挖掘、系统发育分析和功能实验追溯了PaCYP71BG29催化的小檗碱桥形成的起源和进化。系统发育分析表明来自P. amurense的PaCYP71BG29和另外五个基因、Z. armatum的九个基因以及C. clementina的两个基因与水稻的OsCYP71P1序列相似度为46%到58%聚类在同一分支图5A、图S26和表S7、S8。进一步与氨基酸序列的比较显示PaCYP71BG29与OsCYP71P1一个色胺5-羟化酶T5H具有47%的相似度34。 图5. PaCYP71BG29的新功能化及其催化机制的确定
(A) 基于P. amurense、Z. armatum和C. clementina中PaCYP71BG亚家族成员构建的最大似然系统发育树。OsCYP71P1作为外群。Ka/Ks是非同义Ka与同义Ks替代率。 (B) 和(C) 提取离子色谱图EIC表征由候选CYP微粒体和两个底物——色胺27和S-网状碱7组成的酶促反应生成的化合物。 (D) PaCYP71BG29、ZaCYP71BG29和其他CYP71BG亚家族成员的氨基酸序列比对。展示了24个氨基酸其中六个位点红色标记与7相距5 Å以内。 (E) 堆叠条形图展示了PaCYP71BG29及其24个变体对两个底物的催化偏好S-网状碱7和S-小檗碱8。 (F) PaCYP71BG29/HEME/7的分子对接模型显示了那些关键残基它们增强红色或降低蓝色催化活性。底物7与关键残基E213和HEME之间的距离分别为3.4和2.6 Å。 (G) 提出了由PaCYP71BG29催化的小檗碱桥形成的机制。
CYP71BG亚家族成员的系统发育树被分为七个节点节点1至节点7。根据系统发育树选择了九个CYP71BG基因及其两个祖先基因anc185和anc186来诱导重组蛋白进行活性测试图5B和C。首先根据OsCYP71P1的催化活性使用色胺27作为底物进行体外酶促实验并选择OsCYP71P1作为阳性对照。结果显示PaCYP71BG4、CiCYP71BG4和OsCYP71P1将色胺27转化为血清素28图5B和图S27。此外实验表明祖先CYP71BG基因anc186也编码T5H尽管其催化活性较为温和。相反P. amurense和Z. armatum基因组中从基因扩展产生的节点2中的CYP719BG候选基因对色胺27没有羟基化活性图5A和B。 其次选择网状碱7作为底物测试小檗碱桥活性。催化实验显示节点7中的PaCYP71BG29和ZaCYP71BG29表现出了小檗碱桥活性将S-网状碱7转化为S-小檗碱8图5A和C。相比之下P. amurense和Z. armatum中其他重复的CYP71BG基因无法催化7到8的转化。这些结果表明PaCYP71BG29和ZaCYP71BG29在植物进化过程中发生了新功能化和分化。 最后使用双比率分支模型检测了正向选择。结果显示从节点2到节点6的分支ω值大于1。这些值还表明PaCYP71BG29和ZaCYP71BG29发生了新功能化。获得的催化作用负责P. amurense和Z. armatum中小檗碱桥的形成图5A。
为了理解PaCYP71BG29在小檗碱生物合成中的环化酶活性机制使用S-网状碱7作为配体通过AlphaFold2完成了对接模拟图S28。通过序列比对进一步选择了在活跃与不活跃CYP71BG酶中显著不同的残基图5D。通过比对选择了24个不同的残基其中六个残基包括S106、T110、S117、E203、E310和T372定位在7周围5 Å以内图5D和图S29。这些PaCYP71BG29的残基接受了一系列的突变以研究其对T5H功能的贡献并测试了使用7作为底物的突变体的活性进行三次重复实验图5E。几个突变体增强了小檗碱桥的形成活性例如PaCYP71BG29的突变体Y254D和K406R表现出明显有效的转化率分别为79.4%和75.9%高于野生型的37.8%。PaCYP71BG29的七个突变体包括S106D、R114S、S117T、E213Q、D296N、E310D和N485I几乎失去了小檗碱桥形成活性表明它们在将7转化为8中的关键作用图5E。这些变体中的S106D、S117T、E213Q和E310D位于5 Å范围内可能会影响底物结合。另一方面R114S、D296N和N485I这些位于远离活性中心的变体可能通过改变蛋白质构象和表面结构来影响PaCYP71BG29的催化活性图5F。基于这些数据我们提出这些残基的变化导致了CYP71BG29的新功能化。
PaCYP71BG29/HEME/7的对接模型显示关键残基E213的羧基与7的N-甲基基团接近3.4 Å而HEME铁中心则靠近7的C3′-OH基团2.6 Å图5F。进一步参考已报告的BBE35提出了PaCYP71BG29在小檗碱桥形成中的催化机制HEME辅因子去质子化C3′-OH基团增强其亲核性来自N-甲基基团的氢化物转移到E213反应中间体的再芳构化导致8的环化反应图5G。因此尽管迄今为止所有检查过的Ranunculales植物都使用FAD依赖性氧化酶催化小檗碱桥反应但Rutaceae科的成员P. amurense和Z. armatum可能通过趋同进化出一个独特的CYP450成员通过类似的化学机制来介导相同的氧化反应。
讨论
尽管小檗碱的生物合成已经在小檗属植物中得到阐明但是否其他谱系植物也存在相同的生物合成途径仍然不清楚。对此问题的回答不仅有助于理解小檗碱的生物合成还能帮助我们了解不同植物中的多样化代谢途径。已报道的小檗属植物中小檗碱的生物合成包括一个NCS、三个OMTs6OMT、4′OMT和9OMT、一个NMTCNMT、两个CYPsCYP80B和CYP719A、一个BBE和一个类似BBE的酶THBO。在P. amurense基因组中对同源基因的注释显示与小檗属植物中的基因相比NCS33%到37%、OMTs26%到49%、NMT33%到37%、CYPs23%到42%和BBE基因29%到57%的身份非常低表S9。此外在P. amurense中未发现CYP80和CYP719基因。因此这些特征表明小檗碱的生物合成途径在P. amurense和小檗属植物之间可能存在差异。此外基于这些特征我们假设在P. amurense的小檗碱生物合成中可能涉及未知的甲基化和氧化反应机制。以下将通过OMT的N-甲基化和CYP酶的新功能化来验证这一假设。
本文报告的PaNOMT9的催化活性揭示了一个涉及小檗碱生物合成的双重甲基化机制。SAM依赖的MTs在植物天然产物多样化中起着重要作用。以往的研究已表征了将甲基转移到化合物的S、N、O或C原子上的MT成员生成甲基化的天然产物36。根据S、N、O或C的修饰MTs已被分类为SMT、NMT、OMT和CMT。迄今为止BIA生物合成中的MT特异性表明OMT和NMT成员严格地将甲基转移到C-OH和NH基团上37。与此相反已有报告表明OMT家族的某些II类和III类成员在黄嘌呤和邻苯二甲酸中都具有O和N-甲基化活性表S1038, 39。在此我们的研究数据增加了MT的另一个亚类NOMTs。来自黄柏Phellodendron的PaNOMT2/7/8/9与Coptis的CNMT基因具有相似的催化活性是首个能够催化BIA生物合成中N-甲基化的OMT成员。来自P. amurense的与小檗碱生物合成相关的NOMT基因PaNOMT2/7/8/9与OMT家族II类亚家族呈姊妹群图S30A。NOMT基因的系统发育分支包含来自P. amurense和Z. armatum的大量串联重复基因且仅在柑橘中观察到一个同源基因CiOMT2与PaNOMT2/7/8/9的序列同源性为64%到66%图S30B和S31。我们的催化实验表明CiOMT2不能对底物4执行N-甲基化活性图S30B表明N-甲基化功能的获得是在它们与柑橘的分离后演化而来的。PaNOMT9的N-甲基化催化机制与已报道的BIA OMT或NMT酶有所不同提供了有价值的信息有助于加深对BIA结构甲基化的理解并推动潜在BIA药物的代谢工程。
本文报告的PaCYP71BG29的小檗碱桥形成活性揭示了植物专用代谢产物生物合成中来自非同源酶的相同催化活性这是一个先前未曾发现的案例。在以往的研究中Ranunculales超家族中的FAD依赖性氧化酶BBE如小檗、罂粟、千屈菜和小檗属等植物的BBE在小檗碱生物合成中的小檗碱桥形成中起着保守作用21, 40-42。然而来自P. amurense基因组的PaBBE基因仅有一个与Ranunculales植物的BBE聚成同一分支。此外基因表达分析显示PaBBE在所有测试的P. amurense组织中都是沉默的图S32。这一数据表明这种药用植物中可能存在未知的机制。为了验证这一点我们挖掘了基因组和转录组序列揭示了与小檗碱积累模式相关的CYP71BG成员。比较基因组分析发现一方面Ranunculales基因组中没有注释CYP71BG成员另一方面这些基因来自基因组扩展。这些数据为PaCYP71BG29催化的小檗碱桥形成和生物合成步骤提供了证据表明这可能是P. amurense独立进化的结果。此外我们的生化实验显示CYP71BG酶参与了与植物发育和应激反应相关的植物胺血清素和褪黑激素的生物合成。系统发育分析表明CYP71BG成员的明显扩展和正向选择导致了Phellodendron中CYP71BG29的新功能化。
9OMTPaOMT1和BBECYP71BG29在黄柏染色体8上形成一个生物合成基因簇该基因簇进一步经历了WGD1和WGD2事件扩展了N-甲基化的PaNOMT7和PaNOMT9图S33这与小檗属植物中小檗碱生物合成基因的分散分布不同。此外4′OMTPaOMT3和6OMTPaOMT4和PaOMT5在染色体20上聚集在一起WGD事件也加速了共线性OMT的扩展。我们还发现小檗碱生物合成基因在黄柏和花椒中是保守的CYP450和OMT基因的重复和新功能化发生在它们与柑橘分开之后图S33。小檗碱生物合成基因簇及其重复事件扩展了我们对代谢基因簇形成和独立进化的理解43。
植物专用代谢物被视为复杂性状可以通过研究其进化轨迹来理解44。相同的代谢特征经常在远缘物种中独立进化出现包括平行进化和趋同进化。例如金丝菊和大麻中由同源酶催化的大麻素生物合成的平行进化45。尽管多项研究已报道了咖啡因39、藏红花色素46和稻米乳酸酮47生物合成的趋同进化但它们在不同谱系中的生物合成酶可能具有同源关系。参照平行进化和趋同进化的区别48我们的研究展示了一个经典的趋同进化案例在两个远缘谱系中——小檗属和黄柏两个完全非同源的酶和不同的蛋白质折叠尤其是具有NMT催化功能的OMT基因和具有小檗碱桥酶活性的CYP450基因。这些数据表明酶的新功能化是推动结构修饰和多样化的驱动力。
总之我们报告了黄柏的高质量基因组并解密了一个替代的小檗碱生物合成途径特别是识别了N-甲基化OMT基因和由CYP450催化的小檗碱桥活性。所识别的小檗碱生物合成步骤来源于WGD事件和新功能化。这些发现揭示了小檗属和黄柏物种中小檗碱生物合成的趋同进化模型。此外我们的研究增强了我们对小檗碱生物合成酶的理解为工程化具有多种药理活性的复杂BIA药物提供了支持。
材料与方法
植物材料与化学标准
黄柏P. amurense植物生长在中国哈尔滨东北林业大学的研究站内。新鲜的黄柏叶片被收集后迅速放入液氮中并储存于-80°C冰箱中以供基因组测序。新鲜的黄柏根部被收集并分成两个部分一个部分在液氮中冷冻用于代谢物提取另一个部分用于MSIMALDI-MSI分析。其他16种植物的根和/或茎以及荷花N. nucifera的干莲子芽也被收集用于代谢分析表S1。所有化学标准如表S11所列均从不同公司购买。
代谢物的LC-MS分析
所有样品含三次重复在50°C下烘干后研磨成细粉并通过60目筛过滤。称取200 mg细粉放入15 ml玻璃管中加入10 ml甲醇:水混合液6:4v/v并漩涡混合1分钟。然后在室温下静置过夜并在超声波清洗机240 W、40 Hz中超声处理40分钟。玻璃管在9000g下离心10分钟收集上清液中的代谢物转移到清洁管中用于代谢物分析。接着超声清洗后的上清液再次在12,000g下离心10分钟所得的干净上清液转移至1.5 ml管中并通过0.22 μm滤膜过滤。
样品通过SHIMADZU UPLC-QTOF-MS系统进行检测LCMS-9030配有SHIMADZU GIST C18色谱柱2 μm2.1 mm x 100 mm。流动相由0.1%甲酸水溶液A和乙腈B组成线性梯度洗脱程序如下0到1分钟15% B1到8分钟15%到45% B8到10分钟45%到80% B10到11分钟80%到15% B11到14分钟15% B。流速为0.2 ml/min柱温为40°C。质谱仪在数据依赖采集模式下操作电喷雾电离ESI源在正离子模式下运行m/z 100到700。气体温度维持在400°C气体流量为10升/分钟碎片电压设置为120 V碰撞能量为20到40 eV。
MALDI成像
黄柏的冷冻根部被包裹在5%的羧甲基纤维素w/v中然后使用干冰将其固化为块状。冷冻根部在-20°C下被切割成30 μm厚的切片切片立即粘附于涂有铟锡氧化物的玻片上以供后续成像分析。与此同时将60 mg 2,5-二羟基苯甲酸DHB溶解在2 ml甲醇和水的混合液中含0.1%三氟乙酸比例为7:3v/v49。所得的DHB溶液用于正模式MALDI实验。所有测量使用与Orbitrap质谱仪“Q Exactive”Thermo Fisher Scientific德国不来梅耦合的AP-SMALDI离子源“AP SMALDI10”TransMIT GmbH德国吉森进行。简而言之使用固态激光λ 343 nm重复频率为2000 Hz用于在正离子模式下分析样品。使用DHB矩阵增加电离效率。全扫描模式下的测量速率扫描范围m/z 150到1400约为1.5秒/像素质量分辨率为70,000分辨率对应m/z 200时的质量精度为2 ppm。MSI分析的空间分辨率为30 μm。数据分析使用MirionV3软件进行。
基因组测序、调查与组装
使用DNeasy Plant Mini KitQIAGEN德国从冷冻叶片中提取高质量基因组DNA样品。通过NanoDrop分光光度计Thermo Fisher Scientific美国评估和测量DNA样品的质量和数量。DNA样品被消化为20-kb大小。然后使用SMRTbell模板准备试剂盒构建DNA文库。简要而言根据制造商的协议DNA文库构建步骤包括DNA浓缩、损伤修复、末端修复、发夹接头连接和模板纯化。基因组测序的环状共识测序数据是在PacBio Sequel II平台Pacific Biosciences美国上产生的遵循制造商的协议。所获得的DNA序列用于下面描述的基因组组装。所有比较包括三次独立的生物学重复实验。 从冷冻叶片、茎和根中提取总RNA样品使用RNAprep Pure Plant KitTIANGEN中国。随后使用Qubit RNA Assay Kit和Agilent 2100 BioanalyzerAgilent Technologies评估RNA样品的质量。RNA测序在Novogene使用Illumina HiSeq 2500平台进行以生成150-bp配对末端读段。使用ProximoTM Hi-C Plant试剂盒从P. amurense的新鲜叶片中构建了Hi-C文库。cDNA文库在Illumina HiSeq平台上进行测序生成150-bp的长读段。使用Illumina数据根据K-mer分布分析K 21估算P. amurense的基因组大小。过滤PacBio Sequel读段以去除短的和低质量的读段。结果高质量的读段用于使用Hifisamv0.19.5进行de novo组装采用默认参数50。使用Purge_dupsv1.2.551去除组装的contig序列的杂交。使用ALLHiCv0.9.852根据Hi-C数据生成一个支持等位基因的染色体级基因组。
基因注释与质量评估
基因注释通过de novo预测、同源蛋白证据和EST证据方法完成。组装后RNA测序RNA-seq数据通过HISAT2v2.2.153映射到基因组上。对于ab initio预测AUGUSTUS模型通过BRAKER2v2.1.554使用RNA-seq数据训练。此外结合同源证据的ab initio预测与MAKER管道结合生成最终的基因模型。使用BUSCOv5.2.255和embryophyta_odb10数据库评估基因组的完整性。注释后使用Tandem Repeat Finderv4.0756预测串联重复。LTR_retrieverv2.657、LTR_FINDERv1.0.657和RepeatModelerv2.0用于构建重复序列数据库。对于de novo预测生成的LTR和通过RepeatModeler生成的共识重复文库被合并并作为RepeatMasker的输入数据。
比较基因组分析
使用P. amurense和其他14个已测序植物物种包括Z. armatum58, 59、Murraya exotica60、C. clementina61、Atalantia buxfoliata62、Melia azedarach63、Pistacia vera64、Acer yangbiense65、V. vinifera66、Macleaya cordata67、C. chinensis15、Annona cherimola68和一个外群物种[Amborella trichopoda69]的同源基因组群进行系统发育分析。使用OrthoFinderv2.3.1170获得15个物种中的单拷贝家族采用默认参数。通过RAxMLv8.0.1770使用最大似然方法并进行1000次自举重复构建了包含221个单拷贝同源基因的系统发育树。使用PAMLv4.971中的MCMCTREE估计15个物种之间的分歧时间校准点来自TimeTree数据库www.timetree.org。校准点包括P. amurense和C. clementina之间的分歧25到69百万年、M. azedarach与P. vera63到105百万年、A. yangbiense与V. vinifera110到124百万年、A. cherimola与A. trichopoda180到205百万年。 使用CAFEv4.2.172分析了基因家族的扩展与收缩。基于Gene Ontology和京都基因与基因组百科全书数据库使用R包ClusterProfilerv4.073分析了扩展基因家族的功能富集。
WGD分析
使用MCScanPython版本和默认参数建立基因组内和基因组间的同源区块。基于检测到的同源基因对识别同源区块并使用Whole-Genome Duplication IdentifierWGDI管道v0.6.574估算共线基因之间的Ks值。此外为了检测P. amurense基因组中可能的多倍体化遗迹使用MCScan识别了P. amurense、Z. armatum和C. clementina基因组内的同源基因区块。基于C. clementina基因组提取每个区块的共线基因并使用IQ-TREE2v2.2.2.775构建共线基因树。基因树作为输入上传到ASTRALv5.6.176推断子基因组系统发育。最后使用ksrates包GitHub - VIB-PSB/ksrates: ksrates is a tool to position whole-genome duplications relative to speciation events using substitution-rate-adjusted mixed paralog-ortholog Ks distributions.根据调整后的混合图追踪平行基因和同源基因的Ks分布追踪WGD事件。
候选基因的鉴定与相关性分析
报告中的生物碱BIA生物合成基因包括NCS、MTs和CYP450被选作查询序列并通过BLASTp在P. amurense、Z. armatum和C. clementina基因组中进行同源基因的鉴定E值为1 × 10−10。简而言之选用Papaver somniferum中的PsNCS1AAX56303.1和PsNCS2AAX56304.1、C. japonica中的CjNCSBAF45338.2、T. flavum中的TfNCSACO90248.1作为查询序列鉴定候选的NCS编码基因。P. somniferum中的Ps6OMTAAQ01669.1以及C. japonica中的Cj6OMTBAB08004.1、Cj4′OMTBAB08005.1和Cj9OMTBAA06192.1作为查询序列用于鉴定OMTs的同源基因。C. japonica中的CjNMTAB061863.1作为查询序列用于鉴定NMTs。C. japonica中的CjCYP719A1BAB68769.1、CjCYP80B2BAB12433.1、CjCYP80G2BAF80448.1、P. somniferum中的PsCYP80B1AAF61400.1和PsCYP719B1ABR14720.1、Berberis stolonifera中的BsCYP80A1AAC48987.1作为查询序列根据命名规则鉴定候选的CYP450亚家族身份比 55%。
基于P. amurense的转录组PRJNA859281和代谢组数据利用候选基因的标准化表达水平与berberine的含量水平分析了Pearson相关系数r。筛选出与候选MTs和CYP450s基因表现出高相关性r 0.8的基因用于功能验证。然后进一步选择功能基因作为诱饵通过共表达分析选择额外的候选基因。
MTs基因在大肠杆菌中的异源表达与功能验证
候选的MT基因被克隆或合成并克隆到pET-28a载体中见表S12。随后将得到的阳性重组质粒导入大肠杆菌BL21DE3菌株。每个载体的阳性克隆都被选中并诱导重组蛋白的表达。开发了一种通用协议来表达每个候选基因并生产其重组蛋白。选中阳性克隆接种20 ml含有50 μg/ml卡那霉素的液体Luria-BertaniLB培养基中放置于250 rpm/min、37°C的摇床上。当细胞悬液的光密度OD600达到0.6时加入异丙基-β-d-硫代半乳糖苷IPTG0.3 mM以诱导蛋白表达。加入IPTG后将培养箱温度设为16°C。培养过夜后通过离心8000g5分钟4°C收获细胞。将沉淀重悬于1 ml含有50 mM tris-HCl缓冲液pH 7.4、10%v/v甘油和5 mMβ-巯基乙醇的溶液中。通过超声破碎冰上培养5分钟。将裂解液以8000g离心10分钟收集上清液并存储于−20°C进行酶活性检测。
为了纯化候选的重组蛋白增大了每个重组载体的大肠杆菌培养体积至100 ml LB培养基。其他条件保持一致。将沉淀重悬于30 ml裂解缓冲液pH 8.050 mM NaH2PO430 mM NaCl和10 mM咪唑中。提取步骤与小规模提取相同。得到的30 ml上清液加载到Ni-NDA柱Ni-NDA BeadsSmart-Lifesciences中国上进行重组蛋白纯化。为结晶纯化进一步使用凝胶过滤色谱法与150 mM NaCl和20 mM HepespH 8.0平衡进一步纯化蛋白最终通过Amicon Ultra-15 Ultracel-30 K离心过滤器Merck Millipore浓缩蛋白。使用蛋白定量试剂盒TransGen Biotech中国测定蛋白浓度并通过SDS-聚丙烯酰胺凝胶电泳SDS-PAGE评估纯度。
MTs的酶活性在37°C、200 rpm摇动下的100 μl反应体系中进行过夜反应反应体系包括Gly缓冲液pH 9.010 μg纯化蛋白2 mM SAM底物S-norcoclaurine、S-coclaurine或S-scoulerine浓度为50 μg/ml或3′-hydroxy-N-methylcoclaurine浓度为20 μg/ml反应结束后加入50%甲醇v/v终止反应。选择Cc6OMT、Cc4′OMT、Cc9OMT、CcNMT作为阳性对照空载体作为阴性对照。
通过超高效液相色谱-串联质谱UPLC-MS/MS检测反应样本。UPLC-MS/MS系统SCIEX TripleTOF 6600配备三重四极体-线性离子阱质谱仪。简而言之1 μl提取液注入后使用Kinetex C18 100A分析柱4.6 mm×150 mm2.6 μm进行分离柱温设为35°C。流动相包括A相0.1%甲酸和B相乙腈。梯度程序如下0至1分钟10%B1至10分钟10至95%B12.3至13分钟95%B13至15分钟95至10%B流速为0.5 ml/min。质谱仪工作在多重反应监测模式下扫描时间为每个转移35 ms。质谱仪的参数设置如下正离子模式ESI模式喷雾电压为3.5 kV喷雾温度为550°C气帘气体为35 psiGAS1为40 psiGAS2为60 psi。
S. cerevisiae中CYP450基因的异源表达与功能验证
为了验证候选CYP450的活性选择了转基因的酿酒酵母Saccharomyces cerevisiae WAT11包含拟南芥细胞色素P450还原酶AtCPR1作为异源表达宿主。候选CYP450基因被克隆或合成并克隆到pESC-His载体中引物见表S12然后转入S. cerevisiae WAT11中。筛选阳性酵母菌落表达CYP450蛋白。经过培养和诱导后酵母细胞被收获、破碎并进行差速离心得到微粒体具体操作参考之前的研究。
对于酶活性检测选择表达pESC-His空载体的酵母作为阴性对照。反应体系包括200 μl微粒体、0.5 mM还原型烟酰胺腺嘌呤二核苷酸磷酸和1 μl底物1 mg/ml在30°C下孵育2小时。反应样本经过离心和过滤后使用Agilent UPLC-QTOF-MS检测。UPLC-QTOF-MS系统配备ACQUITY UPLC HSS-T3 C18柱1.8 μm2.1 mm×100 mm流动相包括水中0.1%甲酸A和乙腈B线性梯度洗脱程序如下0至2分钟5%B2至10分钟5至18%B10至15分钟18至95%B15至17分钟95%B。流速设为0.3 ml/min柱温设为40°C。质谱仪使用Agilent 6430 QTOF工作在正离子模式下扫描范围为m/z 100到800气体温度保持在350°C气流速率为8升/分钟碎片电压设置为120 V碰撞能量为20 eV。
PaCYP71BG29在本氏烟草中的瞬时表达
为了进一步验证PaCYP71BG29在体内的功能活性该基因被克隆至pEAQ-eGFP载体中并转化至根癌农杆菌Agrobacterium tumefaciensGV3101。阳性克隆在10 ml含有卡那霉素和利福平的LB培养基中培养。培养物以5000g离心5分钟沉淀重悬于渗透缓冲液10 mM MES缓冲液、10 mM MgCl₂和150 μM乙酰香豆素并在28°C黑暗条件下孵育1小时。将Agrobacterium悬液每个菌株OD600为0.3至0.6渗透入5至6周龄的本氏烟草叶片。3天后将底物5和750 μM溶解于0.1%二甲基亚砜水溶液中渗透入先前经根癌农杆菌渗透的叶片背面。1天后收集叶片进行LC-MS/MS分析。生物学重复包括从三条不同基因型中收集的三至四片叶子。使用空载体渗透的叶片和无底物的候选基因作为对照。
PaNOMT9的结晶与突变分析
为了对PaNOMT9/4/SAM复合物进行结晶纯化的PaNOMT9蛋白20 mg/ml与5 mMS-coclaurine4和5 mM SAM共同孵育。然后通过静滴气相扩散法在4°C下生长晶体。沉淀剂井液由20% w/v PEG1000、100 mM硫酸锂一水合物和100 mM柠檬酸三钠二水合物pH 5.5组成。晶体逐渐转移到含有25%甘油的沉淀剂井液中然后在液氮中快速冷冻以存储。所有数据集均在上海同步辐射光源SSRFBL18U1束流线的低温条件下100 K收集结构通过分子置换法使用搜索模型6I70进行求解。然后使用Phenix软件进行模型优化77并在Coot软件中手动建模78。最终结构的优化结果显示工作R因子Rwork为15.9%自由R因子Rfree 19.3%几何学良好见表S13。
通过基因拼接重叠扩增PCR方法构建了PaNOMT9中选定残基的突变体并使用底物4进行突变体活性测试进行三次重复。