K-Means聚类分析法筛选柠檬香茅茎叶差异蛋白及鉴定
黄惠明, 李珊珊, 李海明, 吴水金, 李跃森, 林洪涛, 郑开斌*
福建省农业科学院亚热带农业研究所 福建 漳州 363000
通讯联系人:郑开斌,研究员; Tel:0596-2122116; E-mail:409119296@qq.com; 研究方向:农产品天然产物研究,活性成分提取工艺
摘要

柠檬香茅含有大量的香茅精油,运用十分广泛,然而其茎、叶的精油含量却相差悬殊。 为探索柠檬香茅精油代谢相关的蛋白途径,本文对柠檬香茅旗叶、成熟叶及茎秆等材料进行精油含量、总蛋白含量测定及双向凝胶电泳(2-DE)表达谱分析,运用k-means聚类分析方法对2-DE电泳中差异蛋白斑点的丰度、等电点和相对分子质量进行聚类分析和讨论,结果表明,旗叶和茎秆上调表达的蛋白质斑点的聚类对于相对分子质量变化敏感,成熟叶上调表达蛋白质斑点对于丰度的变化较为敏感。 预测了精油代谢功能相关的蛋白质斑点15个,挖取预测蛋白质斑点通过基质辅助激光解吸电离飞行时间质谱(MALDI-TOF/TOF-MS)成功鉴定了9个蛋白质。 本研究为柠檬香茅精油的蛋白代谢途径提供新的基础信息及研究思路。

关键词: 柠檬香茅; 双向凝胶电泳; K-means聚类分析; 质谱鉴定
中图分类号:O652.7 文献标志码:A 文章编号:1000-0518(2020)04-0455-09
Screening and Identification of Differential Proteins in Cymbopogon citratus Stems and Leaves by K-Means Clustering Analysis
HUANG Huiming, LI Shanshan, LI Haiming, WU Shuijin, LI Yueshen, LIN Hongtao, ZHENG Kaibin
Subtropical Agricultural Research Institute,Fujian Academy of Agricultural Sciences,Zhangzhou,Fujian 363000,China
Corresponding author:ZHENG Kaibin, professor; Tel:0596-2122116; E-mail:409119296@qq.com; Research interests:natural products of agricultural productions, extraction process of active ingredients
Abstract

The lemongrass plant contains a huge amount of essential oil which had a wide application. It was found that there were great differences between the stem and leaves of lemongrass in essential oil yields. In this paper, we investigated the differential expression protein spots in two-dimensional electrophoresis (2-DE) of lemongrass stem and leaves via K-means clustering. Three parts of lemongrass, flag-leaf, mature-leaf and stem, which were significant different in essential oil contents, were taken to detect the total protein content and analysize the protein expression profiles by 2-DE. K-means clustering of different protein spots was carried out on abundance, isoelectric point (pI) and molecular mass. It was found that the total protein content of flag-leaf and mature-leaf was higher than that of stem, and the total protein content of flag leaf and mature-leaf had little difference. Cluster analysis of the abundance, isoelectric point (pI) and molecular mass of different protein spots in three parts of lemongrass showed that the up-regulated protein spots in flag-leaf and stem were sensitive to molecular weight changes, and the up-regulated protein spots in mature-leaf were more sensitive to abundance changes. Based on this, 15 protein pots were selected and 9 proteins were successfully identified by matrix-assisted laser desorption/ionization (MALDI-TOF/TOF-MS). Our study provides new basic information and research perspective of protein pathway of Cymbopogon citratus essential oil metabolism.

Keyword: lemongrass; two-dimensional electrophoresis; K-means clustering analysis; mass spectrometric identification

柠檬香茅,也被称为香茅草( Cymbopogon citratus)、柠檬草( Lemongrass),禾本科香茅属植物,富含香茅精油。 因具有特殊的柠檬香味,在世界范围内特别是在东南亚国家和地区颇受欢迎[1]。 常用于茶、咖喱、鱼和牛肉的烹调以及香茅精油的提取。 研究发现,香茅精油具有抑制细菌生长[2]、驱虫[3]、抗氧化[4]等特殊功效。

蛋白质作为生命体的重要组成之一,是大部分生理活动的执行者,其内在性质、丰度差异及分布规律等特性与植物的基因表达及次生代谢活动等密切相关[5]。 双向凝胶电泳技术(2-Dimensional gel Electrophoresis,2-DE)是传统的蛋白质差异表达分析技术,在蛋白质组学研究中应用非常广泛[6]。 通过将研究对象不同生长状态、不同发育阶段的蛋白质进行动态差异分析,可获得生物体蛋白质调节及相互作用的重要信息,了解相关代谢活动的生理机制[7,8]

K-means聚类分析[9],作为一种无监督学习的大数据处理方法,重点在于对数据相似性的挖掘。 通过计算数据对象之间的关系,将数据进行分组,同一个子集中的对象具有相似的属性。组内的相似性越大,组间的差别越大,则聚类效果越好[10]

目前柠檬香茅精油代谢相关的蛋白途径尚不清楚,相关研究尚未见报道。 本研究使用K-means聚类分析的方法对柠檬香茅旗叶、成熟叶片及茎秆等不同部位差异蛋白质点进行聚类分组。 预测与精油代谢相关的蛋白质,并对预测蛋白质点进行鉴定和功能分析,为柠檬香茅相关的蛋白途径研究提供基础信息和新的思路。

1 实验部分
1.1 试剂和仪器

实验所用柠檬香茅种植于福建漳州,原种引自广东。植物蛋白提取液( c(KCl )=100 mmol/L, c(EDTA)=500 mmol/L, c(蔗糖)=700 mmol/L, c(Tris )=500 mmol/L,HCl 调至pH=7.5);Tris饱和酚(Tris-HCl、苯酚,pH=7.5);醋酸铵甲醇溶液(100 mmol/L);以上试剂均为市售分析纯。 Bradford染液(考马斯亮蓝G-250,595 nm);胎牛血清标准品BSA(Sigma,美国)。 2-DE过程使用的干胶条(24 cm,pH 4~7)、水化盘(Immobile Drystrip Rewelling Tray)、干胶条溶涨盒(IPGbox)、等电聚焦仪(Ettan IPGphor 3)、玻璃板(所配制的胶的规格为:24 cm×19 cm×1 mm)、电泳槽(Ettan DALT six)、图像分析软件(Image Master 2d Platinum 5.0)等均购自美国通用GE公司。 ScanMaker i800型扫描仪(上海中晶公司)。 数据统计分析软件使用美国IBM公司的SPSS Statistics 17.0。 Hema TGL-18R型真空干燥仪冷冻离心机(珠海黑马医学仪器有限公司);JY96-II n型超声仪(宁波新芝生物科技股份有限公司);Spectrum SHANHAI 765Pc型分光光度计(上海光谱仪器有限公司).

差异蛋白质的基质辅助激光解吸电离飞行时间质谱(MALDI-TOF/TOF MS 5800,AB Sciex,美国)鉴定分析工作由上海生工生物公司完成。

蛋白质功能分析采用InterPro 75.0(https://www.ebi.ac.uk/interpro/)。

1.2 实验方法

1.2.1 柠檬香茅蛋白质的提取、纯化及定量

分别取柠檬香茅3组不同部位组织进行蛋白质提取,Ⅰ组(旗叶)、Ⅱ组(成熟叶)、Ⅲ组(茎秆)。 其中Ⅰ组(旗叶)采自柠檬香茅抽芽期第1片叶子,Ⅱ组(成熟叶)采自柠檬香茅第5~6片叶片,Ⅲ组(茎秆)为柠檬香茅叶片以下白色部分。

总蛋白的提取 将样品在液氮中充分研磨后,依次加蛋白入提取液、Tris饱和酚,充分振荡后于冰上保温,5 min振荡1次,共4次;然后于4 ℃,6000 r/min离心20 min,吸出上层酚相,加入等体积的提取液,充分振荡后于冰上保温,5 min振荡1次,共6次,然后于4 ℃,5000 r/min,离心30 min,吸出上层酚相,转移。 重复操作2次。 加入最后得到的酚体积5倍的醋酸铵甲醇溶液对蛋白进行沉淀,充分振荡后置于冰上保温,隔5 min振荡1次,共6次,置于-20 ℃沉淀过夜。

蛋白纯化 将沉淀过夜的蛋白质于4 ℃,5000 r/min离心30 min,弃去上清液,加入5 mL甲醇对蛋白进行洗涤,除去蛋白中的色素及盐,于4 ℃,5000 r/min离心30 min。 重复操作2次。 加入丙酮对蛋白进行洗涤,于4 ℃,5000 r/min离心30 min。 重复操作2次。 使用丙酮再次溶解,于4 ℃,12000 r/min离心20 min。 弃去上清液,室温干燥,即得到纯化处理后的蛋白质团块,置于-80 ℃保存备用。

采用Bradford检测法(考马斯亮蓝G250法)进行定量分析[11]

1.2.2 凝胶双向电泳、成像扫描及图谱分析

第一向等电聚焦程序为:S1快速,500 V 1 h;S2线性,1000 V 1 h;S3线性,10000 V 3 h;S4快速,10000 V 4 h;整个聚焦过程所用总电压:约60 kV·h。 第二向电泳程序为:S1 2 W/gel,60 min;S2 17 W/gel直到溴酚蓝跑到底,约4.5 h。 电泳结束后采用考马斯亮蓝染色。

将染色完成后的凝胶置于扫描仪上,扫描模式为256灰阶透视扫描,分辨率为200 dpi。 采用image master 2D platinum 5.0图像分析软件进行点识别、背景消除、斑点匹配、差异蛋白分析。

2 结果与讨论
2.1 总蛋白质含量测定

取5、10、15、20、25、30和35 μg的BSA制作标准曲线,样品取2 μL。 定量分两次进行,第一次为初步定量,计算得到各样品的浓度后,将所有样品浓度尽量调至比较接近,再进行第二次定量。 获得标准曲线(图1)方程为 y=0.0118 x+0.3608,相关性系数 R2=0.9919。

图1 蛋白质含量测定标准曲线Fig.1 The standard curve of the protein content

分别取Ⅰ、Ⅱ及Ⅲ组新鲜样品,各进行蛋白质含量测定,结果如表1所示。

表1 各部位蛋白质含量测定结果 Table 1 Determination results of protein content in different parts of lemongrass
2.2 凝胶双向电泳

不同部位蛋白双向电泳结果如图2所示,3个不同部位蛋白斑点较为均匀且随机地分布在pI 4~7之间、相对分子质量在0.5×104~1.7×105区间,被检测到的蛋白斑点数目分别为Ⅰ(480±37)、Ⅱ(298±26)和Ⅲ(537±60)。

图2 不同部位蛋白质双向电泳图谱(部分上调表达蛋白斑点序号已在图中标注)Fig.2 2-DE maps of proteins in different plant parts of Cymbopogon citrates
A, B and C represent flag-leaf, mature-leaf and stem, respectively. Some order numbers of up-regulated protein spots have been marked in the figure

2.3 差异蛋白质斑点分析

表2显示的是3个不同部位匹配蛋白中差异蛋白斑点(具有相同生物学功能,但在不同植物组织中表达量不同的蛋白)数量的信息,其中106倍以上差异斑点为在一组中被检测到,而另一组中未被检测到的点。 可以看到,在柠檬香茅细胞中,旗叶、成熟叶和茎秆之间差异的蛋白斑点数目有上升的趋势,即:[Ⅰ:Ⅱ]<[Ⅰ:Ⅲ]<[Ⅱ:Ⅲ]。

表2 柠檬香茅3个不同部位差异蛋白斑点信息 Table 2 Information of differential protein spots of 3 plant parts of Cymbopogon citratus
2.4 柠檬香茅蛋白质累积分布规律

蛋白质含量及差异蛋白质检测结果表明,旗叶及成熟叶片的蛋白质含量相当,大于茎秆的蛋白质含量;旗叶及茎秆的蛋白斑点数目多于成熟叶片的蛋白斑点数目,旗叶及茎秆的蛋白斑点数量相差不大,说明叶片是香茅蛋白质主要的累积部位。 柠檬香茅的蛋白质累积规律尚未见报道,此结果与同为禾本科植物的小麦其叶片及茎秆蛋白质累积规律基本一致[12]

2.5 组间差异蛋白质斑点的比较分析

旗叶与成熟叶之间蛋白斑点的匹配率达到96.07%,在基本生理功能相同的情况下这种现象是可以理解的。 二者之间的主要差别在于旗叶属叶片的抽芽阶段,幼叶细胞分裂旺盛,质地柔嫩,精油含量较低;而成熟叶片其叶面积停止增长,进入光合营养最旺盛阶段,同时也是精油合成最为旺盛的时期[13]。 故推测Ⅰ组内相对Ⅱ组1.5倍及2倍以上差异点,暗示这类蛋白多为参与细胞生长分裂相关的蛋白质,Ⅱ组内相对Ⅰ组1.5倍及2倍以上差异点,暗示这类蛋白参与了精油代谢相关功能(分泌、运输、贮藏等)的可能性较大(2倍以上26个,1×105倍以上6个)。

旗叶与茎秆之间蛋白斑点的匹配率也达到93.79%,成熟叶与茎秆之间蛋白斑点的匹配率低于90%(89.47%),考虑到茎秆部分较少参与光合作用等物质合成活动,主要功能为水份及营养物质的存储及运输[14],且仍有细胞在进行分裂及分化,故Ⅲ组内相对Ⅰ组1.5倍及2倍以上差异点,暗示这些蛋白可能更多的参与了水分及营养物质运输等相关活动[15]

结合比较旗叶对茎秆(Ⅰ:Ⅲ)与成熟叶对茎秆(Ⅱ:Ⅲ)二组内1.5倍及2倍以上差异点的分析(Ⅰ上调表达10.07%,Ⅱ上调表达16.05%),因此在本实验中柠檬香茅叶片细胞内有约10%~16%左右的蛋白质参与了光合作用及精油合成等相关活动。 同时,考虑成熟叶片与旗叶之间存在10.19%的差异斑点,我们推测,成熟叶片内约有5%~6%左右的蛋白质参与了精油代谢相关活动。

2.6 差异蛋白斑点的聚类分析

使用SPSS Statistics 17.0软件对柠檬香茅3个不同差异蛋白斑点的丰度、等电点和相对分子质量进行K-means三维聚类分析,将差异斑点大致分为3个簇,结果如图3所示(当生成4个以上的簇时,由于供分析差异斑点数量少,聚类较为松散)。 可以观察到:各组间差异蛋白质斑点较为随机的分布在pI 4~7之间,对等电点(pI)并不敏感,不会随其变化而产生聚集。说明柠檬香茅中高丰度表达的蛋白质与等电点(pI)关联性并不强。

图3 不同差异蛋白斑点的聚类分析图Fig.3 Cluster analysis diagrams of differential protein spots of different plant parts
●dots, ■ dots and ▲ dots represent cluster 1, cluster 2 and cluster 3, respectively
Diagram A, B, B, D, E and F, represent the up-regulated protein spots of each contrast groups: flag leaf in [Ⅰ:Ⅱ ]; mature leaf in [Ⅰ:Ⅱ]; flag leaf in [Ⅰ:Ⅲ]; stem in [Ⅰ:Ⅲ]; mature leaf in [Ⅱ:Ⅲ]; stem in [Ⅱ:Ⅲ] respectively

表3-5中可知:旗叶(Ⅰ组)上调表达的蛋白质相对分子质量在1.0×104~1.3×105,且随相对分子质量增大聚集成3个簇(1.0×104~5.0×104、5.0×104~1.0×105、1.0×105~1.3×105),多集中于低相对分子质量区域(5.0×104左右),且低相对分子质量的蛋白斑点数量最多(22\24;40\11)。 茎秆(Ⅲ组)上调表达的蛋白质相对分子质量在1.0×104~1.8×105,随相对分子质量增大聚集成3个簇(1.0×104~5.0×104、5.0×104~1.0×105、1.0×105~1.8×105),在与旗叶(Ⅰ组)对比时,上调表达的蛋白斑点主要集中于5.0×104(相对分子质量聚类中心为4.01×104)。 在与成熟叶(Ⅱ组)对比时,上调表达的蛋白斑点主要集中于3.00×104(相对分子质量聚类中心为3.85×104)。 二者聚类中心几乎一致。显然,旗叶(Ⅰ组)与茎秆(Ⅲ组)上调表达的蛋白质斑点对于相对分子质量变化较为敏感,与其中存在细胞分裂分化等生理活动旺盛有一定关系。

表3 旗叶与成熟叶组间上调表达斑点聚类中心及斑点数 Table 3 Clustered centers and spots number of flag-leaf and mature-leaf groups
表4 旗叶与茎秆组间上调表达斑点聚类中心及斑点数 Table 4 Clustered center and number of spots of flag-leaf and stem groups
表5 成熟叶与茎秆组间上调表达斑点聚类中心及斑点数 Table 5 Clustered center and number of spots of mature-leaf and stem groups

相较而言,成熟叶(Ⅱ组)的差异蛋白质斑点的聚类对于丰度的反应较为敏感,在同旗叶(Ⅰ组)对比时,上调表达的蛋白斑点主要集中于丰度20%~40%(丰度聚类中心为33.19%)、50%~80%(丰度聚类中心为60.45%)2个区间。 在与茎秆(Ⅲ组)比较时,上调表达的蛋白斑点主要集中于丰度20%~40%(丰度聚类中心为35.23%)、50~80%(丰度聚类中心为60.79%)2个区间。二者聚类中心十分相近。 其中在成熟叶与旗叶的对比组中(B:A)差异蛋白斑点占总蛋白质斑点(簇1:等电点pI 5.35、相对分子质量2.73×104、丰度33.19%)的比率为4.63%(接近5%),考虑为参与精油代谢相关活动的蛋白质聚类区域(见表6)。

表6 预测精油代谢相关蛋白质斑点 Table 6 Prediction of essential oil metabolism related protein spots
2.7 差异蛋白质鉴定结果

上述预测差异蛋白质点,经过挖点、脱色、胶内酶解及肽段抽提等处理,进行MALDI-TOF/TOF-MS分析,成功鉴定出9个蛋白质点。 根据Inter Pro 75.0功能预测分析,这些蛋白质可分为代谢相关的酶类、应激反应相关蛋白、光合作用、氧化还原过程、能量代谢相关蛋白等。 结果见表7

表7 蛋白质鉴定及功能分析结果 Table 7 Results of protein identification and functional analysis
3 结 论

从研究的结果看,探索柠檬香茅精油代谢过程的分子机制,适宜以成熟叶片细胞为材料。 本实验发现旗叶及茎秆的蛋白含量百分比多于成熟叶片,旗叶及茎秆的蛋白含量相当。 对于不同植物部位差异蛋白质点的丰度、等电点和相对分子质量的K-means聚类分析:旗叶和茎秆上调表达蛋白质点的聚类对于相对分子质量变化敏感,推测应与旗叶中存在旺盛的细胞分裂、分化等生理活动有关;成熟叶片上调表达蛋白质点对于丰度的变化较为敏感。从聚类分析分组中筛选蛋白质点簇进行鉴定和功能分析,成功鉴定出9个蛋白质,可分为代谢相关的酶、应激反应相关蛋白、光合作用、氧化还原过程、能量代谢相关蛋白等。

参考文献
[1] Shah G, Shri R, Panchal V, et al. Scientific Basis for the Therapeutic Use of Cymbopogon citratus, Stapf (Lemon Grass)[J]. J Adv Pharm Technol Res, 2011, 2(1): 3-8. [本文引用:1]
[2] Adukwu E C, Bowles M, Edwards-Jones V, et al. Antimicrobial Activity, Cytotoxicity and Chemical Analysis of Lemongrass Essential Oil ( Cymbopogon flexuosus) and Pure Citral[J]. Appl Microbiol Biotechnol, 2016, 100(22): 9619-9627. [本文引用:1]
[3] SONG Xingchen, LI Dongxue, REN Yafeng, et al. Research Progress on Applying of Essential Oil of Cymbopogon Plant to Control Agricultural Pest[J]. China Plant Prot, 2018, 38(7): 25-33(in Chinese).
宋星陈, 李冬雪, 任亚峰, . 香茅属植物精油在农业病虫害控制中的应用研究进展[J]. 中国植保导刊, 2018, 38(7): 25-33. [本文引用:1]
[4] YIN Xueqiong, CHEN Junhua, LIU Fang, et al. Extraction and Antioxidant Activity of Cymbopogon citratus Essential Oil[J]. Fine Chem, 2012, 29(6): 568-571(in Chinese).
尹学琼, 陈俊华, 刘芳, . 柠檬香茅精油的提取及抗氧化活性[J]. 精细化工, 2012, 29(6): 568-571. [本文引用:1]
[5] LI Dingchen, YANG Dong, JIANG Ying, et al. Insights into the Regular Patterns of Protein Abundance Regulation and Distribution[J]. Sci Sin( Vitae), 2013, 43(1): 54-62(in Chinese).
李定辰, 杨冬, 姜颖, . 蛋白质丰度调控及整体分布的规律性认识[J]. 中国科学(生命科学), 2013, 43(1): 54-62. [本文引用:1]
[6] Wu X, Gong F, Wang W. Protein Extraction from Plant Tissues for 2DE and Its Application in Proteomic Analysis[J]. Proteomics, 2014, 14(6): 645-658. [本文引用:1]
[7] Wendrich J R, Boeren S, Möller B K, et al. In Vivo Identification of Plant Protein Complexes Using IP-MS/MS[M]//Plant Hormones: Methods and Protocols. 2017: 147-158. [本文引用:1]
[8] Xu J, Zhang S. Mitogen-Activated Protein Kinase Cascades in Signaling Plant Growth and Development[J]. Trends Plant Sci, 2015, 20(1): 56-64. [本文引用:1]
[9] Jain A K. Data Clustering: 50 Years Beyond K-Means[J]. Pattern Recognit Lett, 2010, 31(8): 651-666. [本文引用:1]
[10] Cap M, Pérez A, Lozano J A. An Efficient Approximation to the K-Means Clustering for Massive Data[J]. Knowl Based Syst, 2017, 117: 56-69. [本文引用:1]
[11] WANG Jiazheng, FAN Ming. Protein Technical Manual[M]. Beijing: Science Press, 2000: 42-46(in Chinese).
汪家政, 范明. 蛋白质技术手册[M]. 北京: 科学出版社, 2000: 42-46 [本文引用:1]
[12] HOU Youliang, L. O'Brien, ZHONG Gairong. Study on the Dynamic Changes of the Distribution and Accumulation of Nitrogen in Different Parts of Wheat[J]. Acta Agron Sin, 2001, (4): 493-499. (in Chinese).
侯有良, L. O'Brien, 钟改荣. 小麦不同器官氮素累积分布动态规律的研究(英文)[J]. 作物学报, 2001, (4): 493-499. [本文引用:1]
[13] Lee Y L, Ding P. Production of Essential Oil in Plants: Ontogeny, Secretory Structures and Seasonal Variations[J]. Pertanika J Trop Agric Sci, 2016, 2(1): 1-10. [本文引用:1]
[14] McKinley B, Rooney W, Wilkerson C, et al. Dynamics of Biomass Partitioning, Stem Gene Expression, Cell Wall Biosynthesis, and Sucrose Accumulation During Development of Sorghum Bicolor[J]. Plant J, 2016, 88(4): 662-680. [本文引用:1]
[15] LU Xuke, ZHANG Dechao, YIN Zujun, et al. Comparative Analysis of Proteomics of in Cotton( Gossypium hirsutum L. ) Leaves with Different Drought Resistance Levels under Drought Stress[J]. Acta Botanica Boreali-Occidental Sin, 2013, 33(12): 2401-2409(in Chinese).
陆许可, 张德超, 阴祖军, . 干旱胁迫下不同抗旱水平陆地棉的叶片蛋白质组学比较研究[J]. 西北植物学报, 2013, 33(12): 2401-2409. [本文引用:1]