生物信息学分析范例6篇

前言:中文期刊网精心挑选了生物信息学分析范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

生物信息学分析

生物信息学分析范文1

关键词: 生物信息学 农业研究领域 应用

“生物信息学”是英文单词“Bioinformatics”的中文译名,其概念是1956年在美国田纳西州Gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者Lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家Collins F博士在华盛顿隆重宣布人类基因组计划(Human Genome Project,HGP)的所有目标全部实现[3]。这标志着后基因组时代(Post Genome Era,PGE)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。

1.生物信息学在农业模式植物研究领域中的应用

1997年5月美国启动国家植物基因组计划(NPGI),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(HGP)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(TA)集合数据库TIGR、植物核酸序列数据库PlantGDB、研究玉米遗传学和基因组学的MazeGDB数据库、研究草类和水稻的Gramene数据库、研究马铃薯的PoMaMo数据库,等等。

2.生物信息学在种质资源保存研究领域中的应用

种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至DNA片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、AFLP、SSAP、RBIP和SNP等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。

3.生物信息学在农药设计开发研究领域中的应用

传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。ItzstEin等设计出两种具有与唾液酸酶结合化合物:4-氨基-Neu5Ac2en和4-胍基-Neu5Ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。TANG SY等学者研制出新一代抗AIDS药物saquinavir[12]。Pungpo等已经设计出几种新型高效的抗HIV-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。

现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。

4.生物学信息学在作物遗传育种研究领域中的应用

随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息学的方法,先从模式生物中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。

5.生物信息学在生态环境平衡研究领域中的应用

在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 DNA,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。

美国农业研究中心(ARS) 的农药特性信息数据库(PPD) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(Toyohashi University of Technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(IRIS) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。

6.生物信息学在食品安全研究领域中的应用

食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用PCR法[19]、RT-PCR法、荧光RT-PCR法、多重PCR[20]和多重荧光定量PCR等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、ELISA法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。

转基因食品检测是通过设计特异性的引物对食品样品的DNA提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。  生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。

参考文献:

[1]Yockey HP,Platzman RP,Quastler H.Symposium on Information.Theory in Biology.Pergamon Press,New York,London,1958.

[2]郑国清,张瑞玲.生物信息学的形成与发展[J].河南农业科学,2002,(11):4-7.

[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.

[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[J].国外科技动态,2001,1:24-25.

[5]MICHAEL B.Genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[J].PhilosTransR Soc Lond B Bio Sci,2002,357(1422):731-736.

[6]卢新雄.植物种质资源库的设计与建设要求[J].植物学通报,2006,23,(1):119-125.

[7]GUY D,NOEL E,MIKE A.Using bioinformatics to analyse germplasm collections [J].Springer Netherlands,2004:39-54.

[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.

[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.

[10]Austen M,Dohrmann C.Phenotype—first screening for the identification of novel drug targets.Drug Discov Today,2005,10,(4):275-282.

[11]ARUN AGRAWAL,ASHWINI CHHATRE.State involvement and forest cogovernance:Evidence from the IndianHmi alayas.StComp International Developmen.t Sep 2007:67-86.

[12]TANG SY.Institutionsand collective action:Self-governance in irrigation [M].San Francisco,CA:ICSPress,1999.

[13]PUNGPO P,SAPARPAKORN P,WOLSCHANN P,et a.l Computer-aided moleculardesign of highly potentHIV-1 RT inhibitors:3D QSAR and moleculardocking studies of efavirenz derivatives[J].SAR QSAR EnvironRes,2006,17,(4):353-370.

[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[J].计算机与应用化学,1999,16,(5):400.

[15]VASSILEV D,LEUNISSEN J,ATANASSOV A.Application of bioinformatics in plant breeding[J].Biotechnology & Biotechnological Equipment,2005,3:139-152.

[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[J].微生物学杂志,2008,28,(4):93-97.

[17]程树培,严峻,郝春博等.环境生物技术信息学进展[J].环境污染治理技术与设备,2002,3,(11):92-94.

[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[J].微生物学杂志,2009,29,(6):61-64.

[19]赵玉玲,张天生,张巧艳.PCR 法快速检测肉食品污染沙门菌的实验研究[J].微生物学杂志,2010,30,(3):103-105.

[20]徐义刚,崔丽春,李苏龙等.多重PCR方法快速检测4种主要致腹泻性大肠埃希菌[J].微生物学杂志,2010,30,(3) :25-29.

[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[J].微生物学杂志,2010,30,(6):71-75

[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[J].重庆医学,2010,(22):3128-3131.

[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[J].微生物学杂志,2009,29,(4):79-83.

[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[J].微生物学杂志,2009,29,(5):67-72.

生物信息学分析范文2

关键词:苹果;TCP;转录因子;全基因组分析

中图分类号:Q754文献标识号:A文章编号:1001-4942(2014)05-0012-06

TEOSINTE BRANCHED1/CYCLOIDEA/PROLIFERATING CELL FACTOR1(简称TCP)家族是一类植物特有的转录因子家族。最早发现的家族成员是玉米TB1(teosinte branched 1)基因,金鱼草CYC(cycloidea)基因和水稻PCF1、PCF2基因,这4个基因编码的蛋白都包含一段由约60个氨基酸组成的保守序列,该保守序列能形成一种非典型的螺旋-环-螺旋结构(non-canonical basic-Helix-Loop-Helix structure)[1,2,3]。根据其代表成员TB1、CYC和PCFs的首字母缩写,把能够编码这段保守氨基酸序列的基因命名为TCP基因,把这段保守的氨基酸序列命名为TCP结构域[2]。TCP结构域中的螺旋-环-螺旋区域(bHLH)含有两个由保守的亲水氨基酸构成的中性螺旋结构和一个负责连接两个螺旋区域的环结构。在第二个螺旋区域有一个特异的“LXXLL”基序,动物bHLH蛋白的研究结果表明这段基序可以通过调控转录的共激活单元结合到核定位蛋白上[4]。TCP家族成员除了含有TCP结构域外,还存在一个保守的R结构域[5],R结构域并不是所有的TCP转录因子共有的,它富含精氨酸、赖氨酸和谷氨酸等极性氨基酸,可以形成一个 亲水性的α螺旋[3]。

前人对CYC、TB1、PCFs和其他9条预测的拟南芥和玉米TCP基因进行了进化分析,结果表明,这12个基因可以被分为两个亚家族,一个包含有CYC和TB1,命名为CYC/TB1亚家族;另一个包括PCFs,命名为PCF亚家族。其中TCP结构域普遍存在于所有的TCP家族成员中,而R结构域则特异存在于CYC/TB1亚家族的一些基因中[3]。对多种菊亚纲植物的TCP基因家族成员之间的进化关系进行聚类分析,表明TCP基因家族在各物种间的多样化对其形态学上的进化具有重要作用[6]。Yao等通过对拟南芥23个TCP基因及水稻22个TCP基因的进化分析,将TCP家族分为三个亚家族:Class Ⅰ、Class Ⅱ和Class Ⅲ,同时对其结构域进行了序列比对,并分析了不同基因在不同组织中的表达模式[7]。

TCP家族转录因子主要在快速生长的组织或器官中表达,与植物细胞的分化和发育有密切关系。玉米TB1基因影响侧生分生组织的生长和发育[1,8,9];水稻TB1基因被认为是水稻侧枝发育的负调控元件[10];拟南芥TCP16基因对早期花粉的发育有重要作用[11]。拟南芥TCP20基因能够结合CYCB1的GCCCR元件,具有调控细胞分裂和生长的作用[12],可与AtTCP9基因对抗性地调控拟南芥叶片发育和茉莉酸代谢过程[13]。研究表明,拟南芥中的5个TCP基因:TCP2、TCP3、TCP4、TCP10和TCP24是microRNA 319a的靶基因,参与调控叶片的形态发生[14]。豆科模式植物百脉根中的LjCYC1和LjCYC3参与调控花分生组织的生长发育过程,另一类豆科植物豌豆中的CYC类TCP基因也参与控制背腹轴向不同类型花瓣的发育[15,16,17]。

2010年8月,Velasco等在Nature Genetics上发表了关于‘金冠’苹果基因组测序工作的文章,标志着苹果全基因组序列的测定已经完成[18],这一成果将苹果生物学研究带入了崭新的系统生物学时代,为研究者从全基因组水平对苹果进行研究奠定了基础。苹果RING finger、MAPK和MAPKK、MdWRKY转录因子及DREB转录因子家族基因已通过生物信息学的方法鉴定出来,并进行了全基因组分析和基因功能预测[19~22]。目前TCP转录因子家族的研究主要集中在模式植物拟南芥、水稻和玉米中,蔬菜和果树尤其是苹果中的报道还非常少。本文从苹果全基因组出发,利用生物信息学的方法,鉴定出苹果全部的TCP转录因子,对其家族进化关系及结构域序列保守性进行了系统预测和分析,以期为进一步研究MdTCP基因的作用奠定一定的理论基础。

1材料与方法

从苹果功能基因组数据库(http:///)下载TCP转录因子家族序列;从GDR数据库下载‘金冠’苹果全基因组序列,构建本地Blast数据库,以拟南芥TCP转录因子家族基因序列执行本地Blast(1e-003)搜索[23];合并两部分结果,利用Perl程序筛选,去掉重复序列,所得结果再利用PFAM及NCBI-CDD工具进行蛋白结构预测,删除不含TCP结构域的基因。利用ExPASy Proteomics Server(http:///),对所有TCP基因编码蛋白进行分子量、等电点预测。

从GDR数据库下载‘金冠’苹果基因组信息文件(assembly gff3 file),利用Perl程序选取TCP基因的染色置信息,并利用MapDraw工具进行染色体定位作图。

用MUSCLE进行序列比对,选取TCP结构域序列,再利用 MEGA5构建进化树。进化树生成算法采用邻接法(Neighbor-Joining,NJ),校验参数Bootstrap 重复1 000次[24];基因结构利用生物学软件Gene Structure Display Server(GSDS,http:///)分析获得;保守性分析则采用DNAMAN生物学软件进行保守序列比对。

2结果与分析

2.1苹果TCP转录因子家族成员的鉴定

利用生物信息学方法,从苹果全基因组鉴定得到52个TCP转录因子家族成员,根据其系统进化树分析结果,对其进行了系统编号。MdTCP对应的基因编号、基因组登录号、编码序列长度、外显子数量、蛋白长度、分子量、等电点、所在染色置和拟南芥同源基因等特征见表1。由表1可知,MdTCP蛋白长度在115 aa(MdTCP50)~612 aa(MdTCP27)范围内,等电点在5.41(MdTCP32)~10.65之间(MdTCP3)。如图1所示,有49个MdTCP基因存在于不同染色体上,其中5号染色体最多,有7个;3号染色体上没有分布;其余染色体上各有1~5个MdTCP基因分布。另外有3个MdTCP基因MdTCP50、MdTCP51和MdTCP52未发现相应的染色体定位信息。

2.2苹果TCP转录因子家族系统进化及基因结构分析

如图2所示,MdTCP基因的内含子和外显子数量表现出了较高的保守性,其中没有内含子的MdTCP基因有32个,占总数的61.5%;有1个内含子的有9个,占17.3%;有2个内含子的有7个,占13.5%;有3个和5个内含子的MdTCP基因分别有2个,各占3.8%。

图2苹果TCP转录因子家族系统进化树和基因结构分析

2.3苹果与拟南芥TCP转录因子家族系统进化及保守结构域分析

进化树分析(图3)表明,52个MdTCP转录因子可分为ClassⅠ、ClassⅡ和Class Ⅲ三类,分别包括22、4和26个,其中第二类数量较少,这与拟南芥和水稻中的规律是一致的[7]。前人研究表明,拟南芥中有24个TCP家族成员[7,25],由图3可知,不同的AtTCP转录因子与52个MdTCP转录因子有着不同的同源性,例如,AtTCP20与MdTCP22、MdTCP35、MdTCP47同源性较高,AtTCP9与MdTCP18同源性较高。对预测的52个苹果TCP转录因子蛋白序列进行保守结构域序列比对,结果发现,三类苹果TCP蛋白中均包含有TCP结构域,即TCP转录因子的特征序列――bHLH结构域(图4)。

3讨论与结论

随着越来越多物种全基因组测序工作的完成,海量的基因组数据、信息摆在我们面前,如何从这些数据中找到我们所需要的部分成为亟待解决的难题。利用生物信息学方法对基因组数据进行分析,研究各个物种间的进化关系和相互间的亲缘关系,以及物种内各基因家族成员的进化关系,能够为后续基因功能的研究提供一定的借鉴。本文利用生物信息学方法,对苹果基因组中的TCP转录因子进行了鉴定与分析。以期为今后研究苹果TCP转录因子的具体生理作用奠定一定的理论基础。

TCP转录因子在植物中分布较广,各物种间的分布数量存在一定差异。拟南芥TCP转录因子家族有24个成员,水稻有22个成员[7,25],本研究鉴定了52个苹果TCP家族成员。通过系统进化分析发现,MdTCP22、MdTCP35、MdTCP47与AtTCP20的同源性较高,MdTCP18与AtTCP9的同源性较高,结合拟南芥研究结果,这些基因可能在苹果生长发育及代谢过程中起作用;而MdTCP8、MdTCP9、MdTCP10、MdTCP11、MdTCP25和MdTCP49与AtTCP2、AtTCP3、AtTCP4和AtTCP10的同源性较高,说明它们有可能作为microRNA的靶基因参与苹果叶片的发育。借鉴拟南芥、水稻及其它物种中TCP转录因子在植物生长发育和相关代谢过程中的功能研究,探索MdTCP转录因子在苹果生长发育尤其是叶片和侧枝、某些激素代谢过程中的功能及其相互作用机制是今后苹果相关研究的重点。

参考文献:

[1]Doebley J, Stec A, Gustus C. Teosinte branched1 and the origin of maize: Evidence for epistasis and the evolution of dominance[J]. Genetics, 1995, 141(1):333-346.

[2]Luo D, Carpenter R, Vincent C, et al. Origin of floral asymmetry in Antirrhinum[J]. Nature, 1996,383:794-799.

[3]Cubas P, Lauter N, Doebley J, et al. The TCP domain: A motif found in proteins regulating plant growth and development[J]. Plant Journal, 1999, 18(2):215-222.

[4]Heery D M, Kalkhoven E, Hoare S, et al. A signature motif in transcriptional co-activators mediates binding to nuclear receptors[J]. Nature, 1997,387:733-736.

[5]Kosugi S, Ohashi Y. PCF1 and PCF2 specifically bind to cis elements in the rice proliferating cell nuclear antigen gene[J]. The Plant Cell, 1997,9(9):1607-1619.

[6]Reeves P A, Olmstead R G. Evolution of the TCP gene family in Asteridae:cladistic and network approaches to understanding regulatory gene family diversification and its impact on morphological evolution[J]. Molecular Biology and Evolution, 2003, 20(12):1997-2009.

[7]Yao X, Ma H, Wang J, et al. Genome-wide comparative analysis and expression pattern of TCP gene families in Arabidopsis thaliana and Oryza sativa[J].Journal of Integrative Plant Biology,2007, 49(6): 885-897.

[8]Doebley J, Stec A, Hubbard L. The evolution of apical dominance in maize[J]. Nature, 1997,386:485-488.

[9]Wang R L, Stec A, Hey J, et al. The limits of selection during maize domestication[J]. Nature, 1999,398:236-239.

[10]Takeda T, Suwa Y, Suzuki M, et al. The OsTB1 gene negatively regulates lateral branching in rice[J]. Plant Journal, 2003, 33(3):513-520.

[11]Takeda T, Amano K, Ohto M A, et al. RNA interference of the Arabidopsis putative transcription factor TCP16 gene results in abortion of early pollen development[J]. Plant Molecular Biology, 2006, 61(1/2):165-177.

[12]Li C, Potuschak T, Colon-Carmona A, et al. Arabidopsis TCP20 links regulation of growth and cell division control pathways[J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(36):12978-12983.

[13]Danisman S, Van der Wal F, Dhondt S, et al. Arabidopsis class I and class II TCP transcription factors regulate jasmonic acid metabolism and leaf development antagonistically[J].Plantphysiology,2012,159(4):1511-1523.

[14]Palatnik J F, Allen E, Wu X, et al. Control of leaf morphogenesis by microRNAs[J]. Nature, 2003, 425:257-263.

[15]李超. 农杆菌介导的豌豆花瓣瞬间表达系统的建立及利用该系统对百脉根TCP基因亚细胞定位的研究[D]. 上海:上海交通大学, 2009.

[16] Feng X, Zhao Z, Tian Z, et al. Control of petal shape and floral zygomorphy in Lotus japonicus[J]. Proceedings of the National Academy of Sciences of the United States of America, 2006, 103 (13):4970-44975.

[17] Wang Z, Luo Y, Li X, et al. Genetic control of floral zygomorphy in pea (Pisum sativum L.) [J]. Proceedings of the National Academy of Sciences of the United States of America, 2008, 105 (30):10414-410419.

[18] Velasco R, Zharkikh A, Affourtit J, et al. The genome of the domesticated apple (Malus × domestica Borkh.) [J]. Nature Genetics, 2010, 42(10):833-839.

[19] Li Y Z, Wu B J, Yu Y L, et al. Genome-wide analysis of the RING finger gene family in apple[J]. Molecular Genetics and Genomics, 2011, 286(1):81-94.

[20]许瑞瑞, 张世忠, 曹慧, 等. 苹果WRKY转录因子家族基因生物信息学分析[J].园艺学报, 2012, 39(10):2249-2260.

[21]Zhao T, Liang D, Wang P, et al. Genome-wide analysis and expression profiling of the DREB transcription factor gene family in Malus under abiotic stress[J]. Molecular Genetics Genomics, 2012, 287(5):423-436.

[22]Zhang S, Xu R, Luo X, et al. Genome-wide identification and expression analysis of MAPK and MAPKK gene family in Malus domestica[J].Gene, 2013, 531(2):377-387.

[23]Mount D W. Using the basic local alignment search tool (BLAST) [J]. Cold Spring Harbor Protocols, 2007, doi: 10.1101/pdb.top17.

生物信息学分析范文3

关键词:水稻;Os5h基因;Os7h基因;F-box;生物信息学

中图分类号:S511;078 文献标识码:A 文章编号:0439-8114(2016)09-2396-04

F-box蛋白是一类含有40~50个保守氨基酸F-box结构域的蛋白家族成员,在真核生物中广泛存在。研究报道双子叶模式植物拟南芥基因组中至少存在568个F-box蛋白基因,单子叶模式植物水稻中有687个F_box蛋白基因。植物F-box蛋白基因家族中只有少部分F-box蛋白基因的功能被研究报道,研究表明F-box蛋白参与许多植物生长发育的过程,尤其与花发育有关,并参与生长素、乙烯、GA、JA等激素和光信号传导等多种生理过程,也在植物的逆境和防御反应中发挥重要功能。最近报道F-box蛋白SLF控制植物基于S-RNase的自交不亲和。F-box蛋白在生物体内数量庞大,功能复杂,但目前已经研究透彻的F-box蛋白基因非常有限,为此,美国针对模式植物拟南芥启动了拟南芥全基因组F-boX蛋白研究计划,这一计划的实施将促进F-box蛋白家族功能的揭秘,

关于水稻中F-box蛋白类基因的研究较少,其中1个赤霉素不敏感的基因dwarf2是赤霉酸信号的正调控因子。dwarf3(D3)控制着水稻分蘖芽的活动,MAIF1受非生物逆境诱导,可能是mieroRNA的靶基因。

为了更多地了解F-box蛋白基因在水稻中的表达特性,本研究对水稻中2个新的F-box蛋白基因进行了生物信息学预测分析,有助于揭示F-boX蛋白家族的功能,同时为水稻作物遗传改良提供参考。

1 材料与方法

1.1 基因结构及其编码蛋白序列的特征分析

RiceGenomeAnnotationProjectRiceGenomeBrowser网站分析基因结构及蛋白质序列。Pfm(http://pfam.sanger.ac.uk/)和Mobyle数据库(http://mobyle.pasteur.fr/cgi-bin/portal,py?#forms::hm-memit)获得F-boxmotif结构域及其氨基酸序列。采用ClustalXVersion2.0程序比对蛋白质序列。

1.2 2个F-box基因的启动子预测

选取基因ATG上游1500bp的启动子序列在PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)中进行分析,显示基因启动子序列所包含的motif,选取相关的重要motif,根据结果进行修正,手工绘图。

1.3 2个F-box基因的转录表达分析

在CREP(http:///crep-cgi/home.p1)水稻基因表达谱数据库中分别搜集了Os5h、Os7h基因在明恢63以及珍汕97品种两个水稻品种中8个对应组织器官的表达情况。

1.4 2个F-box基因的共表达分析

Os5h和Os7h的共表达分析是在水稻寡核酸芯片数据库中进行的(http:///eoex-pression/coexpression.shtml),相关性的阈值设置为0.5。分析的步骤完全按照网站说明进行。

2 结果与分析

2.1 水稻Os5h和Os7h的结构模式图及其编码蛋白的序列特征

在RiceGenomeAnnotationProjectRiceGenomeBrowser网站(http://rice.plantbiology.msu.edu/analvses.shtml)分别输入Os5h、Os7h基因的水稻LOC号,即显示这两个基因的模式图,确定了各基因的内含子和外显子的数目及位置。Os5h含有3个外显子,CDS总长894bp,编码297个氨基酸。Os7h含有5个外显子,CDS总长1191bp,编码396个氨基酸(图1)。

将Os5h、Os7h基因的蛋白序列及F-boxmotif的氨基酸序列用ClustalXVersion2,0程序来进行蛋白质的序列比对,并对结果进行手工修正绘图。得到蛋白序列特征模式图(图2)。图中黑色方框为Os5h、Os7h基因所编码蛋白含有的F-boxdomain,表明它们都属于F-box家族基因。

2.2 启动子的预测分析

启动子预测分析显示(图3),水稻Os5h和Os7h均含有大量光应答有关的元件。如Q-box、GAG-motif、Box I、Spl、I-box等,热胁迫应答元件HSE。茉莉酸甲酯的应答元件CGTCA-motif、TGACG-motif,脱落酸应答顺式元件ABRE,胚乳表达元件Skn-1motif。另外,Os5h还含有赋予高转录水平元件的5UTR Py-richstretch、低温应答LTR元件、厌氧诱导ARE元件、冷和脱水应答元件C-repeat/DRE、防御和胁迫应答TC-richrepeats元件、水杨酸应答TCA-element元件、昼夜节律控制cir-cadian元件。Os7h还含有干旱诱导MBS元件、缺氧特异诱导GC-motif元件、胚乳表达GCN4_motif元件及分生组织特异激活元件CCGTCC-box。

2.3 水稻Os5h和Os7h基因的转录表达分析

在CREP(http:///crep-cgi/home.p1)水稻基因表达谱数据库中分别搜集了Os5h、Os7h基因在明恢63以及珍汕97两个品种中8个对应组织器官的表达情况。所取组织器官分别为继代愈伤、胚芽,成熟期的茎、叶、根、花、3-5cm长幼穗、15-20cm长幼穗。芯片结果显示,Os5h基因在花中表达最高。胚芽中最低(图4A)。芯片结果显示。Os7h基因在根中表达相对其他组织较低,但整体表达相对比较均匀(图4B)。

2.4 基因的共表达分析结果

在水稻寡核苷酸芯片数据库中对Os5h(OsO3g02550)和Os7h(Os03g02560)基因进行共表达分析。结果表明。多个表达蛋白(如LOCOs06g15700基因)、多种酶。还有过敏反应(如LOCOs05g51420基因)、镉诱导的蛋白(如LOCOs07g05040基因)与Os5h基因正向共表达(表1)。有1个葡萄糖-1-磷酸磷酸转移酶的大亚基LOC_Os05g50380基因、叶绿索的前体与此基因负向共表达。多个表达蛋白、锌指家族蛋白、多种酶蛋白与Os7h基因正向共表达,有2个抗病蛋白LOCOS01G15580基因和LOCOs07g17250基因与其负向共表达(表2)。

3 小结与讨论

基因结构分析显示,Os5h和Os7h这两个基因均含有保守F-box结构域,属于F-box基因家族,因此可能在泛素途径中的SCF蛋白复合体中发挥作用。基因转录表达分析结果显示,这2个F-box基因为组成型表达,其中尤其在花器官中表达较高。可能控制花的发育。启动子的分析预测显示,它们的启动子中含有较多的光应答元件。有研究报道,EID1和AFR这2个F-box蛋白参与phvyA介导的光信号传导。已报道的水稻Hd1是水稻种第一个被克隆的数量性状基因,其在短日照下促进抽穗和在长日照下抑制抽穗。由于Hd1本身的转录并不受日照长短的影响,推测转录受其影响的基因的表达受光周期变化的控制。

生物信息学分析范文4

>> 垂体腺苷酸环化酶激活肽在实验性偏头痛大鼠中的作用 棉铃虫类胰蛋白酶的生物信息学分析 唇形科植物脚6基脚6基焦磷酸合酶编码基因及其氨基酸序列的生物信息学分析 黄瓜DVR基因的生物信息学分析 红白忍冬SABATH甲基转移酶基因克隆及其生物信息学分析 丹参类贝壳杉烯氧化酶(SmKOL)基因全长克隆及其生物信息学分析 人组蛋白去乙酰化酶11的克隆表达与生物信息学分析 金铁锁糖基转移酶PtT1的克隆与生物信息学分析 黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达 太子参分解代谢关键酶8′羟化酶基因的克隆及生物信息学分析 人ALK-1近端启动子的生物信息学分析 酵母转录因子结合位点保守性的生物信息学分析 FZ6基因及其蛋白的生物信息学分析 黔北麻羊RERGL基因cDNA克隆与生物信息学分析 不同物种GATA—2基因编码区生物信息学分析 玉米谷胱甘肽过氧化物酶的生物信息学分析 石榴等观赏植物DFR基因生物信息学分析 欧文氏杆菌铁代谢相关基因的生物信息学分析 拟南芥和大白菜YABBY蛋白家族的生物信息学分析 丹参SmNAC1基因的克隆和生物信息学分析 常见问题解答 当前所在位置:l)在线进行分析预测AC相关蛋白序列的等电点、分子质量及氨基酸组成等特征。

1.2.3 蛋白质疏水性预测 利用Protscale程序(http:///protscale/)对希金斯炭疽菌中AC相关蛋白序列进行疏水性测定。

1.2.4 蛋白质转运肽及信号肽预测 对蛋白质转运肽(transit peptide)的预测利用TargetP 1.1 Server在线分析实现(http://cbs.dtu.dk/services/TargetP/)[14]。氨基酸信号肽(Signal peptide)的预测则是利用SignalP 3.0 Server[15]在线分析实现(http://cbs.dtu.dk/services/SignalP-3.0/)。在线预测信号肽使用神经网络方法(Neural networks, NN)和隐马可夫模型(Hidden markov models, HMM)进行操作,而根据算法不同得出的结果有所差别。

1.2.5 蛋白质二级结构及跨膜区结构预测 对蛋白质二级结构预测采用PHD[16]在线分析实现(http://sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)。同时,对希金斯炭疽菌中AC相关蛋白序列的跨膜区结构预测,利用TMHMM Server v. 2.0实现(http://cbs.dtu.dk/services/TMHMM-2.0/)[15]。

1.2.6 亚细胞定位分析 对希金斯炭疽菌中AC相关蛋白序列进行亚细胞定位分析,利用ProtComp v9.0(http:///berry.phtml?topic=protcompan&group=programs&subgroup=proloc)实现[17],以期获得蛋白质的定位情况。

2 结果与分析

2.1 保守结构域预测结果

基于SMART分析网站,对ChCap1、ChCap2合并序列进行保守结构域分析。结果表明,Srv2在C端含有两个相同的CARP保守结构域,合并序列也含有两个CARP保守结构域,将其初步命名为腺苷酸环化酶蛋白(Adenylate cyclase protein),ChSrv2(图1)。

2.2 ChSrv2与Srv2氨基酸组成分析结果

根据组成蛋白质的氨基酸残基的理化性质,将其分为酸性氨基酸、碱性氨基酸、非极性R基氨基酸、不带电荷的极性R基氨基酸等四大类。对ChSrv2与Srv2中氨基酸残基组成进行对比分析。结果表明,ChSrv2与Srv2的氨基酸数量以及所占比例、所含最高(最低)比例氨基酸及其所占比例方面均具有较大的一致性(表2)。Srv2所含最高比例的氨基酸为丝氨酸(Ser),比例为11.00%,而ChSrv2含最高比例的氨基酸也为Ser,比例为9.60%;在所含最低比例的氨基酸方面,Srv2为半胱氨酸(Cys),比例为0.80%,ChSrv2也为Cys,最低比例为0.40%(表2)。

2.3 Srv2与ChSrv2理化性质分析结果

Srv2与ChSrv2在氨基酸数量、相对分子质量、理论等电点、负电荷氨基酸残基数、正电荷氨基酸残基数、分子式以及原子数量、脂肪族氨基酸指数、总平均亲水性等方面均存在着较大的一致性,特别是在理论等电点、不稳定系数,ChCap2与Srv2相似,理论等电点属于酸性范围内,不稳定系数均大于40,属于不稳定蛋白;ChCap1与Srv2则具有较大的差异,其理论等电点属于偏碱性范围,其不稳定系数小于40,为稳定蛋白(表3)。

2.4 转运肽和信号肽特征

转运肽是一种由12~60个氨基酸残基所组成的前导序列,其功能为引导那些在细胞溶质中合成的蛋白质进入线粒体和叶绿体等细胞器。除了细胞信号蛋白外各种内在蛋白均利用导肽到达细胞器。通过分析,Srv2与ChCap1、ChCap2均定位于分泌途径上,其预测值分别为0.883、0.701、0.660,所处的概率有所不同(表4)。就信号肽预测而言,无论是根据NN进行计算,还是根据HMM进行计算,Srv2与ChCap1、ChCap2均不含有信号肽。

2.5 蛋白疏水性预测结果

根据Protscale分析可知,ChCap1位于36位的丝氨酸(S),其亲水性最强,为-1.926,而位于129位的脯氨酸(P),其疏水性最强(亲水性最弱,下同),为1.626;ChCap2位于54位的苏氨酸(T),其亲水性最强,为-1.005,而位于174位的丙氨酸(A),其疏水性最强,为1.626。Srv2在亲水性(疏水性)最强的氨基酸及其所在位置方面均存在着较大的不同(图2)。

对Srv2与ChCap1、ChCap2的疏水性、亲水性数值进行统计分析。结果表明,3种蛋白在亲水性最强氨基酸残基位置、数值,疏水性最强氨基酸残基位置、数值,疏水性氨基酸残基数值总和以及亲水性氨基酸残基数值总和等方面均存在着较大差异,惟一的相同点是均为亲水性蛋白,这与通过GRAVY计算所得结果一致。

2.6 亚细胞定位特征

通过分析表明,希金斯炭疽菌ChSrv2亚细胞定位与Srv2相同,均定位于质膜上,这与前人对腺苷酸环化酶定位于细胞膜上的研究相一致。

2.7 Srv2在二级结构特征方面与ChCap1、ChCap2存在较大差异

通过分析表明,与Srv2相同,ChCap1、ChCap2均没有典型的跨膜结构。对其二级结构进行分析表明,在二级结构组成方面,ChCap1、ChCap2与Srv2存在着较大差异(图3)。

3 小结与讨论

作为炭疽菌属中重要的病原菌,希金斯炭疽菌主要危害十字花科蔬菜,造成重要的经济损失,国内外学者对其开展了全面而深入的研究。然而,生产上对其引起的炭疽病多采用苯并咪唑类化学药剂防治,而由于该药剂作用靶标以及作用时间的特殊性,均容易引起炭疽菌抗药性出现,严重地制约着上述药剂的进一步使用,急需开发用于防治炭疽病的新作用机制化学药剂,从而较好地挽回生产上的经济损失。

近年来,关于AC在酵母[18]、稻瘟菌[19]、大豆疫霉[20]等真核生物中的功能研究已积累了较多的试验数据,而对于危害禾本科植物造成严重损失的禾谷炭疽菌的AC研究却鲜有报道,随着该病菌全基因组序列的公布,国内外学者对其开展致病基因、抗药性基因的研究将日趋深入。本研究基于酿酒酵母中已经报道的Srv2,利用Blast比对、关键词搜索以及通过SMART保守结构域分析、细胞信号肽、跨膜区结构以及二级结构等生物信息学分析,明确该菌中ChCap1、ChCap2与Srv2在理化性质、二级结构、亚细胞定位方面均具有较大的差异性,同时,通过对上述两个腺苷酸环化酶相关蛋白与其他物种中的同源序列进行Blast比对分析,明确ChCap1、ChCap2分别是希金斯炭疽菌腺苷酸环化酶蛋白序列的重要组成部分,其分别位于N端和C端。通过对其进行序列合并,并结合其SMART保守结构域分析、理化性质、细胞信号肽、跨膜区结构以及二级结构、亚细胞定位等生物信息学分析,结果表明合并后的序列在上述特征、性质方面与Srv2具有较大的相似性。该研究为进一步解析希金斯炭疽菌腺苷酸环化酶的序列以及功能研究提供重要的理论指导。

参考文献:

[1] 沈瑞清,张 萍,郭成瑾,等.宁夏炭疽菌属真菌资源研究[J].河南农业科学,2012,41(5):100-102,149.

[2] 梁惠凌,唐 辉.广西常见花卉真菌性病害的防治[J].广西园艺, 2002(2):18-19.

[3] HYDE K, CAI L, CANNON P, et al. Colletotrichum-names in current use[J]. Fungal Diversity, 2009, 39: 147-182.

[4] 卢博彬,杨 暹.菜心炭疽病研究进展[J].长江蔬菜,2009(24): 1-5.

[5] 张 华,周而勋,刘自珠,等.菜心炭疽病苗期抗病性鉴定技术[J].华南农业大学学报,1998,19(3):50-53.

[6] 张 华,刘自珠,郑岩松,等.菜心品种资源炭疽病抗性鉴定[J]. 广东农业科学,2000(3):47-49.

[7] 李 洋,刘长远,陈秀蓉,等.辽宁省葡萄炭疽菌鉴定及对多菌灵敏感性研究[J].植物保护,2009(4):74-77.

[8] 韩国兴,礼 茜,孙飞洲,等.杭州地区草莓炭疽病病原鉴定及其对多菌灵和乙霉威的抗药性[J].浙江农业科学,2009(6): 1169-1172.

[9] 徐大高,潘汝谦,郑 仲,等.芒果炭疽病菌对多菌灵的抗药性监测[J].华南农业大学学报,2004,32(1):34-36.

[10] 杨 叶,何书海,张淑娟,等.海南芒果炭疽菌对多菌灵的抗药性测定[J].热带作物学报,2008,29(1):73-77.

[11] 詹儒林,李 伟,郑服丛.芒果炭疽病菌对多菌灵的抗药性[J]. 植物保护学报,2005,32(1):71-76.

[12] 张令宏,李 敏,高兆银,等.抗多菌灵的芒果炭疽病菌的杀菌剂筛选及其交互抗性测定[J].热带作物学报,2009,30(3): 347-352.

[13] ALTSCHUL S F, MADDEN T L, SCHAFFER A A, et al. Gapped BLAST and PSI-BLAST: A new generation of protein database search programs[J]. Nucleic Acids Res,1997,25(17): 3389-3402.

[14] EMANUELSSON O, BRUNAK S, VON H G, et al. Locating proteins in the cell using TargetP, SignalP and related tools[J]. Nature Protocols, 2007, 2(4): 953-971.

[15] BENDTSEN J D, NIELSEN H, VON H G, et al. Improved prediction of signal peptides: SignalP 3.0[J]. Journal of Molecular Biology, 2004, 340(4): 783-795.

[16] KELLEY L A, STERNBERG M J. Protein structure prediction on the Web: A case study using the Phyre server[J]. Nature Protocals, 2009, 4(3): 363-371.

[17] EMANUELSSON O, NIELSEN H, BRUNAK S, et al. Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J]. Journal of Molecular Biology, 2000, 300(4): 1005-1016.

[18] GERST J E, FERGUSON K, VOJTEK A, et al. CAP is a bifunctional component of the Saccharomyces cerevisiae adenylyl cyclase complex[J]. Molecular and Cellular Biology, 1991, 11(3): 1248-1257.

生物信息学分析范文5

【关键词】金铁锁;糖基转移酶;生物信息学

【中图分类号】R9141【文献标志码】 A【文章编号】1007-8517(2017)04-0023-04

Cloning of PtT1 genes of Psammosilene tunicoides and BioinformaticsLI YuanLI GuodongZHANG Aili*QIAN Zigang*

Engineering Research Center for Reproducing Fine Varieties of Chinese Medicinal Plants, Yunnan University

of Traditional, Chinese Medicine, Kunming 650500, ChinaAbstract:Subject To clone the glycosyltransferase gene(PtT1) in Psammosilene tunicoides, and to analyze the bioinformation of PtT1. Methods cDNA was reversely transcriped according to the Transcriptome Sequencing. The protein characteristics was analyzed and the phylogenetic tree of PtT1 was constructed using the bioinformatics. ResultsThe 1529bp sequence in P. tunicoides was obtained, which has a 1377bp ORF, encoding 458 amino acids. The protein molecular weight was5125KD, with the isoelectric point of 580. The protein was located at mitochondria. The PtT1 in P.tunicoides was most similar with Dianthus caryophyllus DcT227 by NCBI blast. Conclusions The PtT1 in P. tunicoides was successfully cloned and analyzed, which provides the foundation for this gene function characterization.

Keywords: Psammosilene tunicoides; Glycosyltransferase; Bioinformation

植物中化合物的糖基化是一种很普遍的生理现象,是植物细胞维持代谢平衡的主要机制之一[1]。糖基转移酶则是负责催化分子糖基化修饰反应的酶,其可将活性糖基从尿嘧啶核苷二磷酸-葡萄糖(UDP-glucose)转移至次级代谢物及植物内外源毒性物质等一系列植物小分子化合物受体中[2]。糖基化经常是次生代谢产物主要的后修饰方式,往往修饰合成途径中的最终一步或几步。植物三萜皂苷类次生代谢产物,往往都具有较高的药理活性价值。其合成途径可前体形成,骨架构建及后修饰等三个过程[3]。次生代谢产物结构的基本骨架形成之后,经过细胞色素P450 酶和糖基转移酶等一系列关键酶基因的后修饰,最终形成众多种类繁多的三萜皂苷[4]。

金铁锁来源于石竹科金铁锁属植物金铁锁Psammosilene tunicoides W C Wu et C Y Wu的干燥根[5]。主要分布在云南、贵州、等省,为云南的道地药材[6],是云南白药等中成药的重要主要组成药之一。其活性成分为齐墩果烷型的三萜总皂苷[7-8],具有显著镇痛、抗炎等的药理活性[9-10]。目前,参与金铁锁三萜皂苷合成途径前体形成,骨架构建等过程的关键酶基因都已有报道[11-12],而后修饰环节中的糖基转移酶基因还未见报道。

鉴于此,本研究根据前期转录组数据,通过设计特异性引物克隆了一条金铁锁PtT1家族基因,命名为PtT1,并采用生物信息学软件对其蛋白质理化性质、Y构特征、功能及系统演化关系等进行了预测分析。结果将为金铁锁PtT1基因的功能鉴定研究奠定基础,揭示金铁锁三萜皂苷的分子形成机制。

1仪器与材料

11植物材料金铁锁采集于云南省丽江市,经云南中医学院钱子刚教授鉴定为石竹科金铁锁属植物金铁锁Psammosilene tunicoides WCWu et C Y Wu。

12仪器高速冷冻离心机(eppendorf);稳压稳流电泳仪(BIO-RAD公司);DYC-33A微型电泳槽(BIO-RAD公司);凝胶成像系统(BIO-RAD公司);PCR反应扩增仪(BIO-RAD公司);移液枪(范围100~1000μL,20~200μL,05~10μL)(eppendorf)。

13试剂EastepTM总RNA提取试剂盒(普洛麦格生产批号:7020001018); PrimeScriptTMⅡ1st strand cDNA Synthesis Kit(TaKaRa生产批号:AK3201);TransStart KD Plus DNA Polymerase(Trans生产批号:K10511);薄型琼脂糖凝胶DNA回收试剂盒(GENEray生产批号:1601G20);pEASY-T1 cloning kit(Trans生产批号:I40914); DL2000 DNA Marker(TaKaRa生产批号:A2101A);引物由生工生物工程(上海)股份有限公司合成;测序由生工生物工程(上海)股份有限公司完成。

2方法

21引物设计根据金铁锁转录组中糖基转移酶基因序列,设计1对特异性引物PtT1F: AAAAATGAAACACCAAGAAAAGCAG,PtT1R: GATTGAAGAAACCAAAGAAGGGGGC。

22PtT1基因的克隆按照EastepTM总RNA提取试剂盒(普洛麦格)说明书提取金铁锁根中的总RNA;并根据PrimeScriptTMⅡ1st strand cDNA Synthesis Kit(TaKaRa)说明书合成cDNA。以cDNA为模板使用TransStart KD Plus DNA Polymerase(AP301)通过PCR扩增目的片段。表1PCR反应体系

ComponentsVolumeTemplate1 μLForward Primer(10 μM)1 μLReverse Primer(10 μM)1 μL5×TransStart KD Plus Buffer10 μL25 mM dNTPs4 μLTransStart KD Plus DNA Polymerase1 μLddH2Oto 50 μLPCR反应条件:94℃、5min;94℃、30s;45℃、30s,68℃、2 min30sec,35个循环;68℃延伸10min。PCR产物经10%琼脂糖凝胶电泳检测后,选取较亮的目的条带进行回收纯化,并将回收产物与1μL pEASY-T1 cloning kit(Trans)配成连接体系,热激转化到大肠杆菌感受态细胞后,涂布于含Amp+ 抗性的LB固体培养基上,37℃过夜培养。挑选白色单克隆进行菌液PCR鉴定,选取阳性单克隆过夜摇菌保种后测序。

23金铁锁糖基转移酶基因的生物信息学分析在NCBI(http://wwwncbinlmnihgov)网站上通过BLAST程序进行序列比对,应用 BioEdit翻译为氨基酸序列,使用ORF Finder(http://wwwncbinlmnihgov/gorf/gorfhtml)确定开放阅读框。并用ProtParam(http://webexpasyorg/protparam/)预测蛋白质相对分子质量等;使用ProtScale(http://webexpasyorg/protscale/)软件进行疏水性分析;TMHMM(http://wwwcbsdtudk/services/TMHMM/)工具预测PtT1蛋白的跨膜螺旋区;Signal 30(http://wwwcbsdtudk/services/SignalP-30/)A测蛋白质信号肽;利用在线工具TargetP 11(http://wwwcbsdtudk/services/TargetP/)预测PtT1的亚细胞定位情况。使用PORTER对二级结构预测SWISS-MODEL(http://swissmodel expasyorg/interactive/k5MUhF/models/)服务器对三级结构预测;然后使用MEGA 50软件内置的NJ法构建系统进化树。

3结果与分析

31金铁锁PtT1基因的克隆以金铁锁根cDNA为模板进行PCR反应,扩增得到2000bp左右的片段。使用pEASY-T1载体通用引物对单克隆进行菌液PCR检测为阳性克隆后送样测序,结果表明扩增序列与转录组序列基本一致。见图1。

32PtT1基因的生物信息学分析PtT1糖基转移酶cDNA全长1529bp,ORF长1377bp,编码458个氨基酸。通过Blastn比对分析可知与石竹科香石竹同源性最高,为81%。采用ProtParam工具预测PtT1编码的氨基酸序列的蛋白质理化性质,从分析结果中可知PtT1的分子质量为5125KDa,理论等电点为580;在组成糖基转移酶的20种氨基酸中,亮氨酸(Leu)所占的比例最高,达到114%;PtT1的不稳定指数为3719,为稳定蛋白;脂肪指数为9044。采用ProtScale分析PtT1氨基酸序列的疏水性/亲水性,结果显示415左右位置有一个典型的亲水性区域,见图2。

利用TMHMM 20对PtT1蛋白进行跨膜结构预测。推测其不存在跨膜区域,该糖基转移酶编码的蛋白不属于跨膜蛋白。见图3

使用SignalP 30对PtT1蛋白质的信号肽进行预测,由神经网络模型分析可判断该蛋白不存在信号肽。隐马尔夫模型进一步证实了金铁锁PtT1编码的蛋白是非分泌蛋白质,没有信号肽存在。将PtT1编码的蛋白质序列输入在线细胞定位分析工具TargetP 11服务器,分析表明目的蛋白的分泌途径为线粒体型,即定位在线粒体上。

对糖基转移酶PtT1的结构域进行预测,在190位到442位之间存在高度保守的结构功能域―UDPGT,即UDPGT家族成员共有的典型结构域。见图4。

利用PORTER对金铁锁PtT1进行二级结构分析,该蛋白二级结构中α-螺旋(H)占4432%,β-折叠(E)占1245%,无规则卷曲(C)占4323%,该蛋白质的二级结构属于混合型。利用Swiss-Model Workspace对糖基转移酶的蛋白质三维立体结构进行预测。见图5。

将金铁锁PtT1与GenBank数据库中17种植物的糖基转移酶蛋白进行Clustal W比对分析后,利用MEGA 51中的Neighbor-Joining 方法,构建系统进化树。结果表明金铁锁与同科植物香石竹聚为一类,亲缘关系最近;其次与北柴胡、小麦、拟南芥等植物的亲缘关系也比较接近,与蓖麻等植物中的PtT1亲缘关系较远。见图6。

4 讨论

糖基转移酶催基因催化三萜皂苷骨架糖基化的反应,其通过催化生物物体内已活化的糖,连接到不同的受体分子上,对一系列化合物进行激活、抑制或者调节溶解度,从而参与植物体多种调控和代谢途径。目前已发现的催化植物中天然产物糖基化的酶均属于糖基转移酶家族Ⅰ,其作用是将活性糖基从核苷糖(尿嘧啶核苷二磷酸糖)转移到包括次生代谢物在内的多种植物小分子化合物受体上[13]。

目前,仅有少数几个参与三萜皂苷生物合成的糖基转移酶被报道[14-19]。本研究立足于金铁锁转录组测序数据,从金铁锁根中克隆得到一条糖基转移酶基因PtT1,其cDNA全长1529bp,ORF长1377bp,编码458个氨基酸。Blast比对分析可知与同科植物香石竹有较高的同源性,保守结构域分析显示其具有UDPGT家族成员共有的典型结构域,说明所得糖基转移酶蛋白具有较高的结构保守性。通过构建进化树,发现该基因与香石竹、北柴胡、拟南芥等植物的亲缘关系比较接近。为进一步研究金铁锁糖基转移酶在大肠杆菌异源表达,三萜皂苷合成代谢途径及其关键酶表达模式等研究奠定一定的基础。参考文献

[1]Weis M, Lim EK, Bruce NC, et al. Engineering and kinetic characterisation of two glucosyltransferases from Arabidopsis thaliana[J]. Biochimie,2008,90: 830-834

[2] 邢爱佳. 罗汉果葡萄糖基转移酶基因的克隆及原核表达[D]. 南宁:广西大学, 2013.

[3] Naoumkina M A, Modolo L V, Huhman D V, et al. Genomic and coexpression analyses predict multiple genes involved in triterpenes aponin biosynthesis in Medicagotruncatula[J]. The Plant Cell Online, 2010, 22(3): 85-86

[4] Seki H, Ohyama K, Sawai S, et al. Licorice β-amyrin 11-oxidase, a cytochrome P450 with a key role in the biosynthesis of the triterpene sweetener glycyrrhizin[J]. Proceedings of the National Academy of Sciences, 2008, 105(37): 1420

[5] 兰茂.滇南本草[M].昆明:云南人民出版社,1976:86.

[6] 朱常成,徐土奎,钱子刚.金铁锁的地理分布及分布区的初步分析[J]. 中国现代应用药学杂志,2007,24(1): 28-31.

[7] 田均勉.中药金铁锁的系统化学成分研究[D].上海:第二军医大学,2011.

[8] 文波.中药金铁锁地上部分的化学成分与生物活性研究[D].福州:福建中医药大学,2014.

[9] 王学勇,张元,许建阳,等.金铁锁总皂苷镇痛作用及其对佐剂性关节炎大鼠c-fos基因的表达的影响[J].中实验方剂学杂志,2010,16(3):94-96.

[10]Zhang J, Cao W, Tian J, et al. Evaluation of novel saponins from Psammosilene tunicoides and their analogs as immunomodulators [J].Int Immunopharmacol,2012,14(1):21.

[11] 戴住波,钱子刚,胡运乾,等.金铁锁鲨烯合酶cDNA的克隆和功能鉴定[J].药学学报,2008,43(12) : 1245-1250.

[12] 刘佳佳.金铁锁β-香树素合酶cDNA的克隆、原核表达和功能鉴定[D].昆明:云南中医学院,2012.

[13] 许晓双,张福生,秦雪梅. 三萜皂苷生物合成途径及关键酶的研究进展[J]. 世界科学技术-中医药现代化,2014,16(11):2440-2448.

[14] Dai L, Liu C, Zhu Y, et al. Functional Characterization of Cucurbitadienol Synthase and Triterpene Glycosyltransferase Involved in Biosynthesis of Mogrosides from Siraitia grosvenorii[J]. Plant And Cell Physiology,2015,56(6):1172-1182.

[15] Achnine L, Huhman DV, Farag MA, et a1.Genomics-based selection and function alcharacterization of triterpene glycosyltrans-ferases from the model legume Medicago truncatula[J].Plant J,2005(41):875.

[16]Naoumkina M A, Modolo L V, Huhman D V, et a1.Genomic and coexpression analyses predict multiple genes involved in triterpene saponin biosynthesis in Medicago truncatula[J].Plant Cell,2010(22):850.

[17]Meesapyodsuk D, Balsevich J, Reed D W, et al.Saponin Biosynthesis in Saponaria vaccaria. cDNAs Encoding beta-Amyrin Synthase and a Triterpene Carboxylic Acid Glucosylansferase[J]. Plant Physiology,2006,143(2):959-969.

生物信息学分析范文6

关键词:结核分枝杆菌;pst S1基因;扩增;生物信息学

结核病(Tuberculosis, TB )是由结核分枝杆菌(Mycobacterium tuberculosis, MTB)所致的、以呼吸系统感染为主的慢性传染病。世界卫生组织全球结核病疫情报告表明,当前结核病已成为可治性感染疾患中头号致死疾病[1]。到目前为止对结核分枝杆菌的研究已经发现了很多特异性的抗原,但还没有一个单抗原能达到WHO对结核诊断抗原的阳性率要求,即总阳性率大于80%,特异性大于95%[2]。动物实验表明,结核分枝杆菌分泌蛋白Pst S1是比较重要和相对特异的一种抗原,可引起特异的保护性免疫反应。因此,可用作亚单位疫苗。本研究对pst S1基因进行扩增,利用生物信息学方法对该基因进行分析,为构建新型结核疫苗、制造诊断试剂和设计药物靶点提供理论依据。

1材料和方法

1.1材料

DNA标准分子量marker、2×PCR Master Mix、细菌基因组提取试剂盒、DNA电泳凝胶回收试剂盒购自Promega公司,Agarose购自西班牙,其他试剂均为国产分析纯,结核分枝杆菌为潍坊市第二人民医院患者体内分离。

1.2方法

1.2.1 引物的设计

根据GenBank报道的结核分枝杆菌pst S1基因序列,自行设计特异性引物,序列如下:P1:gtggaattcgtgaaaattcgtttgcat; P2:atactcgaggctggaaatcgtcgcgat。均由上海生物工程公司合成。

1.2.2 结核分枝杆菌基因组DNA的提取

将结核分枝杆菌接种于苏通液体培养基中,37℃培养4周,取3ml培养物80℃,灭活2h,按照细菌基因组提取试剂盒的操作说明操作(该步在市疾病预防控制中心生物安全三级实验室中完成)。

1.2.3 pst S1基因的扩增和生物信息学分析

以MTB基因组DNA为模板,按照常规PCR条件进行扩增。扩增条件:94℃预变性5min,94℃变性1min,61℃复性1min,72℃延伸1min,循环30次,72℃延伸8min。将扩增出的pst S1基因送上海生物公司进行测序,然后利用DNA Star5. 0软件中对pst S1基因的测序结果进行分析,测其蛋白的二级结构。

2结果

2.1 pst S1基因的测序结果及编码蛋白的分子特征

测序结果表明, 扩增的pst S1基因的全长1112bp, 与GenBank中公布的标准株H37Rv的pst S1基因的核酸序列相比较同源性为92.7%。GC含量为64.95%,编码362个氨基酸。推导出的蛋白分子质量约为38kD,含有74个强碱性氨基酸(K,R),28个强酸性氨基酸(D,E),101个疏水性氨基酸(A, I, L, F,W,V),68个极性氨基酸(N,C,Q, S,T,Y),等电点为11.989。

2.2pst S1基因编码蛋白结构预测及可读框分析

用Chou-Fasman法分析Pst S1基因编码蛋白的二级结构,可见有11个α螺旋、5个β折叠和32个β转角。一般认为α螺旋、β折叠结构较规则,形态固定,常处于蛋白质的内部;而β转角和无规则卷曲多处于蛋白质的表面,有利于抗体空间构象上与抗原的嵌合,其膜外的β转角可能是具有较强免疫原性的区域,见图1。通过分析还可见该基因含有多个ORF,其中最长的一个是756bp,可能是编码序列。

2.3 pst S1基因的亲水性、疏水性以及抗原性分析

运用生物信息学软件DNAstar6.0的Protean对pst S1基因表达蛋白的亲水性和疏水性预测分析,表明pst S1基因的含有多个较强的亲水区,可能是形成抗原表位的重要部位。用Jameson-Wolf方法抗原性分析显示pst S1有多个明显的具有抗原活性的结构域 ,抗原性指数最强为1.7,结合Hopp-Woods方法进行亲水性分析,表明这些结构域的亲水性普遍较强,二级结构预测显示该基因含有大量β转角结构,结合AMPHI方法预测该基因含有21个免疫优势辅T淋巴细胞抗原位点,7个含有特定基序(motif)的潜在T 淋巴细胞抗原决定簇。综合上述分析,表明这个基因可能含有良好的抗原

3讨论

在结核分枝杆菌已发现的特异性抗原中,Pst S1抗原是目前公认的血清学诊断的最佳单抗原,并发展有多个商品化的试剂盒[3]。Pst S1蛋白是一种磷酸盐转运蛋白 [4],以膜蛋白和分泌蛋白的形式存在,能刺激机体产生体液免疫和细胞免疫,特异性较强。通过分析发现,该株结核杆菌与GenBank中公布的标准株H37Rv的pst S1基因的核酸序列相比较同源性为92.7%,变异程度较小;该基因编码蛋白含有多个β转角结构,有利于抗体空间构象上与抗原的嵌合;含有多个明显的具有抗原活性的结构域和免疫优势辅T 淋巴细胞抗原位点,抗原性较强;并且该菌株的生物学特性与其它株相比基本相同,对常见的抗结核药物具有耐药性。所以该菌株具有一定的代表性,其分泌蛋白不仅可能是治疗结核病的新的切人点,而且有可能作为新型亚单位疫苗用于防止结核病复发。本研究成功扩增了Pst S1基因,为地方结核病的防治以及进一步研究其生物学功能和潜在的临床应用前景奠定了基础。

参考文献:

[1]WHO.Global tuberculosis control:surveillance,planning,finacing[J].Geneva:World Health Organization,2006:242.

[2]Julian E,Matas L,Alcaide J,et parison of antibody response to a potential combination of specific glycolipids and proteins for test sensitivity improvement in tuberculosis serodiagnosis [J].Clin Diagn Lab Immunol, 2004,11(1):70-76.