经典遗传学和表观遗传学范例6篇

前言:中文期刊网精心挑选了经典遗传学和表观遗传学范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

经典遗传学和表观遗传学

经典遗传学和表观遗传学范文1

教学过程中经典理论教学与专题讨论课教学这两条主线需要相互配合,相得彰宜。因此,对于文献专题的选则应当把握三个原则:所选文献专题确系当今医学、生命科学研究领域的前沿与热点问题(高于课本);专题与经典理论相联系(不脱离课本);专题内容为教学过程中学生兴趣较浓、质疑较多而课本讲授深度有限的内容(符合学生兴趣)。在一门课程教学的具体实施中,根据以上三个原则,由教学组全体教师共同拟定4-5个文献专题,而后在国际权威科学杂志如《自然》、《科学》及《细胞》上就每一个专题选择近年来发表的5篇文献,并指定各专题的辅导教师。文献内容以能够体现该专题重要科学概念、里程碑式科学发现及先进的研究技术方法为标准。文献选定后,由学生依据自身兴趣自主选择,就某一专题形成兴趣小组。经过一段时期的分组学习及教师辅导,最终由每个小组推选两名报告人,在本专题内选定两篇精读文献,以科研论文讨论的形式进行学生课堂汇报。例如在《分子遗传学》的理论教学中,讲授了“表观遗传学”内容,但囿于课本内容的深度及课时数,仅介绍了其基本概念和发展简史。然而,学生在课后提问中表现出强烈兴趣,该专题也无疑是当今生命科学研究领域的热点研究问题。

2学生课堂汇报

学生课堂汇报安排在复习指导课之前1-2周,让学生在结束文献精读训练后,转而全身心投入复习考试过程。汇报课由主讲教师主持,学生代表依次上台,以幻灯为辅助进行汇报陈述,教研室主任、教授及教学组全体教师共同参与讨论,并给予点评。以上述表观遗传学文章为例,学生代表先介绍了完成该研究工作的美国研究小组,而后介绍了与课题密切相关的研究背景:组蛋白(Histone,H)泛素化与组蛋白甲基化,与理论课上讲授的基本概念密切相关。作者在《分子遗传学》的DNA结构中讲过,一个核小体由两个H2A,两个H2B,两个H3,两个H4组成的八聚体和147个碱基(bp)缠绕在外面的DNA组成。在哺乳动物基因组中,组成核小体的组蛋白游离在外的N-端可以受到乙酰化,甲基化,磷酸化,泛素化等修饰,从而影响基因的转录活性。而本篇文献则重点讨论H2B泛素化与H3甲基化之间的关系。在对研究结果的讲解中,学生用逐步深入的科学问题作为逻辑主线,体现出文章作者的科学研究思路。作者首先根据H2B泛素化影响H3甲基化这一保守的生物现象,提出了三种假说:①调节泛素化的Rad6复合物可影响调节甲基化的COMPASS复合物中Set1组分的活性;②Rad6复合物可影响COMPASS复合物中其它组分的活性;③Rad6复合物影响COMPASS复合物中各组分的组装、稳定性及活性。而后,作者采用酵母Rad6突变体与野生型相对照,利用色谱分析、蛋白双向电泳、染色质免疫共沉淀等生物技术,对三种假说依次进行验证和排除,最终揭示Rad6复合物通过影响COMPASS复合物中Csp35这一关键组分与染色质的结合,实现H2B泛素化对H3甲基化的调控作用。通过文献精读,学生从表观遗传学的基本概念(如组蛋白甲基化、泛素化)出发,进入到基本而又深刻的科学问题,了解到上述确切的科学研究结论,以及寻找科学结论所需的生物技术方法。这个学习过程,在引申了经典理论知识的同时,教会了学生自主学习前沿知识的方法,有效地培养了本科学生的科学研究素质。

3文献讨论、点评

在文献讨论过程中,鼓励学生最大限度的发挥主动性与创造力,发表自己的见解。以上述表观遗传学文章为例,H2B泛素化对于H3甲基化的影响不仅存在于第4位赖氨酸上(H3K4),也存在于第79位赖氨酸上,而该文献的研究对象仅限于前者。有学生在完成文献精读后,就H2B泛素化对H3K79甲基化的影响机制提出了自己的假说。教师对于有独到见解,甚至能提出假说的学生给予高度赞扬,并鼓励其撰写科学假说论文,进一步锻炼自己的科研素质。在每一名学生的汇报及讨论结束后,教研室主任、教授给予点评,在肯定其优点的同时指出存在的问题和不足。问题通常表现在背景知识介绍不充分、逻辑主线不明晰、以及研究方法讲解不清等方面。

4结语

经典遗传学和表观遗传学范文2

随着对白血病发病机制的深入研究及其治疗方案的改进,白血病的完全缓解率也有明显的提高,但仍有一部分患者最终会复发。近年来的研究发现, 白血病的复发与微小残留病密切相关。微小残留病(minimal residual disease, MRD )是指经过诱导治疗达临床缓解时,白血病患者体内残留的少量白血病细胞。对患者进行微小残留病监测对白血病的治疗和预后判断具有非常重要的意义。检测MRD的关键是寻找分子基因标志。细胞免疫表型及遗传学的异常改变在急性白血病MRD 检测中占有重要地位。令人遗憾的是,这些方法只适用于少数患者,大多数患者并不具备遗传学的预后指标。随着对急性白血病分子生物学发病机制研究的进步,人们把急性白血病的发生归结为抑癌基因和原癌基因通过遗传学和表观遗传学机制的发生异常改变[1]。DNA甲基化作为一种重要的表观遗传调控机制,其与肿瘤发生、发展以及检测相关机制的研究逐步成为研究的热点。表观遗传学生物标记(Epigenetic biomarkers),特别是DNA 甲基化相关标记检测拥有遗传学标记、抗体等标志不具备的优势。本文就MRD细胞分子遗传学的检测方法及DNA甲基化检测MRD的临床应用进行综述。

1 常用白血病MRD检测方法的研究进展

1.1 分子生物学方法:遗传学的改变,包括染色体易位/缺失、基因突变等是白血病发生的基础,其所导致的正常基因表达调控紊乱和功能异常是白血病发生的主要原因。异常的遗传学改变,已成为急性白血病临床检验资料的重要组成部分。

实时定量聚合酶链反应( RQ-PCR ) 方法结合了PCR和荧光探针两种技术,通过定量检测白血病细胞中标志性基因实时观测MRD,是目前检测MRD最为敏感的方法,灵敏度可达10-4-10-5,已成为临床实验室建立MRD检测方法的首选。其检测的基因标志包括:(1)染色体异位形成的融合基因。如t(9:22), t(15;17),inv(16), and t(8;21),T 细胞受体(T-cell receptor ,TCR)重排等,常见的融合基因包括: TEL /AML1、BCR /ABL、E2A /PBX1、MLL /AF4等。(2)在白血病中表达增高的肿瘤基因(如PRAME、 WTI 、PRAME、NPM1、STC- 1 等基因。(3)发生突变的基因(如FLT3 /ITD)。融合基因直接反映了白血病的病理特征,他在疾病发展过程中比较稳定,以其作为PCR检测MRD的分子标志具有特异性强、敏感度高的优点[2]。但是这些检查不仅价格昂贵,其检测的标本为RNA,存在不易保存,结果不稳定的缺点。更令人遗憾的是,由于白血病是一组异质性很大的恶性血液病,各亚型之间遗传背景不同,这些遗传学基因标志只能覆盖1/3的白血病类型,还有2/3类型的白血病不具备遗传学基因标志,无法在临床上进行MRD的检测。即使联合应用多种基因仍有40%~50%的患者无法找到适当的基因标志检测MRD,使其疾病状态缺乏准确的判断依据。

1.2流式细胞术( FCM):FCM是通过检测在正常细胞上不表达或低表达而在白血病细胞上表达或高表达的白血病相关免疫表型来定量检测MRD,能够准确定量残留白血病细胞数,并且还能了解残留白血病细胞的凋亡情况[3]。其优势是每秒可检测5 000~10 000个细胞,并能用计算机记录处理,快速地对各个细胞进行多参数定量分析,灵敏度达到10- 4。但应用此法必须要对患者初发时的免疫表型特征有详尽了解,以便选择适当的标志检测MRD。因为白血病细胞与正常细胞相比, 通常低达10- 5~10- 6, 可能低于FCM检测范围而使这种方法缺乏特异性; 而且随着病程发展, 细胞表面的抗原发生改变, 会导致假阴性结果。

2 异常DNA甲基化检测白血病MRD的临床研究进展

DNA甲基化是指在DNA序列不变的情况下,通过影响基因转录活性以调控基因的表达。DNA甲基化作为一种表观遗传学改变与白血病的发生密切相关,在不改变遗传信息的前提下导致细胞遗传特性改变,作为肿瘤性疾病"二次打击"经典假说的重要补充,已成为白血病研究的新热点。DNA异常高甲基化导致抑癌基因的失活在白血病发生发展、诊断、监测微小残留病、预测病情以及指导治疗方面都有重要作用,这些表观遗传学标志作为MRD监测标志物的临床研究逐渐引起大家的关注。

P15基因甲基化与白血病的关系目前研究最为深入。73%~93%的急性髓系白血病(AML)和57%的急性淋巴细胞白血病(ALL)患者发生p15基因高甲基化,且持续p15基因高甲基化预示疾病复发。与p15基因甲基化患者相比,p15基因非甲基化患者5年DFS明显延长(15% v 62.5%;p=0.02)[4]。

Au等[5]检测了l7例t-MDS/AMI 患者,l5例存在pl5甲基化。其中5例在发展为治疗相关的t-MDS/AML前即已存在pl5甲基化,最早为两年前。提示pl5甲基化发生在t-MDS/AMI 早期,检测p15甲基化有助于判断预后、指导治疗。在一组65例急性早幼粒细胞白血病的研究中,31例存在p15甲基化的患者5年无病生存率仅为29.64% ,显著低于34例无甲基化的患者79%。p15基因甲基化与预后不良相关。

Id4和zo-1是我室新发现的两个血液系统相关候选基因,并对其在白血病发生、复发中的作用及应用于MRD检测进行了系列基础与临床研究。

采用MS-PCR的方法对完全缓解期白血病患者骨髓标本检测id4基因甲基化状态,结果发现:(1)58例完全缓解的急性白血病人MRD的检出率为41%,MRD阳性的患者12个月内复发率为62.5%,而非甲基化的患者12个月内复发率仅为10%。(2)16例异基因外周血干细胞移植后的白血病患者中,5例检测到MRD的患者中有4例在1年的随访期出现复发,而11例移植后MRD持续阴性的患者无一例复发。

研究对26例完全缓解的急性白血病患者进行zo-1基因甲基化检测,MRD检出率为34.6%,MRD阳性的患者12个月内复发率为57.1%,而非甲基化的患者12个月内复发率仅为15.4%,MRD阳性病人复发率明显高于阴性者。Id4和zo-1基因甲基化检测可能成为急性白血病新的生物标记用于预测疾病的预后以及复发。

随着PCR 技术的进步,将实时定量PCR(real-time PCR)与MSP 结合提高了甲基化分析检测的特异性和敏感性。高敏感性的甲基化定量PCR为MRD检测开辟了另一种解决方法。甲基化定量水平的变化对于细胞修复、肿瘤预后、肿瘤化疗后的耐药等提供了新的研究指标,可以从另一个层面上揭示其发生机制。因此,甲基化定量PCR技术被应用与临床各领域的研究。

Shuchi等[6]以启动子区高甲基化状态的雌激素受体α(estrogen receptor α;ER-α)和 p15INT4B 基因做为MRD标志,采用定量甲基化特异性PCR对180例急性白血病患者骨髓标本进行检测,结果发现:(1)临床缓解期的AML患者中, ER-α和p15INT4B基因启动子区呈现高甲基化状态的患者较低甲基化状态的患者有更高的复发风险,而且ER-α和p15INT4B基因启动子区甲基化水平的增高与患者无病生存期(disease free survival,DFS)缩短有明显相关性。(2)对5名儿童ALL患者ER-α基因启动子区甲基化程度进行了自诱导缓解后的追踪检测,结果提示疾病复发状态较缓解状态ER-α基因启动子甲基化水平增加。其结果与目前常用的MRD监测标志TCR/免疫球蛋白重排水平结果基本一致。

另一研究以启动子区高甲基化状态的p73、p15、p57KIP2基因为MRD标志,通过对199例Ph染色体和MLL阴性的处于完全缓解状态(complete remission,CR)的成人ALL标本进行定量甲基化特异性PCR检测,研究结果提示p73基因启动子区甲基化水平与第一次CR持续时间及无病生存期(DFS)及总生存期(overall survival, OS)缩短间有显著相关性[7]。因此,特定基因的定量甲基化PCR检测有可能成为一种评估急性白血病复发风险及MRD检测的有效手段。

结语

白血病作为一种恶性肿瘤,复发是影响其患者生存的主要问题。患者体内白血病微量残留病是复发的主要根源,对患者进行微量残留病监测在白血病的治疗和预后判断中具有非常重要的意义。遗憾的是,由于绝大多数患者缺乏明确的遗传标记作为早期检测和准确评估MRD的标志,在临床上常因治疗不足导致疾病复发或治疗过度引起严重并发症,绝大多数患者在发病后1~3年内死亡。因此,要在白血病MRD早期检测和指导治疗上有所突破,就必须寻找能够早期诊断白血病MRD的特异性强、通用性好的分子标志物。DNA 甲基化作为肿瘤相关标记,与遗传学标记、细胞表面抗体等标志具有更多的优势。首先,临床常规的肿瘤标记检测以蛋白或者RNA为对象,必须采集新鲜样本以确定检测结果的准确性。而甲基化检测则以DNA 为样本,很容易从各种体液中,甚至石蜡包埋组织中得到,极大地扩展了研究资源。其次,甲基化以DNA作为研究对象,较RNA 和蛋白更稳定,更容易保存。进而保证了检测结果的可靠性。因此,DNA甲基化定量水平的变化对于肿瘤预后、肿瘤化疗后的耐药等提供了新的研究指标,可以从另一个层面上揭示其发生机制。

参考文献

[1] KrugU, GanserA, KoefflerHP. Tumor suppressor genes nnormal and m alignant hematopoiesis. Oncogene 2002; 21: 3475-95.

[2] Mitelman F, Johansson B, Mertens F. The impact of translocations and gene fusions on cancer causation. Nat Rev Cancer, 2007, 7:233-245.

[3] Szczepaski T, van der Velden VH, van Dongen JJ. Flow-cytometric immunophenotyping of normal and m alignant lymphocytes. Clin Chem Lab Med, 2006, 44: 775-796.

[4] Teofili L, Martini M, Luongo M, et al. Hypermethylation of CpG islands in the promoter region of p15(INK4b) in acute promyelocytic leukemia represses p15(INK4b) expression and correlates with poor prognosis. Leukemia 2003;17:919-24.

[5] Christiansen DH, Andersen MK, Pedersen-Bjergaard J. Methylation ofp15INK4B is common, is associated with deletion of genes on chromosome arm 7q and predicts a poor prognosis in therapy-related myelodysplasiaandacute myeloid leukemia. Leukemia 2003;17: 1813-9.

[6] Shuchi A, Matthias U, Steffen K, et al. DNA Methylation of TumorSuppressor Genes in Clinical Remission Predicts the Relapse Risk in Acute Myeloid Leukemia. Cancer Res 2007 ,Feb,671: 1370-1377.

经典遗传学和表观遗传学范文3

表观遗传学

恶性肿瘤的发生涉及多种基因功能的异常,导致异常的除了以往我们研究得很多的基因突变、基因缺失等遗传改变外,近年来表观遗传学成为了研究热点。1999年Jones等在Nature上撰文“Cancer epigenetics comes of age”[1],表明肿瘤研究进入了新的时期。表观遗传是指DNA序列不发生变化,但基因表达却发生了改变,并且此种变化在发育和细胞增殖过程中能稳定传递[2]。表观遗传学的主要研究方向包括以下几个方面:DNA甲基化修饰;组蛋白修饰(组蛋白的乙酰化、去乙酰化及磷酸化、去磷酸化等);基因印迹等。和很多传统遗传学改变不同的是,许多表观遗传的改变是可逆的,这便为很多疾病尤其是恶性肿瘤的诊断与治疗开拓了广阔的前景。

DNA甲基化概况

DNA甲基化是目前研究得最多的表观遗传学机制,它是一种常见的DNA修饰,指在DNA甲基转移酶(DNMT)催化下将甲基加到CG二核苷酸的胞嘧啶上,使之变成5′-甲基胞嘧啶(5-mc)的化学修饰过程[3]。CpG二核苷酸在基因组中呈非随机分布,在5′端启动子区CpG位点高度聚集在一起,称为CpG岛。目前已经研究证实有三种与DNA甲基化相关的酶,DNMT1、DNMT3a、DNMT3b,普遍认为DNMT3a和DNMT3b可以催化新生甲基化形成,而DNMT1主要在DNA复制时维持其甲基化状态。很多研究都表明,肿瘤细胞DNA总体甲基化水平低于正常细胞,但某些CpG岛甲基化程度增高。基因组DNA过低甲基化可促进杂和性丢失(LOH)[4],导致基因组有害基因转录表达,例如激活原癌基因,使癌基因或相关因子得以表达,胚胎干细胞在缺乏DNMTl时基因组过低甲基化,宿主保护机制削弱,有利于基因组重复子同源性重组,从而导致整个基因组不稳定性增加;此外,在细胞染色体中心粒剧同存在高度密集甲基化区域,如果失去致密的甲基,可导致基因损伤和突变。

人类基因组中约有45000个CpG岛,虽然仅占基因组DNA 的1 %~2 % ,但存在于所有管家基因和少量组织特异基因的5′端调控区。CpG岛在正常组织中处于非甲基化状态,但在细胞发生癌变时某些肿瘤抑制基因启动子区的CpG岛发生甲基化,以致这些基因表达沉默,导致了肿瘤的发生。概括地讲,DNA 甲基化抑制基因表达的机理为[5-6]:① 甲基化CpG岛直接抑制序列特异性转录因子与DNA的结合,从而抑制转录;② 甲基化CpG激活阻遏蛋白因子从而抑制转录;③ 甲基化CpG与甲基化CpG结合蛋白家族成员结合,通过组氨酸去乙酰化酶作用抑制转录;④ 甲基化CpG的甲基化胞嘧啶突入双螺旋主沟,抑制转录因子与DNA的结合。DNA 甲基化能增加基因突变率。5一甲基胞嘧啶可自发或在S_腺苷蛋氨酸作用下引起邻位脱氨而使甲基化CpG变成TpG,这种突变能力较非甲基化的CpG 高12倍[7]。

随着研究的深入,肿瘤发生的经典“二次打击理论”并不能解释某些恶性肿瘤其DNA序列完整,没有突变、缺失,但其肿瘤抑制基因却表达失活;也无法解释MMR(错配修复系统)在没有突变情况下,其相关基因为何失活。DNA甲基化理论很好的解释了上述现象,因此又被称为“肿瘤发生的第三种机制”[8],由此拓宽了肿瘤研究的视野,CpG岛甲基化对肿瘤抑制基因失活的关键作用越发凸现出来,成为肿瘤研究热点也不足为奇。

CpG岛甲基化与肿瘤

CpG岛甲基化与恶性肿瘤、衰老与某些遗传性疾病[9-10]有关,很多研究表明在乳腺癌、头颈肿瘤、肝癌、肺癌、胰腺癌、胃癌、结肠癌等多种恶性肿瘤[11-13]中不同程度的存在一个或多个肿瘤抑制基因CpG岛甲基化。

Esteller等[14]对600 份标本予以甲基化检测,包括12种基因:肿瘤抑制基因 (p16INK4a ,p15INK4b ,p14ARF ,p73 ,APC ,BRCA1) ,DNA修复基因( hMLH1 , GSTP1 ,MGMT) 以及转移、浸润相关基因(CDH1 ,TIMP3 ,DAPK) ]和15 种肿瘤(结肠癌、胃癌、食道癌、胰腺癌、肝癌、肾癌、肺癌、头颈部肿瘤、乳腺癌、卵巢癌、子宫内膜癌、膀胱癌、脑瘤、白血病和淋巴瘤) ,从中得出许多重要信息,提出建立某些肿瘤的甲基化图谱的设想,为早期诊断、治疗以及预后判断提供依据。

Fukai等[15]早期及进展期肝癌中都检测到,p16INK4a 基因启动子甲基化而引起其转录失活。Yang等[16]研究51 例肝细胞癌组织中多个相关基因的甲基化状态,结果多基因发生甲基化: SOCS21 ( 65 %) , GSTP ( 54 %) , APC ( 53 %) , Ecadherin(49 %) 及p15 (49 %) ,其中53 %的肝细胞癌有两个以上的抑癌基因甲基化,而在正常组织中为0 %。结果显示,抑癌基因的甲基化是肝细胞癌发生过程中的普遍事件,说明DNA 甲基化与基因转录活性和表达呈负相关,且对肿瘤形成起到重要作用。Corn[17]对31 例食管腺癌的Ecadherin 基因甲基化状态进行研究,84 %的病例发生甲基化,而相应的正常组织大多为非甲基化;同时对4 例正常的食管组织进行研究,发现其正常鳞状细胞上皮没有1 例发生甲基化。Ecadherin 发生甲基化是其失活的一个重要原因,可能是引起食管腺癌重要原因。所以DNA 甲基化状态改变是抑癌基因失活方式之一,是致癌的一个关键因素。Kang、Waki [18-19]对非肿瘤胃黏膜和胃癌组织进行P16、hMLH1、DAP2kmase、Ecadherin、THBS1 及TIMP2S 等基因检测后发现,相关基因CpG岛高甲基化在胃癌发生过程中可较早出现,并趋向与胃癌发生过程相一致,提示相关基因甲基化可作为诊断早期胃癌的一项较为敏感的指标。

DNA甲基化检测方法

尽管DNA甲基化对细胞的生物活性有重要的影响,但对它的检测要比检测DNA的碱基序列相对困难。这主要是由于甲基化的胞嘧啶并不影响C:G核苷酸的配对,并且在聚合酶链反应(PCR)过程中,胞嘧啶上的甲基通常会被丢失。随着技术的进步,现在检测甲基化的手段也丰富起来,不仅可探测某段DNA序列的甲基化分布,而且还能大通量地了解整个基因组甲基化的程度。本文着重介绍应用普遍、易于开展的两种方法:

(一)亚硫酸氢钠法(Sodium Bisulfite法):亚硫酸氢钠可将非甲基化胞嘧啶转化为尿嘧啶,后者经聚合酶链反应(PCR)扩增克隆变成胸腺嘧啶而产生T:A配对,但对甲基化的胞嘧啶亚硫酸氢钠则没有作用,这样甲基化状态不同的DN段就可转化为有碱基序列差异的2个片段。这种方法对小样本有很好的检测能力,是现在研究的主流方法,细分为以下两种。

(1)甲基化特异性PCR(MS―PCR):通常在亚硫酸氢钠处理后,分别针对目的片段完全甲基化的情况和完全非甲基化的情况设计引物。这样样本DNA即可根据自身的甲基化状态分别在相应的PCR组中进行扩增,并将结果通过凝胶电泳图像显示出来。根据扩增条带所在的PCR组可判断样本中甲基化的状况。MS―PCR的特异性很高,操作简便,费用和耗时都较小,但只能部分检测DNA甲基化的状态。对MS―PCR进行适当改进后,设计出半巢式PCR 和巢式PCR ;而改进的实时MS―PCR 可对产物进行定量分析。这些方法都可提高MS―PCR的灵敏性。

(2)亚硫酸氢钠法依赖的基因测序法(BSP bisulfite sequence-PCR):是一种对DNA样本进行亚硫酸氢钠处理和PCR扩增克隆及DNA测序结合的检测方法。然后,根据核苷酸序列中C―T转化情况可判断样本中的甲基化状态,如与原序列比较,发生了C―T的转变,则表示该处未发生甲基化,如没有C―T转变,则发生甲基化。此方法通过测序可获得样本DNA序列中较全面的甲基化信息。

以上两种方法大体过程有很多相似之处,但在引物的设计上有较大差别,BSP引物不包括CpG位点,在CpG位点的上下游,扩增后通过测序检测该位置的甲基化状态(测序如果CG不变则为甲基化,如果CG变为TG则为非甲基化)。MSP是根据修饰后甲基化和非甲基化的引物不同扩增出不同的条带而判断是否为甲基化(只扩增出MSP条带表明为甲基化,如果扩增出USP则表明为非甲基化)。

(二)甲基化敏感的限制性内切酶法: 一些限制性内切酶可识别位点中含有的CpG双核苷酸序列,并结合非甲基化的识别序列,而对发生甲基化的序列则无结合活性。在此基础上,可设计出许多检测甲基化的方法。这些方法分为两大类:一种是检测某个DNA序列或基因甲基化状态的方法。如Southern法,甲基化敏感的限制性图谱(MSRF法);另一种是检测整个基因组或大通量检测许多基因的方法,如限制性标志物全基因组扫描(RLGS)、差异性甲基化杂交分析(DMH)和甲基化CpG岛扩增子分析(MCA)等。这种方法易进行自动化和大通量基因检测。

治疗和应用前景

与基因突变不同,肿瘤发生中DNA甲基化等表观遗传学事件的发生是可以逆转的。因此,在恶性肿瘤和癌前病变中通过去甲基化处理可以恢复某些关键性抑癌基因的功能而起到预防和治疗肿瘤的作用。由甲基化引起基因沉默而出现的肿瘤,可通过DNA甲基转移酶非竞争性或竞争性抑制剂抑制甲基化的发生,活化沉默的抑癌基因,从而达到治疗肿瘤的目的。去甲基化药物: 5-氮胞苷(5-azacytidine)和5-氮- 2′-脱氧胞苷(5-Aza-2′- deoxycytidine)及其衍生物可以抑制甲基转移酶活性,在一些难治性肿瘤,特别是在白血病治疗方面已取得了一定的疗效[22]。应用反义寡核苷酸,针对DNMT1mRNA 的反义寡核苷酸能降低DNMT1蛋白水平,诱导去甲基化和肿瘤抑制基因p16 的再表达,也能抑制小鼠模型肿瘤的生长。这种疗法已进入临床一期试验,显示一定抗肿瘤活性。章扬培[20]等从1987 年始,先后进行了20 株中国人肿瘤细胞系甲基转移酶(MGMT) 活性与对烷化剂亚硝脲耐药性的研究,分析患者MGMT 水平,此为依据对MGMT水平调节,可对患者实施不同的烷化剂治疗方案。

由于DNA甲基化对基因抑制是多种肿瘤都有的特性,且肿瘤的发生常常涉及多个抑癌基因的失活,各种肿瘤都有各自不同的抑癌基因失活,而去甲基化药物针对的是整个基因组而不是特定的基因,可同时恢复多个抑癌基因的表达。但同时这也使得肿瘤中的很多致癌基因由于去甲基化而甲基化程度更低,导致了他们的表达增加,相反又促进了肿瘤的发生,所以一些临床试验用去甲基化药物治疗实体肿瘤的效果还不是很理想[21],应用前景受到了限制。因此理想的药物应该是特异性的甲基化剂而不是非选择性的去甲基化剂,这需要我们更深一步的研究和探讨。

参考文献

[1] Jones PA, Laird PW. Cancer epigenetics comes of age [J]. Nat Genet, 1999; 21 (2):163-167.

[2] Bird A. DNA methylation patterns and epigenetic memory [J]. Genes, Dev, 2002; 16(1):6-21.

[3] Walsh CP,Chaillet IR,Bestor TH.Transcription of IAP end igneous retroviruses is constrained by cytosine methylation.Nat Genet, 1998; 20:116-117.

[4] Lengauer C, Kinzler KW , Vogelstein B.DNA methylation and genetic instability in colorectal cancer cells.Proc Natj Acad Sci USA, 1997; 94:2545-2550.

[5] Robertson KD,Jones PA.DNA methylation:past.present and future directions[J].Carcinogenesis,2000;21(3):46.

[6] Attwood JT, Yung RI , Richardson BC.DNA methylation and the regulation of gene transcription [J].Cell Mol IAfe Sci, 2002; 59(2):241.

[7] Pfeifer GP, Tang M , Denissenko M F. Mutation hotspots and DNA methylation [J].Curr Top Microbiol Immunol, 2000; 249(1): l.

[8] Jubb AM, Be HSM, Quirke P.Methylation and colorectal cancer.J Pathol, 2001; 195:111-134.

[9] Baylin SB, Herman JG, Graff JR, Vertino PM, Issa JP.Alterations in DNA methylation:a fundamental aspect of neoplasia.Adv Cancer Res, 1998; 72:141-196.

[10] Ahuja N, Li Q, Mohan AL, Baylin SB, Issa JP.Aging and DNA Methylation in colorectal mucosa and cancer.Cancer Res, 1998; 58:5489-5494.

[11] Cui J, Yang DH, Bi XJ, Fan ZR.Methylation status of c-fms oncogenein HCC and its relationship with clinical pathology.World Gastroenterol 2001; 7:136-139.

[12] Chang HW , Chow V, Lam KY, Wei WI, Wing-Yuen AP.Loss of E-cadherin expression resulting from promoter hypermethylation in oral tongue carcinoma and its prognostic significance.Cancer, 2002; 94:386-392.

[13] Soria JC, Rodriguez M, Liu DD, Lee J, Hong WK , Mao L.Aberrant Promoter methylation of multiple genes in bronchial brush samples from former cigarette smokers.Cancer Res, 2002; 62:351-355.

[14] Esteller M, Corn PG, Baylin SB, et al. A Gene Hypermethylation Profile of Human Cancer [J]. Cancer Res, 2001; 61 (8):3225-3229.

[15] Fukai K, Yokosuka O, Imazeki F, et al .Methylation status of p14ARF ,p15INK4b ,and p16INK4a genes in human hepatocellular carcinoma [J] .Liver Int ,2005 ;25(6) :1209-1216.

[16] Yang B, Guo MZ, et al. Aberrant Promoter Methylation Profiles of Tumor Suppressor Genes in Hepatocellular Carcinoma[J] .AmJ,2003 ;163(3) :1101-1107.

[17] Corn PG, Heath E, Heitmiller R, et al. Frequent Hypermethylation of the 5′CpG Island of E2Cadherin in Esophageal Adenocarcinoma[J ] .Clin Cancer Res ,2001 ;7 (9) :2765-2769.

[18] Kang GH, Shim YH, Jung HY, et al. CpG island methylation in prem alignant stages of gastric carcinoma[J]. Cancer Res, 2001; 61 (7):2847-2851.

[19] Waki T, Tamura G, Tsuchiya T, et al. Promoter methylation status of Ecadherin, hMLH1, and p16 genes in nonneoplastic gastric epithelia[J] .AmJ Pathol, 2002;161(2):399-403.

[20] 章扬培. 甲基转移酶与肿瘤耐药预见性、个体化化疗的研究[J]. 癌症,2004 ;23(6) :724-734.

经典遗传学和表观遗传学范文4

在分子生物学和计算机技术等相关技术飞速发展的今天,多种高新技术如多重PCR、高通量测序等技术的出现,使得在短时间内快速准确地测定线粒体全基因组序列成为可能,而且随着高通量测序成本的不断降低,线粒体全基因组序列分析已逐渐成为线粒体DNA检测的主要手段。尤其是二代测序技术的出现,使得法医工作者能够方便地获得更全面的线粒体基因组信息,在提高线粒体DNA检测识别率的同时,能够获得更多样品来源信息。二代测序通过一个检测过程就能得到目前所需的所有信息,非常适用于微量检材的检验。有实验室对线粒体全基因组测序结果进行分析,发现其能够提供除高变区外的单倍体类型,从而获得更全面的样本mtDNA单倍群信息。更全面的单倍群信息的应用可明显降低线粒体DNA异质性的假阳性率,同时还能够对组织特异性进行检测。Parsons、Coble等提出,相对于仅对高变区进行测序分析,对线粒体的全基因组测序比对能够明显提高线粒体DNA在人群中的分辨力。除此之外,线粒体DNA本身还包含有许多其它的信息。线粒体在体内作为能量供给站,其编码的基因包括呼吸链的相关蛋白、氧化磷酸化相关蛋白、部分rRNA和tRNA等。相对于控制区,编码区的变异率较低,编码区的序列能够提供样本来源有关的疾病信息,如有研究发现心肌病、肿瘤或动脉粥样硬化等疾病与线粒体DNA序列突变有关。

1线粒体测序

线粒体DNA测序,主要有传统的Sanger测序法,以及以DNA合成为基础的二代测序方法。Sanger测序法是以双脱氧核苷三磷酸(dideoxynucleotidetriphosphate,ddNTP)终止反应为基础的测序方法。近年来由于硬件的不断更新,亦能用于线粒体的全长测序,但由于其时间和成本均较高,该方法的推广和应用受到很大限制。目前,Sanger测序法仍是唯一符合法医学验证标准的测序法。二代测序,又称新一代测序(nextgenerationsequencing,NGS),它以DNA合成为基础,在多个片段同时复制时,通过检测每条DNA链复制过程中释放的离子转化成的电信号或者DNA新链掺入时释放的荧光信号而实现高通量并行测序。二代测序法能在短时间内完成对线粒体基因组的高深度测序,相对经典Sanger测序法灵敏度更高。

1.1测序策略测序的策略根据测序目的以及测序平台的不同而有不同选择。根据获得线粒体DNA方法的不同可将测序分为直接测序和间接测序。直接测序是指先通过DNA提取或扩增获得足够的线粒体DNA后对其进行测序。由于检材量的限制,直接提取得到的DNA量往往非常有限,通常需对线粒体DNA进行PCR扩增或探针捕获进行富集后测序。对于线粒体DNA16569bp全基因组的扩增,需使用多对引物进行分段扩增。有文献推荐使用65对引物或34个扩增片段对线粒体全基因组进行分段扩增,也有报道仅使用12对相互重叠的引物也能获得良好的线粒体全基因组扩增效果。由于法医鉴定中的检材大部分为降解检材,为了提高DNA的检出率,测序的策略应尽量采用较小的扩增片段,并且为避免扩增片段间的相互干扰,还应该减少不必要的扩增子数目。对于线粒体DNA而言,因其序列包含较多高变位点,且存在与核染色体高度同源的序列,使得线粒体测序策略的选择有一定难度。Fendt等先将16kb长的线粒体DNA扩增为A、B两个约8.5kb长的片段,然后用48对测序引物对上述两个长片段进行测序。此方法适合于DNA质量较好的线粒体样本。Lyons等利用Sanger法对人群的线粒体全基因组进行测序,采用的是将16kb的线粒体全基因组序列在96孔板中分成8个扩增子进行扩增,然后再利用多个测序引物进行多重扩增,共将其分为135个片段来进行测序。此方法大大降低了核线粒体DNA(nuclearmitochondrialDNA,NUMT)的干扰,使得测序DNA起始用量降至50pg~1ng。间接测序是指先通过测序得到样品所有的DNA序列信息后,通过生物信息学的方法将线粒体DNA序列筛选出来。此方法很难进行质量控制,也极易受假阳性和核DNA的干扰。在二代测序方面,Mikkelsen等用二代测序平台对10个无关个体的线粒体全基因组进行了检测,采用的是将整个线粒体DN段分为2个扩增子进行测序。Schonberg和Templeton等也是先将线粒体DNA分成2个片段进行特异扩增后,再用物理方法将其打断为适当大小的片段进行测序。此方法虽然可以减少其它非线粒体DNA的污染,但是如此大的扩增子在法医降解检材中很难扩增得到,而Templeton等在扩增片段前还利用探针捕获的方法对线粒体DNA进行富集,能够明显提高二代测序的数据质量。

1.2线粒体DNA异质性线粒体DNA的异质性,是指在同一个来源的线粒体基因组中,同一位置上出现两种或两种以上的分子类型。现在的研究多认为异质性的产生跟瓶颈理论有关,且多发生在高代谢的组织上,如毛发等。线粒体的异质性可分为两种,一种是长度异质性(lengthheteroplasmy,LHP),另一种为点异质性(pointheterolasmy,PHP)。异质性的发生类型多种多样,包括:同一组织来源,不同细胞间;同一细胞,不同线粒体拷贝间;同一线粒体中,不同线粒体DNA分子间。异质性的出现,为法医线粒体DNA鉴定带来一定挑战。但需要注意的是,异质性并非出现于线粒体基因组的必然之物。传统异质性的研究是通过Sanger法测序获得的,但通过Sanger法判断点异质性易受到引物或者异质点位置的干扰,且没有一个确定的异质性标准,灵敏度也较低;而利用二代测序的方法,能够得到整个线粒体DNA序列的异质性位点信息,并且由于是通过双向测序获得,其结果更加准确可靠。通过目前二代测序对线粒体DNA异质性的研究表明,线粒体DNA异质性的发生率要高于以往的研究结果,但到底是由于检测方法敏感度的增加导致的假阳性还是由于异质性的确比之前认为的更易发生,以及如何将此方面研究应用于法医学实际案例,尚需进一步深入研究。除此之外,为了避免不完整测序造成的将可能的单倍型误认为变异,现在一些线粒体DNA数据库以全基因组范围的单倍群为基础。

2线粒体全基因组测序应用研究

目前,已有多个实验室对线粒体全基因组进行深入研究,由此线粒体全基因组数据近年飞速增长,仅2014年增加约15%,其应用范围也越来越广泛,包括法医学中个体识别、亲属关系鉴定以及嫌疑的排除,临床医学上相关疾病的诊断、治疗及危险因素的判断等。在衰老的机制研究中,人们也普遍认为线粒体基因组变异与衰老有关。

2.1法医学应用早在新的测序方法出现前便有学者研究发现线粒体的全基因组测序相较于高变区的测序有更高的识别能力,但由于种种限制使得通过将编码区的SNP位点联合高变区测序成为全基因测序的替代,但这始终无法达到全基因组测序的高分辨率。新的技术出现后,许多学者便尝试将其用于法医学的研究,包括Loreille等利用二代测序平台对高度降解的未知名骨骼样本进行了线粒体全基因组测序。King等对2014年英国出土的怀疑为理查三世的尸骨进行了鉴定,通过Y染色体、线粒体和表观遗传SNP相关位点的联合应用确认该遗骨确为理查三世。其中线粒体就是采用DNA杂交捕获后的长片段扩增,在二代测序平台上获得全基因组数据,并得到了完美比对结果。另外,因为对于一些稀有的疑似单倍型的判断依赖于准确的人群调查,已有的数据大多仅基于非编码区的数据,而随着越来越多的认识发现线粒体全基因组的分析更全面和准确,Just等便用高通量的Sanger测序法对3个民族588个美国个体进行全基因组测序,为将来的全基因组比对提供了更好的基础支持。除此之外,Bouhlal等通过二代测序的方法辅以一代验证对一对同卵双胞胎进行了线粒体全基因组测序,发现了低频率的不同的异质性位点,但考虑到核DNA的干扰,且该实验也缺乏不同年龄段的参考数据,因此有待进一步研究证实。

2.2线粒体相关疾病由于线粒体在体内的主要功能是氧化供能,其变异极有可能导致疾病的发生。将线粒体单倍群与一些相关疾病,如白血病、Ⅱ型糖尿病、老年痴呆症等进行相关性研究发现线粒体全基因组的单倍型类型是疾病发生的相关因素。由于全基因组检测技术的普及,使得线粒体基因的功能研究能够进一步深入。Atilano等使用了分子克隆和线粒体全基因测序的方法,确认了不同单倍群对甲基化的差别调控影响了炎症反应。另外,Zaragoza等利用全测序分析的方法对母系遗传的心肌病病人进行线粒体测序,发现了更多与疾病相关的变异位点。

2.3衰老机制氧化应激是人体衰老的分子机制之一,当细胞出现氧化剂和抗氧化剂的不平衡时便会导致氧化应激的累积。现在认为在氧化磷酸化过程中产生的活性氧作为强氧化剂对细胞的老化有重要的作用,线粒体作为细胞内重要的产生活性氧的器官便在衰老的过程中起着重要的作用。随着年龄增长,线粒体发生的变异也明显增多,目前也尚未明确是由于衰老导致的变异还是由变异造成的衰老,许多实验也能明显观察到随着年龄增长线粒体基因组的变异也随之增加[35]。新的技术为线粒体全基因的变异检测提供了新的解决方案,为线粒体和核DNA的联合分析提供了可能。能否将线粒体全基因的变异与死亡年龄推断联系起来应用于法医实际应用中,有待进一步的研究。

3展望

经典遗传学和表观遗传学范文5

关键词:生物信息学 交叉学科 学生培养

一、生物信息学的产生

生物学是一门古老的学科,在人类历史发展的长河中,人类从未停止过对生命奥秘的探索。人们逐渐认识到,虽然生物种类多种多样,但是它们的最基本分子却是相同的。DNA、RNA和蛋白质等分子构成了生命的基本单位,再由细胞到组织、器官,最后器官系统组成完整的生物体。

传统的生物学研究中,由于受到技术水平的限制,生物学家多采用低通量的生物实验方法,其研究对象通常是一个基因或者几个基因组成的通路。在这种情况下,实验后的简单观察就可以满足研究需要。随着生物研究的不断深入,积累了大量实验数据,人们不禁想到,如何把不同的实验结果整合起来?另一方面,随着生物技术的发展,大量新兴技术出现,产生了海量的数据。例如90年代兴起的基因芯片技术,单张芯片就可以测定成千上万个基因在某一状态下的表达情况。1990年启动的人类基因组计划更为生命科学的研究提供了海量的序列数据。面对如此多的数据,以前依靠生物实验研究单个或几个基因的方法很难再适用,生命科学、统计学、计算机科学和信息科学等若干学科的交叉学科――生物信息学应运而生。生物信息学以计算机、统计、模式识别等方法为手段,以生物数据为研究对象,通过对大量生物数据的储存、处理和分析,提取其中有意义的生物知识[1],从而最终揭示蕴藏在核酸序列和蛋白质序列中的信息,对了解生命活动的基本规律出贡献。

二、生物信息学在生命科学研究中的作用

作为一门新兴的学科,大家对生物信息的作用并不十分明确。很多人认为生物信息学只是为实验科学服务。从广义上讲,这种说法也不无道理,但是生物信息学并不是实验科学的附属品,与生物实验一样,它也是解决生物问题的一种手段。为了解决生物问题,生物学家依靠的是实验台,生物信息学家依靠的是计算机。

在生命科学的发展过程中,以分子生物学的产生为界,可以分为传统生物学和现代生物学。传统生物学和现代生物学取得的成就为生命科学的发展做出了巨大贡献。人类基因组计划启动以来,人们一度认为只要把各种生物基因组的全部碱基排列顺序测定清楚,生命的遗传奥秘就会显露无余,但是真实的情况远不像想象的那样简单。人类的个体发育开始于一个单细胞受精卵,受精卵经过一系列的细胞分裂和分化,产生具有不同形态和功能的细胞,不同细胞之间相互作用构成各种组织和器官。虽然人类基因组中有两万多个基因,但是在单个细胞当中,同时起作用的基因往往是很少的。有些基因只在特定阶段起作用,有些基因只在特定组织起作用。只关心某个基因或蛋白的功能是不够的,因为在不同时空条件下,同一个基因或蛋白的功能可能不同。生物是一个复杂的系统,其表型和功能不仅体现于基因数量和序列的不同,更体现在基因、蛋白以及其他生物分子之间的相互作用之中。因此,把研究对象当成一个整体,系统地分析内部的相互关系尤其重要。但是无论是传统生物学还是现代生物学,都是一门实验学科,生物学的发展中缺乏一种系统思想。生物信息学可以从大量生物数据中提取有意义的生物知识,通过对已有数据的总结,进一步推测生物体的某些性质和变化趋势,生物信息学为大量生物数据的整合提供了可能,与生物实验一样,是生物研究中的一种重要途径。

三、生物信息学学生的培养

生物信息学是一门交叉学科,要求学生具有较好的分子生物学、计算机科学、数学和统计学素养,目前国内只有少数几个学校设立了生物信息学本科专业,大部分的学生都是进入研究生阶段才开始生物信息学的培养。在进入生物信息学专业前,本科阶段可能接受过计算机、统计学、信息学、生物学等某一方面的教育,但要进行生物信息学的研究,大多需要补充其他方面的知识。

生物信息学研究可以分为两类:第一,在深刻理解生物问题的基础上,利用计算技术解决生物问题,第二,为生物学家提供性能更好的方法(算法)。理工科背景学生的生物知识较少,但是对于各种计算方法的原理和使用非常熟悉,对于这类学生的培养,第二类问题比较适合他们入门。在生物信息领域,有很多经典的分类问题。这些问题已经明确了分类目标,并且大都有通用的数据集。但是这类工作也受到了生物学家的质疑,因为大部分工作都是把已有的经典算法用在生物数据上,由于对生物问题不够了解,最后成为只有做生物信息的人才看的方法。这也在一定程度上导致了部分生物学家对生物信息存在偏见,认为生物信息就是提出新算法,做一些数据库。要想真正让生物学家认识到生物信息学的重要性,就要以解决生物问题为根本出发点,即使是做预测方法,也要建立在解决生物问题的基础上。做出更好预测方法的关键是深入理解生物问题并抓住关键特征。举个例子,要把男生和女生分开,我们可以根据很多特征,比如身高、体重、头发长短,虽然大多数情况下来说,男生比女生高、比女生重、比女生头发短。但是只基于这些特征还是会造成很多的分类错误,因为这些特征不是男生女生差别的最根本因素。如果我们是根据性染色体来分,那正确率的提高就非常显著了。在预测问题中,利用五花八门的方法并不是关键,如何能够对生物问题深入了解并找到关键特征,才是最主要的。

作为一门新兴的学科,大家对生物信息的了解还很少,很多人对它的定位也不同。但既然是生物信息,就是先生物后信息,可见生物的重要性。所以,在生物信息的研究过程中,对生物问题只限于表面地理解,势必不能做出好的工作。只有对生物问题有了深入了解,才能发现其中的问题。能够找到值得做的问题,可以说工作已经成功了一大半。当然,解决问题过程中也会有很多困难,比如发现了值得研究的课题,但在解决的过程当中发现某些数据无法获得,或者某些技术超出了自己的能力范围。在这种情况下,可以首先想想有没有其它变通的办法可以解决问题,如果经过慎重的考虑都无法找到,就要果断的放弃。这里要强调一定要慎重考虑,不能遇到一点困难就放弃。

相比理工科背景的学生,生物背景的学生有着扎实的生物学知识基础。但是如果是从本科阶段直接进入生物信息学,由于还没有进行过实验操作,他们对生物问题的理解也很难非常深入。不管是理工科背景还是生物背景的学生,丰富的生物学知识都是进行好的生物信息学研究的前提。在培养学生时不可忽视对其基础生物学知识的传授和教育,并适当引导其对生物学问题的思考。生物学问题可以很大也可以很小。大的生物学问题任何一个懂得基础生物学知识的人都可以提出,但也是最难解决的,比如到底是什么改变使细胞恶变,自身免疫病是如何形成的,心血管病糖尿病等复杂疾病是如何发生的,为何有人容易生某种病而其他人不易感。小的生物学问题就是各自领域的具体研究课题,比如表观遗传学领域的DNA去甲基化酶是否存在,基因表达调控领域的转录起始频率是如何决定的,RNA领域的大量非编码RNA的作用,蛋白修饰领域新发现的修饰如何调控蛋白的功能等等。在脑中提出并试图思考一系列大大小小的生物学问题是对学生培养目标的第一步。这些问题的产生的前提是对生物学知识的熟悉掌握。然而在对学生培养的过程中没必要也不可能告诉他们所有的知识,生物学知识教育的原则是为他们打开门,当他们思考问题的时候知道去哪里找到相关的知识。

另一方面,只有生物学基础知识和问题是不够的。很多问题在生物信息学产生之前就存在了,传统的方法无法带给人们问题的答案。人们一直期待新的方法去理解和解决这些问题。生物信息学的产生无疑提供给人们另一种思考生物问题的方式,为一些经典问题的解决提供了可能。例如最近的大规模的肿瘤基因组测序和分析使我们发现了很多新的肿瘤相关基因[2]。对于生物背景的学生,在教学中要把这样的例子介绍给学生,生物背景的学生在理解信息学理论方面会存在困难。最初很难要求他们理解所有具体过程。但是至少要让他们知道这些方法的基本原理,还有在什么情况下使用。这样在以后的研究中遇到类似问题才能想到应该选择什么样的信息学工具去解决,在具体应用过程中加深对整个过程的理解。生物背景的学生如果想成为生物信息学专家,只会应用是不够的,补充一些计算机、统计、信息方面的基础知识是必不可少的。

生物信息学是一门仍处在快速发展之中的学科。还没有一本教材能够满足生物信息学教学的需要,生物信息学立足于分子生物学、模式识别、计算机科学与技术、数学和统计学等学科,所以学生要先对这些学科的基本概念和系统有一个较为全面和直观的认识,为日后的科研打下坚实的基础。另外,培养过程中要包括大量的实例介绍,对一些重要的应用还加以详细解剖,使得同学们不再仅掌握理论,而是能够学会如何在实际工作中灵活应用这些理论。在此基础之上,向同学们推荐一些最新的论文、期刊、参考读物和相关的学术报告,让同学们能够切身感受到学科发展的前沿,培养学生的创新能力。21世纪是生命科学的时代,也是信息科学的时代。生物信息学在这样的历史条件下产生并壮大,它作为多个领域的交叉新兴学科,对生命科学研究有着巨大的推动力。生物信息学是一门应用性非常强的学科,也是一门非常活跃的前沿学科,良好的教学效果必须以先进的内容体系为基础,我们应时刻注意以科研促进教学,教学科研相长,使教学研究达到更高的水平。

[参考文献]

[1]蒋彦等.基础生物信息学及应用[M].北京:清华大学出版社,2003

经典遗传学和表观遗传学范文6

基因组测序的完成,为我们提供了生命的第一套密码。从基因组数据中提取蕴藏的大量信息,阐明千变万化的生命现象,是生物学家所面临的更大挑战。众所周知,生命活动的基本单位是细胞,人体中数百种细胞分工合作,形成各种组织和器官,最终组合成一个完整的个体。

生物体中,每个细胞内都有一套完整的基因组,为实现正常生物功能,生物体在不同环境、不同发育阶段,选择不同基因适度表达。即使是最简单的生物也有数百个基因,这些基因遵循一定的表达调控机制,依照特定的时空顺序进行有序的表达。在一个特定的时刻,一个特定细胞中所有表达基因的组合,最终限定了这个细胞的生物学功能。转录组学(Transcriptomics)着重研究高度复杂精确的基因表达调控过程。通过对不同细胞类型之间表达模式差异的研究,转录组学试图从动态的角度刻画出一幅生命活动的“动画”。

随着基因组数据的增长,DNA芯片(DNA Chip)技术得到广泛应用。DNA芯片也称基因芯片(Gene Chip)、生物芯片(Biochip)或微阵列(Microarray)。20世纪90年代中叶DNA芯片技术出现前,传统分子生物学技术通常只能同时对少数几个基因的表达情况进行研究。决定生物形态或某种生物现象通常是成百上千的基因共同作用的结果,作为一种能够获得大量基因表达图谱的高通量技术,DNA芯片应运而生。

一、 DNA芯片原理

DNA芯片的基本原理与生物学中Southern杂交等实验技术相似,都是利用DNA双螺旋序列的互补性,即两条寡聚核苷酸链以碱基之间形成氢键配对(A与T配对,形成两个氢键;G与C配对,形成三个氢键)。DNA芯片通常以尼龙膜、玻璃、塑料、硅片等为基质材料,固着特定序列DNA单链探针(Oligo),并与被检测序列单链cDNA序列互补结合(通常称杂交)。被检测序列用生物素或荧光染料标记,通过荧光染料信号强度,可推算每个探针对应的样品量。一张DNA芯片,可固着成千上万个探针,具体数目则取决于芯片设计和制备方法。

根据制备方法,DNA芯片主要可以分成三类:

1) 利用机械装置将cDNA序列或者其他PCR产物点在芯片上作为探针;

2) 利用机械装置将事先合成的寡核苷酸链序列点在芯片上作为探针;

3) 不事先合成寡核苷酸链,而直接在芯片上通过原位合成技术同时合成所有探针。

后两种方法,需要综合考虑探针的灵敏性(Sensitivity)和特异性(Specificity),避免非特异性杂交干扰结果;此外还需要考虑GC含量以及退火反应温度,以保证整个芯片可在相同条件下进行杂交实验,所有探针都有比较一致的杂交效率。不同方法生产的芯片探针长度不一,Affymetrix公司的芯片采用短探针,只有25个核苷酸;而NimbleGen公司所用探针相对较长,可达70个核苷酸。一般来说原位合成芯片可在同一张芯片内容纳更多探针。

除Affymetrix公司生产的芯片外,其他芯片多采用双色杂交系统,即使用Cy5(红)和Cy3(绿)两种染料分别标记所比较两种样品的cDNA序列,然后杂交至同一芯片。实验结果扫描输入计算机,通过染料荧光强度,可间接比较两种样品表达量高低。在一张芯片同时杂交两种样本,可减少用不同芯片所带来的系统误差。

二、 DNA芯片的应用

(一)传统基因表达芯片

传统基因芯片常用于检测一组细胞中全部基因在特定时刻的表达谱。换言之,基因表达产生的mRNA含量,就是DNA芯片要检测的指标。通过将提取的总mRNA反转录为cDNA并杂交到具有不同基因探针的DNA芯片上,就可得到不同基因在不同条件、不同发育阶段下的表达情况。

通过比较不同条件下的基因表达谱差异,可发现与某种疾病或者特殊处理相关的特定类型基因,并可进一步用于临床诊断或基因工程等。目前,基因表达芯片已广泛用于各个方面,如在医学研究中比较肿瘤细胞与正常细胞间、动物服用药物前后等不同情况下基因表达差异,在植物学研究中研究抗旱、抗病种系与普通种系的基因表达差异等。以双色DNA芯片系统进行基因表达量检测实验为例,一般DNA芯片实验步骤包括以下几步。

1) 准备杂交样品,一般分别从样品细胞和对照细胞中提取。

2) 提取的mRNA通过反转录得到更稳定的cDNA,这个过程中分别对样品细胞和对照细胞加入不同荧光染料(双色芯片实验)或者生物素(单色芯片实验)进行标记。

3) 两种样品同时杂交到制作好的芯片上,芯片上每个点都与分别标记有两种不同荧光的样品竞争结合。

4) 通过激光扫描仪器可以获得每个点的荧光强度,荧光强度范围为0~65536(216)。这个步骤中应注意实际荧光强度测量值是可以调节的,应该有意识控制大多数样品荧光强度处在总体范围中间偏上位置,太高易产生太多过饱和值,强度超过上限(通常为65536),扫描仪器无法测量;太低则容易受随机误差干扰。例如,若随机误差强度为50,则信号强度为100,则信噪比过低;反之,若信号强度为10000,信噪比大大加强。

5) 整合两种不同颜色强度可得到虚拟图谱,绿色点表示处理后的细胞中该基因表达量高,红色点反之,黄色点表示处理前后表达水平相当,而黑色点则说明两个颜色标记的样品均无表达,如图1所示。

图1右下角为一张DNA芯片扫描结果,左上角为局部放大。绿色点表示处理后的细胞中该基因表达量高,红色点反之,黄色点表示处理前后表达水平相当,而黑色点则说明两个颜色标记的样品均无表达。

需要注意的是杂交强度不仅代表基因表达水平实际差异,还可能受非特异性杂交影响。为尽量排除这种因素,Affymetirx芯片中设计了不匹配核苷酸探针作矫正依据。此外,染料效率不同带来的系统误差需用均一化方法进行矫正。

DNA芯片作为一种高通量实验技术,不可避免地存在较大误差,也难以像传统生物学实验那样给出确定结果。因而,最初DNA芯片技术主要用于获得大规模基因表达谱。然而,mRNA表达水平仅仅是基因调控的结果,没有代谢途径等信息,只能得到一个表达谱,而无法解释为什么会有这样的表达谱。比如同样是在光照条件下高表达基因,有些基因可能处于光信号传导通路上游,直接受光诱导;而有些基因则可能由联系光通路以及其他代谢途径的关键转录因子激活。这种信息必须结合其他相关知识及实验才能获得。

随着基因组测序计划进展,基因注释技术不断提高,以及生物实验所积累的知识不断增加,DNA芯片得到的结果可以从全局角度分析特定生命过程中的问题。例如,通过聚类分析(Clustering)可以把具有相似表达趋势的基因归类,再结合基因注释系统(Gene Ontology)和已知功能基因等注释信息对每个类别进行总结,探讨这种共表达现象在生物学上的意义,进而可以进行代谢途径分析,从全局观点和系统生物学视角探索基因转录调控乃至生命过程机理。

3) MIDAS(Microarray Data Analysis System)是数据预处理模块,支持LOWESS、Iterative Linear Regression、Slice Analysis等多种常用归一化算法。同时,MIDAS还支持通过标准的t-检验、MAANOVA、SAM等方法寻找差异表达基因。

4) MeV(MultiExperiment Viewer)用来进行聚类和分类,以及结果的可视化显示。目前支持包括层次聚类(Hierarchical clustering)、K-mean聚类、自组织图聚类(Self-Organizing Map,SOM)等多种聚类算法,以及支持向量机(Support Vector Machine,SVM)等多种分类算法。

4.BASE

BASE是一个基于Web的芯片数据管理与分析平台。与上述主要基于单机的分析软件包不同,BASE的设计目标是提供一个可以供多人协同工作的平台。因此,BASE在数据管理方面投入了很多精力,将芯片数据管理与芯片数据注释融为一体,用户可以通过浏览器方便地查询实验进度、观察实验结果,并及时和其他相关人员分享信息。

同时,BASE也提供了一组简单的工具,供研究人员对数据进行一些快速分析。BASE中包含了一个基于Java Applet的三维可视化工具,可供用户从多个角度查看数据分析结果。

5.Matlab Bioinformatics Toolbox

Matlab是经典的科学计算软件,由美国MathWorks公司开发。它集数值运算、符号运算及图形处理于一体,广泛应用于工程和科学计算。类似于R,Matlab的核心部分注重提供一个快速、高效且稳定的平台支持,通过针对不同领域与应用编写特定工具(Toolbox),满足不同客户的专门需求。最新版Matlab 7附带Bioinformatics Toolbox,是Matlab第一个专门针对生物信息应用而开发的工具箱。该工具箱为芯片数据处理提供了归一化和聚类分析,包括层次聚类和K-mean聚类。此外,通过与统计工具箱配合使用,用户还可通过经典的t-检验及ANOVA等方法寻找差异表达基因。与其他专业软件相比(见表1),目前该工具箱芯片数据分析功能还很有限,特别是很多2003年以来发展的新方法都没有包括。

除了Matlab Bioinformatics Toolbox以外,用于学术研究目的时,上述软件都可以免费获得。

四、 小结

随着大规模基因组测序的完成,生物学家开始从相对静态的基因组研究转向更为动态的基因表达过程研究。通过对不同细胞类型之间表达模式差异的研究,可以从动态的角度刻画出一幅生命活动的“动画”,来进一步探索生命的奥秘。