前言:中文期刊网精心挑选了药用植物学的含义范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
药用植物学的含义范文1
关键词:药用植物;代谢组学;功能基因组学
代谢组学是对生物体内代谢物进行大规模分析的一项技术[1],它是系统生物学的重要组成部分(如图1所示),药用植物代谢组学主要研究外界因素变化对植物所造成的影响,如气候变化、营养胁迫、生物胁迫,以及基因的突变和重组等引起的微小变化,是物种表型分析最强有力的工具之一。在现代中药研究中,代谢组学在药物有效性和安全性、中药资源和质量控制研究等方面具有重要理论意义和应用价值。另外,在对模式植物突变体文库或转基因文库进行分析之前,代谢组学往往是首先考虑采用的研究方法之一。目前,国外已有成功利用代谢组学技术对拟南芥突变株进行大规模基因筛选的例子,这为与重要性状相关基因功能的阐明和选育可供商业化利用的转基因作物奠定了基础。
图1系统生物学研究的四个层次略
目前,还有许多经济作物的全基因组测序计划尚未完成,由于代谢组学研究并不要求对基因组信息的了解,所以在与这些作物有关的研究领域具有更大的利用价值,这也是其与转录组学和蛋白组学研究相比的优势之一。代谢组学研究涉及与生物技术、分析化学、有机化学、化学计量学和信息学相关的大量知识,Fiehn[2]对代谢组学有关的研究方向进行了分类(见表1)。
1代谢组学研究的技术步骤
代谢组学研究涉及的技术步骤主要包括植物栽培、样本制备、衍生化、分离纯化和数据分析5个方面(见图2)。
1.1植物栽培
对研究对象进行培育的目的是为了对样本的稳定性进行控制,相对于微生物和动物而言,植物的人工栽培需要考
表1代谢组学的分类及定义略
虑更多的问题,如中药材在不同年龄、不同发育阶段、不同部位以及光照、水肥、耕作等环境因素的微小差异都可引起生理状态的变化,而这些非可控及可控双重因素的影响很难进行精确的控制,从而影响药用植物代谢组研究的重复性。为了解决以上问题,推荐使用大容量的培养箱[3],定时更换培养箱中栽培对象的位置,以及使用无土栽培技术等,FukusakiE[4]利用无土栽培系统将水和养分直接引入植物根部,并且对供给量进行精确地控制,大大提高了实验的重复性。
1.2样本制备
为了获得稳定的实验结果,样本制备需要考虑样本的生长、取样的时间和地点、取样量以及样本的处理方法等问题,并根据分析对象的分子结构、溶解性、极性等理化性质及其相对含量大小对提取和分离的方法进行选择,逐一优化试验方案。MaharjanRP等[5]用6种方法分别对大肠杆菌中代谢产物进行提取,发现用-40℃甲醇进行提取的效果最好。现阶段代谢组学的分析对象主要集中在亲水性小分子,尤其是初级代谢产物,气相色谱质谱联用(GCMS)和毛细管电泳质谱(CEMS)联用都是分析亲水小分子的重要技术。FiehnO等[6]使用GCMS对拟南芥叶片中的亲水小分子进行了分析,发现酒石酸半缩醛、柠苹酸、别苏氨酸、羟基乙酸等15种植物代谢物。
1.3衍生化处理
对目标代谢产物的衍生化处理取决于所使用的分析设备,GCMS系统只适合对挥发性成分进行分析,高效液相色谱法(HPLC)一般则使用紫外或荧光标记的方法对样本进行衍生处理,BlauK[7]对酯化、酰化、烷基化、硅烷化、硼烷化、环化和离子化等衍生方法进行了详细的说明。然而离子化抑制常使得质谱分析过程中目标代谢产物的离子化效率降低,这主要是由于分离过程中污染物与目标代谢物难以完全分离开所引起的,优化色谱分离时间可有效缓解离子化抑制,然而在实际操作中不可能对上百种代谢产物的分离时间进行优化,利用非放射性同位素稀释法进行相对定量可以很好的解决该问题。HanDK等[8]应用同位素编码的亲和标记(ICAT),根据经诱导分化的微粒蛋白及其同位素标记物的峰面积比,对该蛋白的相对含量进行分析。ZhangR等[9]发现同位素标记技术也可用于代谢组学的研究,但是却存在许多困难。活体的同位素标记方法对于同位素的洗脱是一种非常有潜力的技术,目前关于使用34s的研究已有报道[10]。
图2代谢组学研究技术步骤略
1.4分离和定量
分离是代谢组学研究中的重要步骤,与质谱联用的色谱和电泳分析技术都是使用紫外或电化学检测的方法进行定量,其对代谢组数据的分辨率与定量能力都有一定的影响。TomitaM等[11]总结了各种色谱分离法中经常遇到的技术问题,认为毛细管电泳和气相色谱法由于具有较高的分辨率,已成为代谢组学研究的常规技术手段之一,液相色谱因其适用范围广,应用也相当广泛。
TanakaN等[12]用高效液相色谱对样品进行分离,认为使用硅胶基质填充毛细管整体柱的高效液相色谱系统具有用量少、灵敏性高、低压降高速分离等优势;同时,TolstikovV等[13]也使用硅胶填充的毛细管液相色谱方法对聚戊烯醇类异构体进行了有效分离,获得了很好的分辨率。TanakaN等[14]发现二维毛细管液相色谱法的分辨率比传统的高效液相法高10倍。相对于其他色谱方法而言,超临界流体色谱(SFC)是分离疏水代谢物最具潜力的技术之一,特别适用于分离那些传统HPLC难以分析的疏水聚合物,BambaT等[15]通过SFC对聚戊烯醇进行分析,证明其具有较好的分离能力。针对质谱中存在的共洗脱现象,HalketJM等[16]发明了一种适用于GCMS的反褶积系统,对共洗脱的代谢产物进行分离与识别。AharoniA等[17]使用傅立叶变换离子回旋共振质谱(FTICRMS)对非目标代谢物进行分析,快速扫描植物突变样品,获得了一定量的代谢成分。
与分离一样,定量能力也是代谢组学研究中的重要因素,其取决于各分析系统的线性范围。傅立叶转换核磁共振(FTNMR)、傅立叶红外光谱(FTIR)以及近场红外光谱法(NIR)等技术由于敏感性低,重复性受共洗脱现象影响较小也被用于检测中。近年来,FTNMR技术常被用于植物代谢组的指纹图谱研究[18],但由于NMR分析需要样品量较大,分析结果易受污染,GriffinJL[19]发现将统计模式识别与FTNMR相结合可以对代谢物进行全面分析。除FTNMR之外,FTIR通过对有机成分的结构进行常规光谱测定,也可适用于代谢组学的研究,特别是应用于构建代谢组学的指纹图谱。尽管它不能对代谢物进行全面分析,但对具有特定功能的组分却有很好的定量效果,对从工业及食品原材料中分离的代谢混合物也可以进行全面分析,目前,已有学者将其成功地应用于拟南芥[20]和番茄[21]代谢产物指纹图谱的研究中。
1.5数据转换
为阐明代谢物复杂的线性或非线性关系,需要进行多变量分析,将原始的色谱图数据转换为数字化的矩阵数据,通过对色谱峰鉴定和整合从而进行多变量分析。由于环境等因素的干扰,光谱数据需要通过适当的数据加工方法进行校正,包括:①降低噪声;②校正基线;③提高分辨率;④数据标准化。JonssonP等[22]报道了一种关于GCMS色谱图数据处理的方法,可以对大量代谢产物样品进行有效的识别。
2代谢组学中的数据分析方法
2.1主成分分析法(PCA)
主成分分析法,将实测的多个指标用少数几个潜在的相互独立的主成分指标线性组合来表示,反映原始测量指标的主要信息。使得分析与评价指标变量时能够找出主导因素,切断其他相关因素的干扰,作出更为准确的估量与评价。PCA数据矩阵通常来自于GCMS,LCMS或CEMS,因此将目标代谢产物作为自变量,而相应的代谢产物含量作为因变量,定义与最大特征值方向一致的特征向量为第一主成分,依此类推,PCA便能通过对几个主要成分的分析,从代谢组中识别出有效信息。主成分分析有助于简化分析和多维数据的可视化,但是该方法可能导致一部分有用信息的丢失。
2.2层次聚类分析法(HCA)
层次聚类分析法也常用于代谢组学的研究中,它是将n个样品分类,计算两两之间的距离,构成距离矩阵,合并距离最近的两类为一新类,计算新类与当前各类的距离。再合并、计算,直至只有一类为止。进行层次聚类前首先要计算相似度(similarity),然后使用最短距离法(NearestNeighbor)、最长距离法(FurthestNeighbor)、类间平均链锁法(BetweengroupsLinkage)或类内平均链锁法(WithingroupsLinkage)四种方法计算类与类之间的距离。该方法虽然精确,但计算机数据密集,对大量数据点进行分析时,更适合选用K均值聚类法(KMC)或批次自组织映射图法(BLSOM),而HCA适合将数据转换为主成分后使用。2.3自组织映射图法(SOM)
神经网络中邻近的各个神经元通过侧向交互作用相互竞争,发展成检测不同信号的特殊检测器,这就是自组织特征映射的含义。其基本原理是将多维数据输入为几何学节点,相似的数据模式聚成节点,相隔较近的节点组成相邻的类,从而使多维的数据模式聚成二维节点的自组织映射图。除PCA和HCA外,SOM同样也可应用于包括基因组和转录组等组学研究中[23]。最初SOM计算时间长,依靠数据输入顺序决定聚类结果,近年来SOM逐渐发展成为不受数据录入顺序影响的批次自组织映射图法(BLSOM)。由于BLSOM可以对类进行调整,且有明确的分类标准,优化次序优于其他聚类法,已在基因组学和转录组学数据分析中得到广泛的应用。
2.4其他数据采矿方法
除PCA、HCA和SOM外,很多变量分析方法都可用于植物代谢组学的分析。软独立建模分类法(SIMCA)是利用主成分模型对未知样品进行分类和预测,适合对大量样本进行分析;近邻分类法(KNN)和K平均值聚类分析法(KMN)也可用于样品分类;主成分回归法(PCR)或偏最小二乘回归法(PLS)在某些情况下也可使用。然而到目前为止由于还没有建立一个标准的数据分析方法,代谢组学仍然是一门有待完善的学科。
3代谢组学在药用植物中的实践
植物药材来源于药用植物体,而药用植物体的形态建成是其体内一系列生理、生化代谢活动的结果。植物代谢活动分为初生代谢和次生代谢,初生代谢在植物生命过程中始终都在发生,其通过光合作用、柠檬酸循环等途径,为次生代谢的发生提供能量和一些小分子化合物原料。次生代谢往往发生在植物生命过程中的某一阶段,其主要生物合成途径有莽草酸途径、多酮途径和甲瓦龙酸途径等。植物药材含有的生物碱、胺类、萜类、黄酮类、醌类、皂苷、强心苷等活性物质的绝大多数属于次生代谢产物,因此探讨次生代谢产物在药用植物体内的合成积累机制及其影响因素,对于提高活性物质含量、保证药材质量、稳定临床疗效等具有重要意义。孙视等[24]通过对银杏叶中黄酮类成分积累规律的研究,提出了选择具有一定环境压力的次适宜生态环境解决药用植物栽培中生长和次生产物积累的矛盾。王昆等[25]以人参叶组织为材料,总结了构建人参叶cDNA文库过程中存在的一些关键问题和应采取的对策,为今后关于人参有效成分如人参皂苷的生物合成途径及其调控的基础研究提供技术参考和理论指导。最近,美国加利福尼亚大学伯克利分校的Keasling等[26]采用一系列的转基因调控方法,通过基因工程酵母合成了青蒿素的前体物质——青蒿酸,其产量超过100mg/L,为有效降低抗疟药物的成本提供了机遇。经过长期的研究积累,人们对代谢途径的主干部分(为次生代谢提供底物的初生代谢途径)已经基本了解,例如酚类的莽草酸途径,萜类的异戊二烯二磷酸(IPP)途径等。被子植物中一些相对保守的次生代谢途径也得到了很好的研究,如黄酮类、木质素的生物合成与调控。然而,对次生代谢最丰富最神奇的部分——特定产物合成与积累的过程,还所知甚少[27]。
4展望
近年来,代谢组学正日益成为研究的热点,越来越多的人已加入到代谢组学的研究中。随着代谢组学积累的数据和信息量的增大,其在药用植物学各个领域的应用价值也与日俱增。它将不仅能对单个代谢物进行全方面的分析,更能寻找其代谢过程中的关键基因、通过代谢指纹分析对药用植物进行快速分类、进一步研究药用植物有效成分代谢途径以及环境因子对植物代谢和品质的影响与调控机制。
然而依据传统中医药学和系统生物学的指导思想,目前急待解决的是中药种质资源的代谢组学研究和中药体内作用的代谢组学研究。同时,代谢组学在分析平台技术、方法学手段和应用策略等方面相对于其他组学技术还需要进一步发展和完善,还需要其他学科的配合和介入。相信随着更有力的成分分析设备的使用及代谢组数据库的建立,药用植物代谢组学将对中医药学产生深远的影响。
【参考文献】
[1]WECKWERTHW.Metabolomicsinsystemsbiology[J].AnnuRevPlantBiol,2003,54:669-689.
[2]FIEHNO.Metabolomics—thelinkbetweengenotypesandphenotypes[J].PlantMolBiol,2002,48:155-171.
[3]TRETHEWEYRN.Metaboliteprofilingasanaidtometabolicengineeringinplants[J].CurrOpinPlantBiol,2004,7:196-201.
[4]FUKUSAKIE,IKEDAT,SUZUMURAD,etal.Afaciletransformationofarabidopsisthalianausingceramicsupportedpropagationsystem[J].JBiosciBioeng,2003,96:503-505.
[5]MAHARJANRP,FERENCIT.Globalmetaboliteanalysis:theinfluenceofextractionmethodologyonmetabolomeprofilesofEscherichiacoli[J].AnalBiochem,2003,313:145-154.
[6]FIEHNO,KOPKAJ,TRETHEWEYRN,etal.Identificationofuncommonplantmetabolitesbasedoncalculationofelementalcompositionsusinggaschromatographyandquadrupolemassspectrometry[J].AnalChe,2000,72:3573-3580.
[7]BLAUK,HALKETJM.Handbookofderivativesforchromatography[M].2nded.JohnWiley&Sons,Chichester,1993.
[8]HANDK,ENGJ,ZHOUH,etal.Quantitativeprofilingofdifferentiationinducedmicrosomalproteinsusingisotopecodedaffinitytagsandmassspectrometry[J].NatBiotechnol,2001,19:9469-9451.
[9]ZHANGR,SIOMACS,WANGS,etal.Fractionationofisotopicallylabeledpeptidesinquantitativeproteomics[J].AnalChem,2001,73:5142-5149.
[10]MOUGOUSJD,LEAVELLMD,SENARATNERH,etal.Discoveryofsulfatedmetabolitesinmycobacteriawithageneticandmassspectrometricapproach[J].ProcNatlAcadSciUSA,2002,99:17037-17042.
[11]TOMITAM,NISHIOKAT.Forefrontofmetabolomicsresearch[M].Tokyo:SpringerVerlagTokyo,2003.
[12]TANAKAN,KOBAYASHIH,ISHIZUKAN,etal.Monolithicsilicacolumnsforhighefficiencychromatographicseparations[J].JChromatogrA,2002,965:35-49.
[13]BAMBAT,FUKUSAKIE,NAKAZAWAY,etal.Rapidandhighresolutionanalysisofgeometricpolyprenolhomologuesbyconnectedoctadecylsilylatedmonolithicsilicacolumnsinhighperformanceliquidchromatography[J].JSepSci,2004,27:293-296.
[14]WIENKOOPS,GLINSKIM,TANAKAN,etal.Linkingproteinfractionationwithmultidimensionalmonolithicreversedphasepeptidechromatography/massspectrometryenhancesproteinidentificationfromcomplexmixtureseveninthepresenceofabundantproteins[J].RapidCommunMassSpectrom,2004,18:643-650.
[15]BAMBAT,FUKUSAKIE,NAKAZAWAY,etal.
Analysisoflongchainpolyprenolsusingsupercriticalfluidchromatographyandmatrixassistedlaserdesorptionionizationtimeofflightmassspectrometry[J].JChromatogrA,2003,995:203-207.
[16]HALKETJM,PRZYBOROWSKAA,STEINSE,etal.Deconvolutiongaschromatography/massspectrometryofurinaryorganicacidspotentialforpatternrecognitionandautomatedidentificationofmetabolicdisorders[J].RapidCommunMassSpectrom,1999,13:279-284.
[17]AHARONIA,RICDEVOSCH,VERHOEVENHA,etal.NontargetedmetabolomeanalysisbyuseofFouriertransformioncyclotronmassspectrometry[J].Omics,2002,6:217-234.
[18]OTTKH,ARANIBARN,SINGHB,etal.Metabolomicclassifiespathwaysaffectedbybioactivecompouds.ArtificialneuralnetworkclassificationofNMRspectraofplantextracts[J].Phytochemistry,2003,62:971-985.
[19]GRIFFINJL.Metabonomics:NMRspectroscopyand
patternrecognitionanalysisofbodyfluidsandtissuesforcharacterisationofxenobiotictoxicityanddiseasediagnosis[J].CurrOpinChemBiol,2003,7:648-654.
[20]GIDMANAE,GOODACREBR,EMMETTCB,etal.Investigatingplantplantinterferencebymetabolicfingerprinting[J].Phytochemistry,2003,63:705-710.
[21]JOHNSONHE,BROADHURSTD,GOODACRER,etal.Metabolic
fingerprintingofsaltstressedtomatoes[J].Phytochemistry,2003,62:919-928.
[22]JONSSONP,GULLBERGJ,NORDSTROMA,etal.AstrategyforidentifyingdifferencesinlargeseriesofmetabolomicsamplesanalyzedbyGC/MS[J].AnalChem,2004,76:1738-1745.
[23]HIRAIMY,YANOM,GOODENOWEDB,etal.IntegrationoftranscriptomicsandmetabolomicsforunderstandingofglobalresponsestonutritionalstressesinArabidopsisthaliana[J].ProcNatlAcadSciUSA,2004,101:10205-10210.
[24]孙视,刘晚苟,潘福生,等.生态条件对银杏叶黄酮含量积累的影响[J].植物资源与环境,1998,7(3):1-7.
[25]王昆,王颖,鲍永利,等.人参叶cDNA文库构建中的问题与对策[J].人参研究,2005,17(4):2-4.
药用植物学的含义范文2
由于语言的变迁、学科的融合和发展等因素的影响,以及长期以来中医药学术语缺乏规范化,导致了中医药学术语外延宽泛,内涵不清,常出现一词多义、一义多词、词义演变等现象[1]。语言系统的建立可以解决因为概念表述方式不统一和相关信息分散而造成缺失、错误等一系列低效检索结果的发生。中医药一体化语言系统(TCMLS)现代部分的构建已初具规模,但中医古籍部分的语言系统建设却一直缺如。中医古籍所含学术内容在整个中医药体系中具有根基性的重要地位,以古汉语为表述方式的中医古籍学术体系有别于现代中医药语言体系,两者决定了中医古籍语言系统是TCMLS的一个不可或缺的组成部分。笔者在此基础上进行尝试,并试图对实践过程中遇见之问题勉力探讨。
1 背景介绍
TCMLS是以UMLS(一体化医学语言系统)为参考,以本体论为指导,以中医药语言特点及学科体系为依据,以Vocabulary Builder软件为平台研制开发的,在UMLS原有语义类型和语义关系的基础上,根据中医学的特点设计了126种语义类型和60种语义关系,按学科分为16大类,目前已经完成超过30万词条加工。TCMLS是古籍语言系统构建的基础,在其总目下增加古籍术语一类,暂作为古籍语言系统加工的平台。
2 存在问题及初步解决方案
2.1 中医古籍分类体系的构建问题
古籍分类就是按照古籍内容的学科性质分门别类,将之组织(构建)成一个知识体系。其作用在于不仅能够呈现古籍的基本内容、同一科目有些什么古籍,而且还可以揭示出各个科目所含古籍之间的相互关系。现有的《中国图书分类法》和《全国中医图书联合目录》分类法,均不能较好地解决构建中医古籍语言系统所需要的分类体系。因其或注重学术流派,或关注图书本身,而对文献的内容关注较少。语言系统整体框架内古籍部分的分类显然不能局限于文献图书本身,而必须立足于文献所包含的知识,方能更好地分析把握其含义及相关关系。
在现代中医药语言系统分类体系的基础上,根据古籍的特点进行分类的修订和完善,预先建立一个能够满足中医古籍语言系统整体架构需求的分类体系比较困难,而且自上而下建立的分类可能遗漏古籍中的部分信息。
有鉴于此,本研究采取先在《内经》、《伤寒论》的章节目录下进行现有词条加工的方法,在完成3本词典1万余词条的处理后,根据相应词条上位词的提取构建古籍的分类体系的初步轮廓,在此基础上进行修订。由下而上根据具体概念的上位词所反映出的上下位关系而最终建立起古籍分类体系,以期更切合实际,易于被最终用户理解和接受。
2.2 古籍概念定义问题
2.2.1 定义筛选问题 古籍中的概念定义纷繁复杂,如“下”在《内经词典》中有多达20个不同的定义,其中“在下”、“向下”、“低处”、“量词”等解释,与医学关系不甚密切,属于公共领域的含义,这样的概念定义加工进语言系统非但意义不大,而且会使整个系统变得冗余。所以,采取先筛选出与医学相关的定义,然后再加工的原则进行概念词的录入。
2.2.2 定义取舍问题 依据词典的解释相对比较确定,但却不是古籍语言系统加工的唯一路径。古代医学概念语义具有较大的复杂性、多义性,这是对其理解的难点,同时也影响、制约着TCMLS的构建,对概念语义失之辨析,会导致语义网络的失真、错误,影响语言系统的最终应用。如何给内涵和外延都很复杂的古籍概念进行比较明确的定义,是关系到古籍语言系统构建准确性的关键问题。参考和借鉴各领域的最新研究成果是目前可行的途径。
如针灸概念部分可以以“针灸理论文献通考”项目组的最新研究成果为依托,进行下一步的加工处理。如若没有现成的研究成果,可以在加工过程中及时咨询专家意见,以不断调整完善。
2.3 与原有系统概念的兼容问题
中医古籍语言系统的构建不但要尽力展现古籍中同一概念术语在不同语境、文本、历史时期中内涵的演变,建立概念之间的同义、近义以及相关关系,从而避免检索中可能出现的遗漏或错检,而且要最终实现古籍概念术语与现代中医药语言系统之间的互通甚至与UMLS的兼容。
古籍概念与现代部分的中医药概念完全同名,但是意义却完全不同。如“根”,在药用植物学里是植物体生长在土壤中的营养器官,而在古代针灸概念中却是“井穴”,二者全然不同的含义使我们在加工处理的时候,要进行进一步的区分,以便可以快速搜索到检索者想要查询的概念。如在“根”后面用括号的形式标注出所属学科,可以避免药用植物学中“根”这个作为类存在的概念与针灸学中的具体概念“根”发生混淆。这是具体加工过程中初步的解决方案。
2.4 古籍概念的加工来源问题
TCMLS的建立最初都是来源于教材、词典、工具书,因其有比较明确的定义,便于加工处理。这对于中医药学现代部分而言比较合适,但古籍的概念比较分散,不是几本工具书就能涵盖包容的。所以,古籍语言系统未来的加工范围要扩展到具体古籍,如《千金方》、《外台秘要》等,这就需要制定更为详尽的规则。
如何在古籍文本中获取领域概念?所谓领域概念,从某种意义上讲是领域知识在文本中的外在表现。领域概念的获取就是从领域文本集合中抽取最能代表该领域的概念集合,这个过程包括从领域文本中抽取术语集合、词性规范(同义词处理)以及领域概念的筛选和确定[2]。换言之,我们要加工的概念是否是语义的集合,这样的遴选就给加工增加了不确定性和难度。具体的规则制定尚有待进一步考量商榷。
2.5 语义类型及语义关系的适配性问题
TCMLS中在进行中医药一体化语言系统构建时已经对语义类型和若干语义关系进行增删改动,如删减了“练习”、“展示”两个语义关系,增加了“开窍于”、“与……相表里”、“概念上对应”、“与……类似概念”、“与……相互依存”、“与……相互制约”、“与……相互转化”等7个语义关系[3],但是还不能完全匹配古籍语言系统的需求。
如“下哺”,应该属于对发病时间的描述,原有的语义类型中的“医学天文气象”和“时间医学”都不是十分恰当。如“咽为之使……魄门亦为五藏使”中“……使”的语义关系描述在现有的系统中不存在,可以考虑新建。
总之,在加工过程中需要对原有的语义类型及语义关系进行适当的增删,以期更能满足古籍的需求。
3 思考与展望
中医古籍在整个中医药学科中的重要地位毋庸置疑,但是,古籍语言系统是否有独立构建的必要是一个值得商榷的问题。单独构建一个古籍语言系统可以使其知识自成体系,浏览与检索时比较直观系统,但现有的TCMLS“中医基础理论”类下包含了很多古籍的术语,这将导致古籍系统与现代部分不可避免的重复。反之,如果将古籍语言系统完全嵌入现代语言系统,融合的过程中亦会出现兼容的各种问题,原有的分类结构必须要进行调整修改,原有的与古籍关联的概念亦要进行修订,这是一个巨大的工程。如何在两者之间权衡,是古籍语言系统建设中值得探讨的重大问题之一。
如何使TCMLS得到合理充分的应用是语言系统建设过程中一直面临的问题,结合中医药共享平台和中医药共建平台对搜索功能的支持和利用语言系统作为词库的中医药领域分词系统[4]是目前主要的应用范畴。尚在建设初期的古籍语言系统可以参照TCMLS进行应用领域的开发尝试,建立中医古籍可以共享重用的本体以及相关的数据挖掘是可以发展的方向之一。
综上所述,中医古籍语言系统的构建是一个十分紧迫且困难的重要工作,不但要解决古籍分类,语义类型、语义关系适配,与原有系统的兼容,概念的筛选,定义的删减等问题,而且还要解决古籍概念的多义性、迁延性、不确定性等问题,后者的解决更需要相关领域研究的支持,方能在未来初现古籍语言系统之端倪。
参考文献
1 朱建平.中医术语规范化与中医现代化国际化[J].中华中医药杂志, 2006,21(1):6-8.
2 何 琳.古农学本体的半自动构建及检索研究[D].南京:南京农业大学, 2007.