知识组织逻辑学的作用

知识组织逻辑学的作用

作者:刘海涛 张秀兰 单位:辽宁师范大学管理学院

1引言

知识组织是知识的有序化,知识组织的目的就是通过知识的整合、序化,充分挖掘智力资源,促进知识创新。由于目前知识信息量剧增,现有的知识组织方法,如分类主题法、文献索引方法、导航系统方法、元数据等,已经无法满足目前大量异构信息的检索需求,这就需要在知识组织领域研究更具普遍适用性、可重复利用、方便使用的新型的知识组织形式,本体论就在这样的情况下产生了。逻辑学是人类认识世界和改造世界的准绳和工具,是一切学说和理论中关于判断和推理规律的提炼和抽象,它被应用于社会科学和自然科学的方方面面。在基于本体的知识组织中人们运用了大量的逻辑学原理,本体和逻辑学密不可分。

2本体论概述

2.1本体的概念

本体的概念起源于哲学,本体一方面研究存在的本质,另一方面研究整个世界的基本特征。这些年,人们将本体的概念引入图书情报领域,用以解决知识表示、知识重用、知识共享、知识组织体系方面的有关问题。在引入的过程中,本体的内涵也随之变化。在图书情报领域,本体是指一套有关某一学科或某一领域的术语词表,以及术语之间关系的规范和说明[1]。

2.2本体的作用

近年来各个学科渐渐认识到本体在解决知识概念表示和知识组织体系等方面起到的重要作用。经过学者的研究和对比,本体在知识组织中的优势明显大于分类法和叙词表。本体的作用主要有两方面:一是本体的分析澄清了领域知识的结构,本体的可重用性避免了重复的领域知识分析从而为知识表示打好基础;二是统一的术语和概念使知识共享成为可能[2]。

2.3本体的类型

根据应用的领域不同,可将本体分为三类:顶级本体、应用本体和领域本体。顶级本体是描述最一般化的概念,如空间、时间、事件、行动等,独立于特定的问题与领域,作为大众沟通的工具,可以认为是真实世界的常识性知识[3]。应用本体是描述了既依赖于某个特定领域又依赖于某个课题的知识,它与解决问题的方法相关联。一个应用本体与用来描述专业领域的概念相关联,这些概念是解决问题的方法体系的组成部分[4]。领域本体是指以一个特定的领域为描述对象的本体,提供该特定领域的概念定义和概念之间的关系、主要理论和基本原理、领域中发生的活动等[5]。目前对本体的研究,基本集中在领域本体这个分支中,所以本文所涉及的本体领域是以领域本体为代表的。

3逻辑学概述

逻辑学是研究推理、论证及其规律,以及一些逻辑方法的科学[6]。它经过数百年的发展,现在已经成为每个具体学科的理论基础,被广泛应用于各个领域和学科之中。逻辑学是一个十分庞大的学科群,本文主要针对本体应用的逻辑学原理———概念逻辑、思维逻辑、谓词逻辑和归纳推理逻辑,下面分别介绍。

3.1概念逻辑

逻辑学中关于概念的研究和论述是一个重要的组成部分,概念逻辑原理主要包括概念之间的关系原理、概念的划分原理、概念的概括与限制原理、概念与语词的关系原理、概念的种类原理和概念的分析与综合原理等。

3.1.1概念之间的关系原理逻辑学从外延方面研究概念间的关系。根据概念的外延有无重合之处,可把概念间的关系分为相容关系和不相容关系两种。相容关系指两个概念在外延上完全重合和部分重合。根据概念外延的重合情况,可分为完全重合和部分重合。因此,概念的相容关系又可分为同一关系、属种关系和交叉关系。不相容关系指两个概念在外延上完全不同的关系。概念的不相容关系又可区分为矛盾关系和反对关系。矛盾关系是指这样两个概念之间的关系,即两个概念的外延是互相排斥的,而且这两个概念的外延之和穷尽了它们属概念的全部外延。反对关系,是指这样两个概念之间的关系,即两个概念的外延是互相排斥的,而且这两个概念的外延之和没有穷尽它们属概念的全部外延。

3.1.2概念的划分原理划分是揭示概念外延,即按一定标准把一个类概念分为若干并列的种概念的逻辑方法。其中被划分的概念称为划分的母项;划分后所得的概念称为划分的子项;进行划分时所采用的标准称为划分的依据。任何一个划分必须按照这三要素来组成。划分的方法有一次划分和连续划分等。划分必须遵循以下规则:第一,每次划分中,根据只能有一个,不能采用两个或两个以上的根据;第二,划分所得的各个子项外延之和必须等于母项的外延;第三,划分的子项应是互相排斥的,各个子项之间是不相容关系;第四,划分不能越级。

3.1.3概念的概括与限制原理概念的概括是减少概念的内涵,使外延较小的种概念过渡到外延较大的属概念的一种逻辑方法。概念的限制是增加概念的内涵,使外延较大的属概念过渡到外延较小的种概念的一种逻辑方法。概念的概括和限制是人们明确概念的一种逻辑方法。然而要正确对概念概括和限制,就必须遵守以下两条规则:首先,限制后所得的概念必须是原概念的种概念,概括后所得的概念必须是原概念的属概念,即不具有属种关系的概念不能概括和限制。其次,外延最小的种概念不能再限制,因为它下面再没有种概念了;外延最大的属概念不能再概括,因为它上面没有属概念了。

3.1.4概念与语词的关系原理概念是反映事物本质属性的思维形式。任何概念必须借助于语词来表达,概念是语词的思想内容,语词则是表示概念的语言形式。概念与语词既密切联系又相互区别,概念与语词并不是一一对应的。这表现在:第一,同一个语词可以表达不同的概念。例如:“包袱”这一语词表达的概念既可以是用布包起来的包儿,又可以是比喻某种负担。第二,不同的语词可以表达同一的概念。例如:计算机、电脑、电子计算机等语词表达的概念都相同。第三,任何概念都必须通过语词来表达,但不是所有的语词都能表达概念。语词分为实词和虚词两类,实词都是表达概念的,而虚词一般不表达概念。

3.1.5概念的种类原理概念可以依据其不同的反映对象划分成不同的种类。根据概念所反映的对象是否为一类事物的集合体,可以把概念分为集合概念和非集合概念。集合概念反映的对象是集合体,而非集合概念反映的对象是组成集合体的个体。根据概念所反映的对象在数量上的不同,也就是说根据概念的外延数量的不同,可把概念分为单独概念与普遍概念。根据概念所反映的对象是否具有某种属性,可以把概念分为正概念和负概念。#p#分页标题#e#

3.1.6概念的分析与综合原理分析是把整体分解为部分,或把复杂的事物分解为简单的要素,或把历史的过程分解为片段来研究的思维方法。其目的在于了解整体各个部分的性质。综合是把对象的各个部分、各个方面的各种因素结合起来,形成对研究对象的统一整体认识的思维方法。综合是在分析的基础上进行的,它的特点在于探求研究对象的各个部分、方面、因素和层次等。综合必须与分析相结合。综合要使其成果能真正反映现实的多样性,就必须以客观对象整体的分析为依据,没有分析的综合,认识只能是抽象空洞的。分析是综合的基础,综合是分析的深入。在思维过程中,分析与综合是辩证的统一关系,两者相互独立,又互为前提,互相渗透,互相转化。

3.2思维逻辑思维是人脑对客观事物的一般特性和规律性的一种概括的、间接的反映过程,它反映出客观事物的一般特性和规律性的联系和关系。逻辑是关于理性思维和语言能力的学问,并且推理作为一种思维形式是通过语言来表达的,语言的外化凝聚着思维。可以说思维逻辑又是一种抽象逻辑,是逻辑表达的一种高级形式。

3.3一阶谓词逻辑在数理逻辑中,表示一个个体性质的词称为一阶谓词[7]。描述逻辑是一阶谓词逻辑的一种。描述逻辑是人工智能领域的一个研究分支,是一种用来描述概念和概念层次关系的知识表示方法,可以看成是谓词逻辑的子语言,具有严格的以逻辑为基础的语义和良好的推理机制[8]。

3.4归纳推理逻辑探求因果联系的逻辑方法是归纳推理,其方法是比较相关现象的各种场合,从而概括出关于因果联系的一般性结论。这种推理的目的在于探求现象发生的因果联系。一个现象存在必然产生另一个现象,在彼此联系的现象中,若有一现象出现时必然引起另一现象的出现,我们说前一现象叫原因,后一现象叫结果[9]。

4逻辑学原理在基于本体的知识组织中的应用

4.1逻辑学原理在本体构建方法中的应用本体构建是本体知识获取的核心,即从某个领域中获取知识,形成描述该领域数据的语义概念、实例和其间的关系。目前构建本体的方法主要有:基于叙词表的领域本体构建、基于SKOS的叙词表到本体的转换和利用OWL构建本体等几种方法。下面主要介绍基于叙词表的领域本体构建方法。在目前阶段,包含某一学科领域中相对比较完整的术语(叙词)的是本学科领域的叙词表。这些术语(叙词)都经过该领域许多专家的有序组织,它们为本领域本体中概念的创建提供指导;叙词表为领域本体创建还提供了线索和指导,这些指导将为领域本体的创建者们节省大量的时间和精力。基于叙词表构建的领域本体至少在本领域的概念方面应该是比较完整的。基于叙词表的本体构建的核心思想是:把叙词转换成领域本体中的概念;根据叙词间的层次关系,确定所对应的领域本体中概念间的等级关系;参考叙词的限义词、注释为领域本体中的概念添加属性;参照叙词间的关系为领域本体中的概念添加关系、为领域本体中的概念添加实例[10]。根据叙词间的层次关系,确定所对应的领域本体中概念间的等级关系是指采用自中间展开(Middle-out)的方法,即最先确定最重要的概念,然后再确定其他相关概念。这里应用了逻辑学中的概念之间的关系原理中的属种关系,即等级高的概念包含若干个等级低的子概念。而这些本体中概念间的等级关系也具有层次关系,这应用了逻辑学中概念的多方面属性。由于本体作为领域概念模型也具有概念层次的结构,但概念间的关系复杂、交错,其结构更像一个网络,所以这应用了逻辑学中的概念之间的关系原理中的交叉关系、矛盾关系和反对关系,即领域概念模型中的概念间的外延有交叉的、有排斥的。可以说本体中概念(类)之间的关系是无限的,任何描述所给定的领域本体的关系都可以使用,这些关系用来消除概念之间的歧义,这对计算机智能地发现知识是非常重要的[11]。参考叙词的限义词、注释为领域本体中的概念添加属性是指属性具有继承性,等级高的概念的属性,其子概念、子概念的子概念都能继承,因此还要为其子概念确定其特殊的属性。这里应用了逻辑学中的概念的种类原理里的正概念和负概念原理,即子概念必须含有其上位概念不具有的属性,只有这样才能构成子概念。参照叙词间的关系为领域本体中的概念添加关系、为领域本体中的概念添加实例是指领域本体中应包含以下几大类关系:同(近)义关系、反义(相对)关系、上位关系、下位关系、整体部分关系、部分整体关系、因果关系、果因关系、转指关系、方式关系和位置关系。每类关系中都有多个词汇,在构建过程中要选择最能科学表达现实事物(概念)间关系的词。其中的同(近)义关系、反义(相对)关系、上位关系、下位关系用到了逻辑学中的概念之间关系原理中的全部五种关系原理,具体是同义关系对应逻辑学中的同一关系、近义关系对应逻辑学中的交叉关系、反义关系对应逻辑学中的矛盾关系、相对关系对应逻辑学中的反对关系、上位关系和下位关系对应逻辑学中的属种关系。其中的整体部分关系、部分整体关系用到了逻辑学中的概念的分析与综合原理。整体部分关系对应原理中的概念的分析部分,部分整体关系对应原理中的概念的综合部分。其中的因果关系、果因关系用到了逻辑学中归纳推理原理,即探求现象发生的因果联系,一个现象存在必然产生另一个现象,在彼此联系的现象中,若有一现象出现时必然引起另一现象的出现,这里的现象产生对应了领域本体中概念词汇的因果关系、果因关系。

4.2逻辑学原理在本体检错推理中的应用本体检错推理是指在本体形式化语言的逻辑基础上,运用Tableau算法对本体的概念层次、声明的实例以及实例间复杂的语义关系进行检测,以保证本体库结构的逻辑一致性和知识描述的正确性,为后续的蕴涵知识推理、本体库的拓展和与其他领域本体库的集成提供逻辑保证[12]。在本体检错推理中用到的逻辑学原理是描述逻辑。本体作为一种知识表示方法,其逻辑基础、形式化语言以及模型验证问题都与描述逻辑紧密相关。目前主流的本体描述语言DAML、OIL和OWL都以描述逻辑作为形式化的基础,主流的本体推理引擎也主要是基于描述逻辑实现的,如Fact、Race和Racer就分别是基于描述逻辑SH、描述逻辑SHN与描述逻辑SHIQ。从这个角度看,描述逻辑可以被认为是本体检错推理的逻辑基础[13]。#p#分页标题#e#

4.3逻辑学原理在本体整合技术中的应用在信息泛滥的今天,因特网、各种搜索引擎和在线检索工具等尽管能够提供大量的信息资源,但是如何从如此大量的信息中提取出有用信息,就如同从图书馆中查阅书籍,然后还需要读者自己阅读书籍才可以有针对性地获取相关信息。本体作为知识组织的工具,对其进行整合和提取犹如对大型图书馆进行分类提取整合一般,具有非常深远的现实意义,是对知识组织工具的组织[14]。要想利用知识计算出针对各种复杂问题的智能回答,必须把这些知识以适合于计算机自动挖掘的数据结构表示出来。当收集关于某一特定主题的时候,通过整合这些数据结构,例如:在原有数据结构的基础上,加入新进数据结构中新的信息内容、新增细节、精确解释、同义词、同音异形词等,剔除各种冗余因素,实现原有知识体系的提炼和完善[15]。

Adolfo提出的本体的整合技术OM(OntologyMerging)原理是应用算法实现在没有人工干扰的情况下来自网络文件的本体融合,在考虑到不一致性、矛盾性和冗余的情况下形成第三种本体,从而得到一种更接近于现实的问题的答案。Adolfo把整个过程表示为:(本体A+本体B)=本体C[16],这里应该注意的是本体C要和本体A、B的知识相一致,本体A、B是基于网络上的各种不同文献所得,并且这种知识的积聚要求合并的本体是关于相同主题、相同根概念的等量的本体不断重复整个本体整合过程。当前层面上的本体整合不仅要求考虑到概念定义词句的排列问题,还要考虑到概念定义的实际语义表达方面,例如,来源本体中的概念之间的相互关联;与其他概念的相似度问题等等。这里的本体的整合技术应用了逻辑学中的概念之间的关系原理中的同一关系和矛盾关系。其中本体C的知识要同本体A和本体B的知识的和相一致,这应用了逻辑学中的概念之间的关系原理中的同一关系,这一技术也是本体整合技术中的重要技术。另外,本体A和本体B必须是基于网络上的各种不同文献所得,这里的从不同文献获得就应用了逻辑学中的概念之间的关系原理中的矛盾关系,即本体A和本体B来源必须是不同的文献,这一技术是本体整合技术中的关键核心技术。本体的整合技术中,本体A和B是关于相同主题、相同根概念的等量的本体不断重复整个本体的整合过程,所以在这种理想状态下,它们只有是相同主题、相同根概念的等量关系才可以实现上述过程,这也正是应用了概念之间的矛盾关系。

本体整合技术只有在特定本体数量充足并且可用的情况下才有可能实现知识的自动积聚和组织。一台掌握大量给定主题相关资料,同时把这些资料以一种计算机可以自动处理的方式存储的计算机,将会是人类的一个强大的知识(积聚和组织)助手。OM(本体整合技术)需要建立在数量很大的本体集合的基础之上,对于目前来讲是很难实现的,目前公共可用的本体数量非常有限,并且在这有限数量的本体集合中,大部分的本体是“表层的”,即大部分本体在提供节点概念方面并没有有效地控制和提供限制点。还有一个更加重要可以说最基本的问题就是缺乏足够的基于同一主题的本体,这都是OM实现存在的限制[17]。

5结语

逻辑学基本理论的广泛应用,在本体研究中发挥了重要的作用,它为本体的深入发展提供了理论基础和方法论基础。本体的发展过程离不开逻辑学的有力支撑。如今,随着科技环境的日益变化,本体正在不断地构建一种理想的逻辑思维模式和系统,使其更好地应对科技时展所带来的冲击。逻辑学为本体的发展指明了方向,同时也为其发展的正确性提供了保障。在逻辑学的指导下,本体构建方法、本体检错推理和本体整合技术等都将不断完善、创新,最终为人类认识世界、改造世界创造条件。