资源预览内容
第1页 / 共11页
第2页 / 共11页
第3页 / 共11页
第4页 / 共11页
第5页 / 共11页
第6页 / 共11页
第7页 / 共11页
第8页 / 共11页
第9页 / 共11页
第10页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
领域专家知识在本体半自动构建中的作用机理研究领域专家知识在本体半自动构建中的作用机理研究摘要解析领域本体半自动构建的流程,指出专家知识在本体半自动构建中的作用特点。基于流程分析领域专家在本体半自动构建中贡献知识的 4 个关键作用点和 4 个一般作用点,以及在不同作用点上的作用深度、作用方式和作用冲突,进而剖析领域专家知识在本体半自动构建中的作用机理。关键词领域专家 专家知识 本体半自动构建 作用机理1 引言本体作为一种明确的规范化概念说明,以其在领域内达成共识的概念体系来克服计算机系统之间的“语义鸿沟” ,其目的是要实现计算机的可理解。领域本体的构建离不开领域专家的知识。领域专家是指精通某一领域的知识、有独到的见解,在本领域的实践中具有专门技能、知识和经验的人。领域专家知识的利用和挖掘越深入、领域专家之间达成共识的程度越深,所构建的本体也就越具公认性性与权威性。目前国内外关于领域专家在本体构建中作用的论述比较零散,虽然几乎所有关于本体构建的论文都承认并肯定了领域专家知识的重要性,但没有对此进行系统、深入的研究,使其成为一个盲点。目前的研究基本上集中于以下几方面:领域专家的作用与价值。如 liao s c 等(2009)和 na j c 等(2009)均肯定了领域专家对概念的准确区分的价值;李景则将领域专家的价值融入到本体构建工程中。领域专家数量与意见冲突问题。chi y l 等(2009)、方安等(2009)认为创建本体过程中产生误差的关键原因是专家之间的偏见及不同意见;周宁等(2009)提出应寻求更多领域专家一起参与建立、修改和优化本体的机制。领域专家参与的程度与环节问题。kayed a(2005)、马静等(2007)认为在本体构建的多数环节都需要领域专家的参与;刘琳娜等(2007)和刘仁宁等(2008)认为领域专家参与程度影响了知识表达的全面性;宗南苏等(2009)对领域专家参与本体构建的方法问题进行了研究。本体构建是一种以知识结构的揭示为核心的工作,因此运用系统方法探索领域专家介入的时机、程度、与本体知识结构的作用方式和作用机理,研究领域专家之间、与信息管理专业人员协作沟通的方式和效果就极为重要。2 半自动本体构建一般流程相对于完全依靠专家人工构建本体的方法,半自动本体构建可以降低难度和成本,节省时间,提高效率,因此得到更多的青睐和应用。专家在人工构建本体与半自动构建本体中作用的最大差异在于确定概念和关系的方法方面。专家进行人工构建本体的方法,需要专家们在确定概念和概念关系环节中,完全依赖自身的专业知识和对知识的理解打造概念体系,成本高,效率低。在半自动本体构建方法下,首先可以采用自动分词处理文献源,或者使用相关领域内已形成的叙词表、专业词典中的术语或概念,还可以利用其他的本体的概念体系来初步形成概念及关系体系,而后专家针对初步形成的概念体系进行确认和局部修改,因此成本低,效率高。本文主要研究在半自动领域本体构建过程中领域专家知识的作用方式和过程。半自动领域本体构建流程如图 1 所示:2.1 确定领域,明确目的阶段首先,构建本体需要明确所构建本体所应覆盖的专业领域、应用本体的目的、作用及系统开发、维护和应用的对象。2.2 本体构建的半自动处理与概念、关系的确定阶段目前的本体半自动构建有两种主体思路:一是在领域本体构建的初级阶段,运用自动化方法从特定的数据源中自动提取概念和关系,然后采用人工的方式对概念和关系进行准确界定和进一步深化;另一种是选择复用本体,通过本体映射或者本体改造,形成新的本体。在第一种思路下,首先要进行领域本体概念及基本关系的自动化提取。提取对象主要有三种:叙词表、专业词典和本领域的典型文本。这三种典型的自动化处理数据源各有优缺点。叙词表和专业词典规范性强,但通常是每隔 6 年以上才会修订一次,因此所收录概念的时效性较差,而目前知识的更新速度很快,因此如果仅以叙词表和专业词典为目标进行自动化处理,处理结果将缺乏领域内的新概念。领域内文本的规范性差,需要借助文本自动分析和切分等技术进行处理,但这些文本通常以期刊学术论文、网络文本为主,所以具有很好的时效性,能够反映领域内最新的知识,从而提取出最新的概念和术语。以上的几种数据源应结合使用。自动化提取之后,就进入人工干预阶段。自动化提取到的关系仅仅是简单的等级和类属关系,专家需要在关系界定和深化这一环节通过人工干预,确定概念群及关系。在第二种思路下,可以选择一些相近的本体,然后进行新的本体概念体系的构建。例如以其他组织开发出来的本体作为复用本体,然后通过建立本体映射,或者按需要对其进行改造。通常的方式是从中挑选出重要的概念项,保留或借鉴可复用的概念属性和概念间的关系,提取或设立抽象概念作为组织特性,从而最后定义类及类的等级体系、定义类的属性、关系和创建实例等,最后形成所构建本体的整体框架。此外,可以根据所选可复用本体中已有的规范和实际需要设计一些标准和指导方针,为后续的本体构建提供一套可供遵循的规范。在本体映射和本体改造环节中,需要对原有本体的概念间关系、属性、实例等进行改造,必须利用领域专家的专业知识才能实现。在这一过程中,专家除了要具备专业的显性和隐性知识外,还要具备本体表达方式方面的知识,能够识别本体软件中概念及其关系的表达方式和含义,以便建立映射,进行改造。2.3 本体表示阶段本体表示就是将概念以及概念间的关系形式化的过程,即利用本体构建工具与本体描述语言对建立的本体进行编码,实质上就是利用类、关系、函数、公理、实例等本体要素组织和表示概念。2.4 本体评估阶段本体的评价标准包括清晰性、一致性、完整性以及可扩展性。对本体检验的方法相对灵活多变,例如可以对所构建本体进行一个前期应用试验,通过实际应用来发现问题,或是利用其他的评估标准对所构建本体进行评估,从各种指标中找出本体构建中可能存在的问题,并根据存在的问题,对已经界定的概念及其关系进行修正。3 领域专家知识在半自动本体构建中的作用机理分析领域专家所独有的隐性知识,可以在本体构建的过程中起到无法估量的作用。但是,领域专家知识在本体的半自动构建过程中,到底在哪些环节发挥作用,如何发挥作用,作用大小如何?一个本体构建工程包括多个领域专家,必然存在对知识的不同理解,那么又会存在怎样的作用冲突?作用机理的揭示首先要分析作用点、作用深度、作用方式和作用冲突这几个方面。3.1 作用点分析在本体的半自动构建过程中,几乎每一个环节都或多或少需要领域专家知识的帮助。结合本体的半自动构建流程,笔者把这些需要领域专家知识的环节称为作用点,对于特别需要专家知识的作用点,笔者称为关键作用点。本自动本体构建流程中,共有以下几个主要环节:确定领域、明确目的;自动化处理目标选择;概念提取;关系提取;复用本体选择;本体映射;本体改造;概念确定;关系确定;本体表示;本体评估。在这 11 个环节中, “概念提取”和“关系提取”是自动化处理的过程;“本体表示”环节主要是本体构建的编程人员根据已经确定的关系和规则进行,另外 8 个环节都不同程度地需要领域专家知识的作用。因此,作用点应为:确定领域、明确目的;自动化处理目标选择;复用本体选择;本体映射;本体改造;概念确定;关系确定;本体评估。在 8 个作用点当中,概念确定、关系确定、本体映射和本体改造 4 个作用点需要大量领域内专业知识的介入,而且往往需要不同的领域专家通过研讨等方式进行知识交流,因此属于关键作用点。其他作用点需要领域专家以较简单的方式参与意见,提出建议,属于一般作用点。3.2 作用深度分析作用深度是指领域专家在各个作用点贡献自己的专业知识时参与工作的程度。不同的作用点,需要领域专家参与的程度是不一样的。例如在本体项目策划初期,确定领域与明确目的时,项目负责人往往对于所构建本体的应用范围和目的有了基本明确的打算,领域专家知识在这个阶段起到参考的作用,作用深度较浅。在概念关系确定阶段,完全靠领域专家之间通过互动、沟通和协商确定关系,统一不同意见,作用深度较深。从理论上说,在每个环节,领域专家知识贡献得越充分,越利于本体的构建,但本体构建是一个系统工程,必须从时间、成本等角度综合考虑。因此,项目组织方应统筹设计,为最需要领域知识的作用点能获得领域专家较深的作用度创造条件,提高领域专家这一资源的利用效率。从工作性质和实际需要来分析,关键作用点需要较深的作用深度。3.3 作用方式分析领域专家知识的作用方式是和作用内容结合起来的。根据不同作用点不同的目标与任务,作用方式有所不同。3.3.1 第 1 个作用点:确定领域、明确目的 这一阶段要确定构建哪个专业领域的本体是覆盖整个专业领域还是覆盖其中的某个方面,另外还要确定建立本体的最终目的是什么。在这一作用点上,项目组织者可以就专业范畴的问题咨询领域专家的意见,一般较宏观,采用非面对面的作用方式即可达成目的。3.3.2 第 2、3 个作用点:自动化处理目标选择与复用本体选择 由于自动化处理的快捷性和目前基于网络检索的全面性的需要,自动化处理的目标覆盖面可以尽量广泛一些,以便获取尽量广泛的概念。基于此以及时间与成本的考虑,非面对面的,如基于邮件、电话会议等形式的沟通作用方式可以达到目的。3.3.3 第 47 个作用点:本体映射、本体改造、概念确定、关系确定 这 4 个作用点是关键作用点,是本体构建成功与否的关键,也是需要领域专家全面、深入贡献知识的阶段。领域专家需要通过利用其显性和隐性知识,特别是独有的隐性知识,对已经初步提取出来的概念群和概念间的关系进行认定、补充和深化;针对可复用的本体,筛选出可用的概念、等级关系、属性等。领域专家之间要进行知识的交流,就出现的意见分歧进行协商,作出最后确定的意见,形成一个完整的本体知识框架。因此,在这4 个关键作用点上,必须保证有直接面对面的作用方式,如研讨、会议等形式,并辅以非面对面的其他方式。3.3.4 第 8 个作用点:本体评估 领域专家知识在本体评估中的作用视不同方法而定。在需要领域专家参与的本体评估中,依据方法不同,领域专家贡献知识的作用方式可以是面对面的讨论,也可以是基于资料的非面对面的沟通。3.4 作用冲突分析在各个作用点上,领域专家之间会存在意见上的分歧,这种分歧称为作用冲突。作用冲突在各个作用点的强弱程度不同。在一般作用点,由于领域专家参与工作的程度较浅,作用冲突较弱;在关键作用点,领域专家们需要深度参与到本体的知识结构表达中,出现意见分歧的机率就比较大。 “关系确定”是作用冲突最强的作用点,领域专家们关于知识结构,尤其是新知识的认识往往存在很大的差异。在“概念确定”这一作用点上,由于目前的本体构建都服务于计算机网络检索,可以容纳较大范围的概念群,而不是如传统叙词表那样需要控制叙词的数量,所以可以容纳领域专家们的不同意见,相对“关系确定”来说,作用冲突稍弱一些。例如,在“自动化与计算机技术”本体构建中,不同的领域专家对概念所属大类的意见产生冲突。对于“生命行为”这个词,主要研究方向为自动化系统方面的专家认为应归于“人工智能”大类,而研究方向为自动化理论方面的专家认为它应归为“自动化技术”大类;又如“反馈镇定”一词,有的专家认为应归于“自动化技术设备”大类,有的专家认为应归于“自动化控制理论”大类。这种现象就是领域专家知识之间的作用冲突,必须通过一定的协调机制加以解决,形成统一的唯一结论。笔者归纳领域专家知识在各个作用点的作用情况,如表 1 所示:3.5 作用机理通过分析领域专家知识在各个作用点的作用深度、作用方式、作用冲突以其关系,可以揭示领域专家知识在半自动本体构建中的作用机理,见图 2。由图 2 可见,领域专家通过面对面或非面对面的作用方式,在每个作用点上进行知识共享和交流,产生的知识流直接在各作用点生成明确的、规范化的知识表示。各个作用点之间存在基于构建流程的内在联系,见图 2 中虚线所示。面对面的作用方式包括会议、研讨、讨论、头脑风暴、出声思考等形式,可以通过视频会议或直接面对面的会议实现;非面对面的作用方式包
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号