知识组织系统

知识组织系统(Knowledge Organization Systems,KOS)

目录

  • 1 什么是知识组织系统
  • 2 知识组织系统的发展[2]
  • 3 知识组织系统的互操作
  • 4 参考文献

什么是知识组织系统

  知识组织系统是对人类知识结构进行表达和有组织地阐述的各种语义工具( Semantic Tools) 的统称,包括分类法、叙词表、语义网络、概念本体以及其它情报检索语言与标引语言。曾蕾将知识组织系统分为三大类型,分别是词单(term lists),包括词汇/字典、地名表、规范文档、术语表等;分类与大致归类(Classification&Categorization),包括分类法、知识分类表、大致归类类表、标题表等;关联组织(Relationship Groups),包括本体、语义网络、概念地图、叙词表等(见图)。

知识组织系统的发展

  在目前情况下,知识组织系统除了对以上分类主题一体化、形式化本体和大众分类等进行研究外,主要朝以下两个方向发展:

  1.受控语言与自然语言的融合研究

  人们普遍认为,自然语言中的术语专指性高,有助于表达独特的检索需求和提高查准率。同时,网络用户在进行网络搜索时也倾向于使用术语进行搜索。因此,对术语的研究可以成为自然语言与受控语言融合的突破口。术语的特征是规模较为稳定,增长和更新的速度较之日常生活用词汇要慢得多。有研究表明,在网络环境下使用术语做提问词并以此改善查准率是可行的。Google也用术语来优化检索和缩小检索结果的范围,提高其查准率。

  但术语仅为语义检索提供词汇基础,而要真正实现语义检索,还需要有功能更为强大的逻辑工具。本体及其他类似的逻辑工具的引入,不仅在传统的知识组织工具的改造方面,而且也在支持自然语言检索和促进受控语言与自然语言融合方面都有可能起到重要作用。另外还应看到,解决自然语言与受控语言的融合问题,需要深入研究逻辑学和语言学,借鉴和引进这两个学科的研究方法和成果,深入分析受控语言的词汇、句法结构和语义结构。

  2.多语言词表构建研究

  互联网使各种语言的资源充斥整个网络。因此,应用多语种词表来实现跨语言检索已成为网络时代的一种需求。2005年IFLA起草的《多语言叙词表指南》,对于建立多语言叙词表具有指导和促进作用。《多语言叙词表指南》介绍的三种多语种叙词表的构建方法是:①从一种语言开始创建新的叙词表,然后增加其他语言;②合并现有叙词表(可合并两种或多种现有的叙词表从而成为一种新的多语言检索语言,或将现有的叙词表相互链接);③将一种叙词表翻译成一种或其他语言的叙词表。

  多语种叙词表的运用扩大了网络叙词表的使用范围,使叙词表向国际化方向发展。目前正在进行的多语种词表项目有:国际粮农组织FAO的多语种农业叙词表AGROVOC、欧洲的GEMET和Eurovoc、Mer-imee,以及荷兰的MACs等。

知识组织系统的互操作

  知识组织系统互操作是指不同知识组织系统之间的兼容互换。就像元数据标准的互操作既可将性质相同的元数据标准进行映射对照,也可将性质不同的元数据标准进行映射对照一样,知识组织系统的资源组织互操作既包括不同分类法之间或不同主题词表之间的互操作,也包括分类法与主题词表之间的互操作。知识组织系统间这方面的互操作主要通过派生法、翻译法、系列化分类表或词表、卫星词表法、直接映射、共现映射、中介词典、数据库链接以及宏词汇的模式与方法来实现。

  知识组织系统互操作是实现分布式资源集成检索以及交叉浏览的有效方法。因此,互操作成为知识组织系统领域重点研究的主攻技术,相关的研究项目有欧盟的DESIREII,欧洲的HILT和Renardus,以及美国国家医学图书馆的UMLS等。

  在分布式网络环境下,无论是数字图书馆等学术应用系统还是企业的商用信息系统,都在一定程度上面临着系统异构、语法异构、模式异构和语义异构等问题。近年来,国外学者关于应用本体解决信息系统问题的研究主要围绕方法层面:探寻基于本体的有效方法,解决特定领域的异构问题。所采用的方法主要为本体与代理结合的方法、本体间映射的方法。

  如果把主题词表和分类表看成是传统知识组织系统,那么知识组织系统的互操作除了解决传统知识组织系统间的互操作以及本体问的互操作问题外,还要解决传统知识组织系统与本体以及大众分类与本体间的互操作问题。

参考文献

  1. 司莉.知识组织系统的互操作及其实现[J].《现代图书情报技术》.2007年第3期
  2. 王松林.资源组织.北京图书馆出版社,2011.04.
阅读数:308