知识网格(Knowledge Grid)
目录
|
Fran Berman 较早提出知识网格(Knowledge Grid 简称KG)的概念,指出知识网格的主要研究内容是:利用网格、数据挖掘、推理等技术从大量在线数据集中抽取合成知识使搜索引擎能够智能地进行推理和回答问题,并从大量数据中得出结论。Cannataro 和Talia 于2003 年1 月提出了基于数据挖掘的知识网格。诸葛海教授认为:“知识网格是一个智能互联环境,它能使用户或虚拟角色有效地获取、发布、共享和管理知识资源,并为用户和其他服务提供所需要的知识服务,辅助实现知识创新、协同工作、问题解决和决策支持。它包含了反映人类认知特性的认识论和本体论;运用社会、生态和经济学原理;采纳下一代互联网所使用的技术和标准。”
中科院计算技术研究所研究员诸葛海在《知识网格》一文中,提出了知识网格五个不同于其他技术的特点。
(1)人们能够通过单一语义入口获取和管理全球分布的知识,而无需知道知识的具体位置。
(2)全球分布的相关知识可以智能地聚合,并通过后台推理与解释机制提供按需的知识服务。达到这个目标的方法之一是知识提供者提供元知识。统一的资源管理模型将有助于实现知识服务的动态聚合。
(3)人或虚拟角色能在一个单一语义空间映射、重构和抽象的基础上共享知识和享用推理服务,其中的相互理解没有任何障碍。知识网格还会使知识共享更加普适。
(4)知识网格应能在全球范围搜索解决问题所需的知识,并确保合适的知识闭包,即最小完备知识集。为了达到这个目标,需要建立新的知识组织模型。
(5)在知识网格环境中,知识不是静态存储的,它能动态演化而保持常新。这意味着知识网格中的知识服务在使用过程中可以不断自动演化改进。
知识网格所要解决的主要科学问题包括以下几个方面。
(1)知识获取与知识表示的理论、模型、方法和机制。在知识网格中获取知识有两种方法。一种方法是人们直接通过交流互相获取知识,或通过接受他人发布的知识资源获取知识。另一种方法是知识网格通过对诸如数据、文本和图像等资源进行抽取、挖掘、归纳、演绎、合成来获取知识。
(2)知识可视化和创新。主要包括智能化的用户接口,如语义浏览器或知识浏览器,它使人们通过可视化来共享知识。语义网络和认知图可以缩短知识表示和知识可视化之间的鸿沟。接口应体现知识网格的个性特征,并能通过类比推理、归纳机制及组织规则来激发知识创新。
(3)在动态虚拟组织间进行有效的知识传播和知识管理。为此中国知识网格研究组提出一种知识流网络来实现动态虚拟团队间的知识有效共享。
(4)知识的有效组织、评估、提炼和衍生。知识可通过基于语义的范式来组织,有效检索和修改操作。知识网格应能删除冗余知识,并提炼所含的知识来合理扩展有用的知识。它也会有助于从已有的良好知识、范例和类似文本的知识源中衍生出新知识。
(5)知识关联和集成。知识网格应能关联和集成不同级别(如概念级、公理级、规则级和方法级)和不同领域的知识资源,以此来支持跨领域的类比推理、问题解决和科学发现。
结构国内诸葛海研究员提出了知识网格的多空间体系结构。这是一个如图所示的三层结构,人类层反映知识网格的社会和人类行为特征,包括知识空间、用户空间和社会组织规则三个功能模块。这三个功能模块既是相互独立的,又是相互合作的。语义层包括知识表示子空间、角色子空间、需求子空间、服务子空间和规范语义空间。语义层的主要功能是避免用户直接与资源实体层的交互,它能够把收集的异构数据通过语义进行规范,以人机可理解的形式表述,并且使得用户对控制于资源实体层的任何变化都能即时察觉,实现用户透明化。资源实体层包括智能通信平台和资源实体空间。后者包含知识存储子空间、XML文件子空间、HTML文件子空间、软设备子空间等。知识存储子空间通过定义在语义空间的原语来实现。
欧洲网格项目提出了一种三层框架:计算(数据)网格、信息网格和知识网格,即从下至上的三层结构。从下层至上层,数据的抽象层次愈来愈高。上层则建立在下层功能之上,需要控制和调用下层的服务。数据网格(Data Grid)主要解决数据访问问题。信息网格(Information Grid)是将异构的信息访问变成同构的信息访问,包括信息表示和检索,Internet上信息的分布与组织。知识网格建立在信息网格之上,借助于经过信息网格处理后的同构信息,实现知识的自动积累,并进行数据挖掘、知识挖掘和问题求解。它们之间的关系如图所示。