网络计量学(Webometrics)
目录
|
实际上,从研究对象、方法、内容等方面来看,网络计量学就是采用数学、统计学等定量方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的一门新兴分支学科。其根本目的是通过网上信息的计量研究, 为网上信息的有序化组织和合理分布、为网络信息资源的优化配置和有效利用、为网络管理的规范化和科学化提供必要的定量依据, 以改善网络的组织管理和信息管理,提高其管理水平,促进其经济效益和社会效益的充分发挥。
网络计量学(Webometrics) 的诞生从本质上说是科学计量学、文献计量学、情报计量学和技术计量学在新的信息网络时代经过革命改造的结果。
“网络计量学”一词首次出现是在1997年T. C. Almind和P. Ingwerse在“Journal of Documentation”上发表的文献《万维网上的情报计量学: 网络计量方法门径》中。“从研究对象、方法、内容和目标等方面来看, 网络信息计量学是采用数学、统计学等各种定量方法, 对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析, 以便揭示其数量特征和内在规律的一门新兴分支学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科, 也是信息计量学的一个新的发展方向和重要的研究领域, 具有广阔的应用前景。”这一定义既肯定了网络计量学对信息计量学的继承性, 也没有把网络计量学限定在传统的计量学中。从某种意义上来说, 网络信息计量学就是文献计量学、科学计量学、信息计量学在网络上应用的一门学科 。
网络计量学是指在电子网络环境中, 运用文献计量学、科学计量学、信息计量学的方法, 对网上各种信息的组织、存储、分布、传递、相互引证及其功能和开发利用等做出定量描述并进行统计分析和研究, 以揭示其数量特征和内在规律的一门新兴分支学科。通过对网上信息的计量研究, 为网上信息的有序化组织和合理分布、为网络信息资源的优化配置和有效利用、为网络管理的规范化和科学化提供必要的定量依据, 以改善网络的组织管理和信息管理, 提高其管理水平。
因此, 网络计量学作为一门新兴学科, 顺应了网络信息时代的需求, 对某一方向的发展趋势可进行全面统计, 具有广阔的前景; 它在对网络的信息数据进行科学统计、分析的过程中大量使用了概率论与统计学, 计量方便、操作简单、结果准确, 从而揭示了网络文献及信息资源的新规律; 与传统手工检索工具相比较, 网络检索系统有着不可比拟的优越性, 为其方便快捷的检索途径和情报服务提供了更为广泛的实际应用。
==网络计量学的研究对象==
网上信息的计量对象主要涉及3个层次: ①网上信息本身的直接计量问题。②网上文献、文献信息及其相关特征信息的计量问题。③网络结构单元的信息计量问题。
网络信息计量学的内容体系是由它的理论、方法和应用3个部分构成的, 其理论是基础, 方法是手段, 应用是目的, 三者相辅相成, 不可偏废。在理论方面, 主要研究网络信息计量学作为一门学科存在而必须解决的基本问题, 研究网络信息计量的新概念、新指标和新规律, 包括网上信息分布的集中与离散规律、著者规律、词频规律、增长和老化规律、引证规律、多媒体信息规律, 以及这些规律的理论解释和数学模型的研究等; 在方法方面, 主要研究文献信息统计分析法、数学模型分析法、引文分析法、书目分析法、系统分析法等各种定量方法在网络信息计量分析中应用的原理、适用性和操作程序, 以及必要的修正、改进和完善等; 在应用方面, 主要研究网络信息计量学在图书情报工作、信息资源管理、网络管理、科学学、科技管理与预测等多学科、多行业领域的应用。
网络计量学是网络技术、信息技术和文献计量学的有机结合, 随着这十年来互联网的迅猛发展, 对网络计量学的研究大致可分为四种类型:
(1) 运用统计方法对数据进行统计分析网络计量学使用概率论与统计学对网络中的数据进行科学分析, 得出网络本身所适用的数学模型,从而揭示网络文献及信息资源的新规律。通过对网站和服务器的数量、网络用户特征以及网络发展的增长率指标进行统计分析。
(2) 运用图论的方法对数据进行可视化研究就是运用网络绘图和信息技术来研究网页超级链接的拓扑结构, 直观反映网页间的链接关系。人们将图论方法和传统及新的研究方法综合应用, 并扩充和确认了这种方法的研究和应用。
(3) 运用提示数据聚簇和分散的工具进行数据挖掘研究与统计方法相比, 数据挖掘可用于对一个站点上的各种特征进行深度研究, 包括站点的交通测度以及各个国家的IP 地址的分配。数据挖掘在文献和引文数据库中所应用的方法之一聚类分析技术,在网络环境下也同样适用。
(4) 运用解释和模拟网络结构和增长理论工具进行模拟研究这种方法就是通过构建网络结构的模型来研究网络, 诸如网络的相互链接及拓扑结构。主要用于研究各个国家的域的等级——频次分布、网页之间和网页内部、外部的超级链接。
首先, 在网络搜索引擎、网站建设和管理中的应用。网络环境下, 信息用户一般利用搜索引擎进行检索, 然而庞大的用户群缺乏信息检索所需的明确的背景知识, 因此要求网络信息以用户需求为出发点, 通过用户对已有网站的点击率来统计分析其需求特点, 建立容量庞大、语种多样的大型数据库检索系统, 使搜索引擎从单一的查询工具向网络全功能服务发展。目前搜索引擎数据组织机制较好的有Google 采用的方式和IBM 的算法。
同时, 网络计量学可应用于网站信息资源评价及网站评价, 就像引文分析可用于确定网络信息资源的权威性和可靠性。由于缺乏规范的表达方式和组织管理, 造成了网络信息检索和管理的混乱无序。因此, 若网络信息资源能以某种规范的形式存在, 掌握用户的信息需求和上网习惯会更准确, 信息用户利用网络会更便捷, 网络信息的价值也更能得到体现。具体的应用之一在于日志文件处理, 这样可揭示一段时间内网站所接受的访问次数。日志文件的分析需要相应的软件收集数据, 需专业人员分析相关数据, 这些数据主要包括: ①服务器在一段时间内受到的访问量; ②网站内每个页面受到的访问量; ③用户浏览网站的整个过程的记录, 如从何处进入网站,从哪个页面退出, 用户在一个页面上停留时间、下载一条数据的时间和字节数等。
其次, 在社会科学研究、科技发展和决策中的应用。同一时期内, 科学体系中的各个学科和其下的各个研究主题并非均衡发展的, 在某个时期总有一个或多个学科易取得成果, 科学上将这种易出成果且成果累累的学科叫做当采学科; 同样,一个学科中易出成果累累的主题叫做当采主题。成果的多少可用文献数量表示, 我们可借助搜索引擎或网络联机数据库,通过计量统计, 分析出当采学科和当采主题在网络中的受关注程度, 并得出科学的评价。
网络计量学的发展, 信息技术的普及, 使得网络计量学的分析变得日益重要; 同样, 网络计量学对科研机构科技政策的实施也会产生影响。通过对因特网上有关学科的各类信息进行计量分析, 从而对科技研究机构之间的合作、信息流动, 及科技政策的实施等作出了探索性的研究。
历史上, 劳动、资本、土地是人类生产活动最基本的要素。
19世纪末20世纪初, 在“数字技术”和“市场全球化”的合力下, 人的能动作用和创造性凸显出来, 成为现代管理领域的焦点。同时, 随着企业模式的发展、管理内容的扩展, “知识管理”经管理大师彼德·德鲁克提出后, 逐渐地渗入各领域的管理思想中。
知识管理包括两方面含义: 一方面指对显性知识的管理,即沿着信息管理的思路, 充分利用信息技术, 使作为信息深加工产物的知识在信息系统中加以识别、处理和传播, 并有效地提供给用户使用; 另一方面指对隐性知识的管理, 由于人脑是它的载体, 也就是对人的管理, 它通过促进知识的编码化和加强人际交流的互动来充分发掘长期被忽略的“宝藏”———非编码的个人隐性知识, 使这部分知识得以充分共享, 从而促进知识创新。
信息技术的发展, 为企业知识与信息的获取和处理提供了有效的技术工具。当前在企业运作中, 得到成功应用的技术工具有内部网、产品数据管理与电子邮件等。但是一套健全的信息系统应由系统构架的建立与知识的识别、分析与提取两部分组成。系统构架的建立很大程度上通过技术工具实现, 因此在现行条件下实施起来相对容易。但是, 知识与信息识别、分析与提取存在着许多障碍。企业中人员素质不同, 各职能部门对知识与信息的偏好和需求不同, 对于同样的知识与信息他们的认识也可能存在差别。而且, 企业中不同的知识与信息对于不同的员工和部门, 作用也不同, 如何识别、分析与提取真正能够被市场所接受的知识, 将其融入到企业的产品中去,最终为企业带来价值的最大化, 的确是一个困扰企业的难题。
另外, 由于网络信息资源数量庞大质量良莠不齐, 对于组织获得网络信息资源进行知识创新无疑会带来巨大的障碍。
网站的质量也决定了网络信息资源的质量, 因而迫切需要一种专门的工具来测定核心或权威网站, 以更好的服务于企业的信息资源收集、整理、传递、存储和利用活动。实际上这是一种网络无序和需求有序之间的对抗, 将无序空间缩小, 降低混乱程度; 将有序外化, 有选择的进行测定, 宁缺毋滥。
在知识库组建前我们首先应回答知识库由哪些内容构成, 至少应包括: 各个企业应根据自身情况组建适合自己的知识库内容, 并且应实现及时更新与动态维护。只有当知识库中的内容真正在企业内形成了员工和客户需要的知识流时, 知识库才会被频繁地访问。这样, 在人际交流与知识的互动中,提高业务流程的有效性, 整个企业围绕知识库建设形成一个自我学习的氛围。员工通过对内及时的交流不断更新自身知识, 对外不断收集、吸收、创新来丰富知识, 最终将这些知识显性化, 再次注入知识库, 形成“知识库- 学习- 知识库”的良性循环。然而尽管很多企业在尝试组建知识库, 大多数企业都没有将知识库中的内容制度化规范化。知识库的有效运作与管理必须有具体的人员将企业的技术诀窍、最佳实践整理成文字材料, 将企业的经营战略和优秀的营销方法整理成材料, 予以分类存档, 以便供企业员工共享。这样, 就为信息与知识的识别、分析与提取提供了很好的环境。
持续学习的企业文化使企业对相互依赖并不断变化的世界作出有效反应, 使企业具有不断适应变化的能力。而企业文化的形成会影响员工, 左右他们的思想来影响其行为和决策,因此企业文化具有很强的持续性与稳定性。学习型组织向企业员工和领导者都提出了较高的要求。另一方面, 知识产生并存在于人脑中, 知识运作必须以人为主导, 人的价值观、信念、情志恰恰是企业文化的重要组成部分。人是有惰性的, 若一项任务能按原有方法或程序完成, 很少有人再去不断学习, 因为他们要为新的尝试付出更多时间与精力, 而最终结果往往在尝试初期是不可预期的, 这也给持续学习的企业文化的建立造成很大障碍。
由于市场的复杂与多变性,企业为了生存和发展,不得不更充分的利用知识资源提高竞争力。网络计量学的不断发展,对网络信息资源的分布、利用进行了控制和管理,提高了网络信息资源的质量。现代企业的知识来源越来越多的超出文献范围,而分布合理、方便利用的网络环境将给知识管理带来充足高质的网络信息源。另外,网络计量学的研究方法,如链接分析法,可直接用于企业的知识管理。利用链接分析,可以清楚的发现权威知识、记录下珍贵知识的来源、弄清同种知识的现有利用情况, 随后根据掌握的第一手资料调整知识管理战略,获得较强的反应能力, 从而赢得竞争对手难以模仿的信息与知识优势。
网络信息不仅数量巨大,且内容广泛、形式复杂,不同的用户具有不同的信息需求和行为。通过内容分析可以了解内容信息的分布和利用。与传统媒体相比,由于网络运营服务商能系统地提供特定内容的信息发布及用户使用情况,因此,在网络数据分析中运用内容分析法描述网络信息的传播情况具有更大的优势。通过此类研究,网络服务提供商能准确地评价各类信息产品,为调整信息的内容及组合提供依据。内容分析法也可广泛运用于网络信息资源的评价, 比如,研究者可以通过分析近5 年网上对IT 业的发展状况的讨论, 研究IT 的发展历程和趋势预测,这类研究常常需要分析5 年、10 年或更长时间的样本,才能发现其报道量和观点的变化。利用网络数据的内容分析开展此类研究具有覆盖面广、获取信息便捷等优点,尤其对与网络有关的主题内容分析,有着不可替代的优势。