博客搜索(Blog Search)
目录
|
博客搜索是针对博客内容所提供的搜索服务,可以从博文标题、博主(即博客的创建者)名称等途径进行检索。
博客搜索一般有三种途径:
①利用分类搜索引擎(如Yahoo!、Sohu等)找到博客网站列表,然后进入博客网站,使用站内搜索查找具体的博客;
②通用搜索引擎(如谷歌、百度等)选用适当的关键词,配合特定语法(如inurl:blog等),直接搜索具体的博客;
③使用博客专用搜索引擎,采用分类浏览或关键词搜索的方法,查找某类或某一博客。三种方法各有特点和利弊,应根据具体查询要求灵活运用。
博客搜索引擎是专门对博客站点内容进行搜集并提供博客信息检索服务的专业搜索引擎。随着博客日志的有用性和共享性,以专门搜索博客日志的博客搜索引擎应运而生。国内外已涌现出了大量的博客搜索引擎,在中文博客搜索引擎方面起步比较早的是Google 博客搜索。博客搜索引擎主要由3 个部分组成:信息获取、信息处理和检索服务。
目前,博客搜索引擎一般可分为两类:博客站点内的搜索引擎和独立的博客搜索引擎。对于博客站点内镶嵌的搜索引擎,它们的收录内容和范围一般限制在自身网站的博客范围内;而对于独立的博客搜索引擎来说,它们的信息来源则是面向整个互联网的,并能专门提供博客信息的搜索服务。
与一般的网页信息相比,博客信息一般具有更新速度快、内容缺乏过滤、文档链接数量较多等特点。因此,与通用搜索引擎相比,博客搜索引擎大都具有以下比较突出的特点:
①用户搜索提问的时效性比较强,尤其关注最近发生的新闻、事件、娱乐活动等。
②除了传统的关键词检索方式外,博客搜索引擎更倾向于(或更重视)浏览功能的提供。具体使用的浏览方式有:提供最热门的、点击率最高的博客列表供用户选择;将博客内容分成若干个大类供用户浏览;将博客内容按国家和关键词的点击率进行分类;等等。
③重视对博客文档中链接信息的挖掘和利用。在一个博客网页中,除了文字信息,各种链接是其中的重要组成部分,包括评论链接、好友列表链接等。这些链接可以指向互联网的任何地方,并很好地体现了博客之间的关联和互动性。目前,博客搜索引擎对这些链接信息加以利用的一个重要方面体现在搜索结果排序上——首先基于博客信息的作者、阅读者、评论者等关系构建博客用户人际网络,然后利用PeopleRank算法计算每个用户的重要性(即People—Rank值),并把用户的PeopleRank值作为提高搜索结果相关性的一个排序因子。另外,利用链接信息还可以发现博客之间的相互关系,从而绘制出博客世界的关联网络。
④博客搜索引擎在博客信息采集过程中要求具有更大的主动性。事实上,除了自动跟踪、扫描互联网上数千万个较常更新的博客站点之外,博客引擎一般还为用户提供了提交自己博客链接的功能。通过提交链接这种方式,博客搜索引擎在采集博客资源上比通用搜索引擎更有优势。
博客专用搜索引擎既有单一关键词搜索功能的,也有同时提供分类和关键词搜索的。不同博客专用搜索引擎收录博客网页的数量和辅助功能不同,搜索结果和搜索效率也有很大区别。
主要的中文博客搜索引擎有:
主要的外文博客搜索引擎有: