百度博客搜索的收录


  百度博客搜索发布后,引起了很多人的讨论,其中对于百度博客搜索的收录问题存在不少争论,我这里就说一下我关于百度博客搜索的收录问题的看法。

  有人说百度博客搜索没有收录独立域名博客,只收录BSP服务商的,我不认为是这样的,至少我看到有一些独立域名博客是被收录,只是收录的非常少而已,这里我怀疑,可能百度在区分一个站点到底是网站还是博客遇到技术问题,因此大家可以手动将自己的RSS地址提交过去,看看百度是否会收录,如果还不收录,那就是百度自己的问题了。

  百度博客搜索的另外一个收录问题是,百度给于“百度空间”过分大的权值了,以至于搜索结果的大部分内容都是“百度空间”的内容,这对于用户搜索体验来说是一大伤害,无怪乎shunz和awflasher都觉得认为“百度博客搜索”叫“百度空间搜索”更为恰当。

百度博客搜索的收录

  对于百度博客搜索和Google博客搜索的收录内容的数字化对比,我这里进行了一些整理。

收录量对比 地址 百度博客搜索 Google博客搜索
百度空间 hi.baidu.com 847,000 2,142
Google Blogger blogspot.com 0 102,682,823
MSN Spaces spaces.live.com 800,000 140,499,552
新浪博客 blog.sina.com.cn 900,000 140,499,552
博客网 bokee.com 768,000 5,261
BlogBus blogbus.com 291,000 5,926
DoNews blog.donews.com 215,000 6,512
搜狐博客 blog.sohu.com 608 2,268
网易博客 blog.163.com 7,060 2,829

  从上面的数据列表可以看出,百度对于Google Blogger的收录量竟然是0,这点比较夸张,同时也可以看出,百度博客搜索可能在避免和Google博客搜索正面竞争,对于一些Google收录较少的国内BSP进行大量收录,而对于Google收录很多的MSN和新浪等并没有收录更多。并且百度可能只收录中文信息,对于英文内容不进行收录。

  总而言之,对于博客搜索这样一个新领域,百度还有很长的路要走。