百度博客搜索发布后,引起了很多人的讨论,其中对于百度博客搜索的收录问题存在不少争论,我这里就说一下我关于百度博客搜索的收录问题的看法。
有人说百度博客搜索没有收录独立域名博客,只收录BSP服务商的,我不认为是这样的,至少我看到有一些独立域名博客是被收录,只是收录的非常少而已,这里我怀疑,可能百度在区分一个站点到底是网站还是博客遇到技术问题,因此大家可以手动将自己的RSS地址提交过去,看看百度是否会收录,如果还不收录,那就是百度自己的问题了。
百度博客搜索的另外一个收录问题是,百度给于“百度空间”过分大的权值了,以至于搜索结果的大部分内容都是“百度空间”的内容,这对于用户搜索体验来说是一大伤害,无怪乎shunz和awflasher都觉得认为“百度博客搜索”叫“百度空间搜索”更为恰当。
对于百度博客搜索和Google博客搜索的收录内容的数字化对比,我这里进行了一些整理。
收录量对比 | 地址 | 百度博客搜索 | Google博客搜索 |
百度空间 | hi.baidu.com | 847,000 | 2,142 |
Google Blogger | blogspot.com | 0 | 102,682,823 |
MSN Spaces | spaces.live.com | 800,000 | 140,499,552 |
新浪博客 | blog.sina.com.cn | 900,000 | 140,499,552 |
博客网 | bokee.com | 768,000 | 5,261 |
BlogBus | blogbus.com | 291,000 | 5,926 |
DoNews | blog.donews.com | 215,000 | 6,512 |
搜狐博客 | blog.sohu.com | 608 | 2,268 |
网易博客 | blog.163.com | 7,060 | 2,829 |
从上面的数据列表可以看出,百度对于Google Blogger的收录量竟然是0,这点比较夸张,同时也可以看出,百度博客搜索可能在避免和Google博客搜索正面竞争,对于一些Google收录较少的国内BSP进行大量收录,而对于Google收录很多的MSN和新浪等并没有收录更多。并且百度可能只收录中文信息,对于英文内容不进行收录。
总而言之,对于博客搜索这样一个新领域,百度还有很长的路要走。