Google Blogsearch 的时效性以及其他

其实这个现象观察到好久了,那就是 Google Blogsearch实效性非常好,一般情况下 4-10 分钟就可以通过 搜索结果RSS 观察到我刚发表的 Blog 。因为 Technorati 访问困难,很长一段时间里,Google Blogsearch 就成了我进行 Blog eogsurf 最常用的工具。
国内的 Blogger 中,Keso 应该是 Google Blogsearch 的最忠实用户:

“我还是很关心别人怎么说我和我写的东西,所以看到有人谈论我,我就会很感兴趣地去读那些博客。提到我的人,多半是我博客的读者,他们关注我,我也会关注他们。很多次,都是因为有人提到了我的名字,我才发现了新的博客。”博客搜索为博客群体彼此间进一步的交流提供了可能。”–Keso 接受《互联网周刊》的采访

可能是所有 Blogger 的天性,有的时候我也这样,看到别人链接或引用了我写的东西,总要跑上去看看有没有引发出来什么更新鲜的内容。
发现,有的时候也是一种乐趣。
Blogsearch 中的 inurl 语法虽然有效,但是搜索结果有很大问题。应该用 Blogurl 语法(如 blogurl:dbanotes.net 所以车东以前做的测试似乎不太能够说明问题。我的测试结果:

BSP 名字 结果数量
spaces.msn.com 105,881,316
myspace.com 73,014,029
Blogspot.com 66,813,563
Spaces.live.com 10,980,686
Livejournal.com 62,989,323
Typepad.com 4,405,857

MSN Space 是当之无愧的第一大 BSP。
国内的 BSP 除了 CSDN 结果有三万多,其他的 BSP 都少的可怜–有的还没有我个人 Blog 的多。推测原因可能第一个是网站页面结构普遍设计的不好,对 Blog 的一些内置的技术特性理会的不好,也难怪,人家都是用作新闻的手法搞 Blog 的。再一个或许是 Google 对中文用户还没有投入那么大的兵力( Blog 的及时性可能只是针对少数更新频繁的 Feed 抓取 )。 如果你知道原因,请告诉我。
EOF


  • http://www.tinydust.net/prog/diary/diary.htm tinyfool

    blogsearch是根据ping server以及他们的blog登记库来收录blog的,目前blog登记库虽然存在,但是没有可以提交的地方.想被收录很容易ping到最著名的几个ping server即可.

  • http://in.comengo.net/ Tangos

    如tinyfool所说,google blogsearch主要依靠pingserver来获取数据更新,所以时效性比较理想,国外主流的blogware以及主要的BSP都会ping,而国内就基本上没什么BSP对这个有兴趣。