Tag Archives: search

网易的有道以及 Clickeye 服务

网易的有道一经发布即吸引了很多 Blogger 的关注。昨天刚一上线,就看到 车东发来的消息: OutfoxBot原来是有道蜘蛛 。原来是网易家的,怪不得这个莫明其妙的爬虫有如此胃口。试用了一下,替我挖掘了自己 Blog 的一些数据:
Yodao 挖掘到的 dbanotes.net 的文章长度
以前还真不知道我的 Blog 每篇文章的平均长度。
据我所知,网易的搜索服务在杭州运维。机房的规模不小,看来是铁了心要从搜索这块蛋糕上分点东西走。
最近也发现网易的新闻频道启用了一个 ClickEye 的内容匹配服务。效果看起来不错的:
Click_eye.png
这个服务我个人认为很有潜力,给内容添加了许多展现的维度。
还以为也是网易自己的服务,查询了一下 ClickEye 的网址,ClickEye.cn ,似乎没有正式的网站。从域名注册者来看,还真不是网易的。
EOF

玩 Yahoo! 的 Buzz Game ,虚拟技术股票

del.icio.us 与 Furl、Spurl 哪一个更火?
Movable Type 与 WordPress 、Yahoo! 360 哪一个更受用户关注?
Ubuntu 与 Gentoo 谁的上升势头更快?
Yahoo! 的 Tech Buzz Game 或许能回答这些问题。这是 Yahoo! Research 与 Oreilly 合作的一个项目。
软件产品与技术按类别被虚拟成不同的股票,每个注册账户有虚拟的 $10000 。你可以用这笔钱购买你看好的软件或者产品。玩法和炒股票没什么大的差别。如果说有不同,那么可能是很多玩家会选择自己喜欢或支持的项目或是软件产品。
每支股票的价格波动根据什么确定呢? 主页上的说明:

Markets in the Tech Buzz Game reflect a mix of companies, products, and technologies on O’Reilly’s radar. Follow the Tech Buzz Game for a view into community sentiment about the future of technology.

玩了一段时间,感觉是一个很好玩的 Web 2.0 应用。我买的几只”股票”现在表现如下:
Yahoo! BUZZ GAME
EOF

Swish-e, 在 Dreamhost 构建小型搜索引擎

自从搭上 Dreamhost 的贼船之后,我就在幻想 Dreamhost 什么时候能够支持 Nutch 就好了,这样就可以搭建一个个人的搜索引擎。令人沮丧的是 Dreamhost 似乎一直没有支持 Nutch 的打算(当然,Nutch 这个东西一旦能够被支持,一个普通的用户恐怕要吃掉所有的资源)。
今天从 Vingel 的 Blog 上看到他使用的 Swish-e, 是一个不错的选择。
安装 Swish-e 相对比较顺利。参见指导手册的 Installing without root access 部分。详细的设置记录随后给出吧。
初步效果参见: http://www.search.dbanotes.net/
准备把 Oracle 的文档索引一份,便于自己使用。
现在 Oracle 9i, Apache HTTPD 2.0 的文档已经可以搜索了。
这个工具一个最大的缺点: 不支持 Unicode,所以只能搜索英文文档。
EOF