Swish-e, 在 Dreamhost 构建小型搜索引擎

自从搭上 Dreamhost 的贼船之后,我就在幻想 Dreamhost 什么时候能够支持 Nutch 就好了,这样就可以搭建一个个人的搜索引擎。令人沮丧的是 Dreamhost 似乎一直没有支持 Nutch 的打算(当然,Nutch 这个东西一旦能够被支持,一个普通的用户恐怕要吃掉所有的资源)。
今天从 Vingel 的 Blog 上看到他使用的 Swish-e, 是一个不错的选择。
安装 Swish-e 相对比较顺利。参见指导手册的 Installing without root access 部分。详细的设置记录随后给出吧。
初步效果参见: http://www.search.dbanotes.net/
准备把 Oracle 的文档索引一份,便于自己使用。
现在 Oracle 9i, Apache HTTPD 2.0 的文档已经可以搜索了。
这个工具一个最大的缺点: 不支持 Unicode,所以只能搜索英文文档。
EOF


  • http://blog.vingel.com Vingel

    跟swish-e类似的项目还有xapian
    (http://www.xapian.org/)
    貌似也不支持Unicode的样子。
    swish-e的文档中说了,他们正在开发新版,会支持Unicode,需要把整个程序重写。但是2年过去了,没见踪影。

  • http://dlnow.com Yanni

    mnogosearch 更好

  • http://www.dbanotes.net Fenng

    mnogosearch 需要数据库的吧