2005 Jan 14 ,Nutch.org 发布了 Nutch 0.6 版本。和早前那篇概述中的描述变化不大。我感兴趣的但上次没介绍的内容有:
- HTML 中添加了 BASE 标记的支持
- 添加了插件 index-more 和 more.jsp
- Fetcher.java 新添加了一个选项:-noParsing
- 添加了 ontology 插件
其他大多是修正的 Bug ,尤其是 NDFS 的修正比较多。全部的信息参见 CVS 描述。
另:Google 的通知给我送来了一篇论文《Personalizing PageRank Based on Domain Profiles》