从本站后台的统计上看,OutfoxBot 这个爬虫最近非常频繁,辛勤的程度都超过了 GoogleBot, 快赶上 Yahoo Slurp了。
Awstats 给出的信息只有一个联系方式: [email protected] . 网络上搜索了一下,没有很清晰的结果,从这个分析来看,这个机器人似乎和搜狐有关(名字也有点像),莫非是搜狗的么? 但是搜狗站点上并没有提供更多关于爬虫的信息。
从本站后台的统计上看,OutfoxBot 这个爬虫最近非常频繁,辛勤的程度都超过了 GoogleBot, 快赶上 Yahoo Slurp了。
Awstats 给出的信息只有一个联系方式: [email protected] . 网络上搜索了一下,没有很清晰的结果,从这个分析来看,这个机器人似乎和搜狐有关(名字也有点像),莫非是搜狗的么? 但是搜狗站点上并没有提供更多关于爬虫的信息。
不是搜狐的,事实上搜狐博客已经把这个搜索引擎(说spam更合适一些)封掉了
我查了这个BOT的来源,在北京机房里:共24台
202.106.184.8#北京市网通
220.181.8.63#北京市电信
220.181.8.65#北京市电信
220.181.8.66#北京市电信
220.181.8.69#北京市电信
220.181.8.70#北京市电信
220.181.8.73#北京市电信
220.181.8.77#北京市电信
220.181.8.78#北京市电信
220.181.8.81#北京市电信
220.181.8.85#北京市电信
220.181.8.100#北京市电信
220.181.9.70#北京市电信
220.181.9.71#北京市电信
220.181.9.72#北京市电信
220.181.9.73#北京市电信
220.181.9.74#北京市电信
220.181.9.75#北京市电信
220.181.9.76#北京市电信
220.181.9.85#北京市电信
220.181.9.91#北京市电信
220.181.9.97#北京市电信
220.181.9.98#北京市电信
220.181.9.101#北京市电信
现在谁都在做爬虫,从以前2-3个,到现在上百个,乱啊~~
的确现在的爬虫和一年前相比都多了很多
新出现的爬虫很多都师出无名,随便爬,想怎么爬就怎么爬
是有道家的:
ipfw – phpMan
Dong On Apache/1.3.37 (Unix) mod_perl/1.29 mod_gzip/1.3.26.1a PHP/4.4.4 Under GNU General Public License 2006-12-04 07:37 @60.191.80.35 CrawledBy OutfoxBot/0.5 (for internet experiments; http://; [email protected])
http://www.chedong.com/phpMan.php/man/ipfw – 1006 – 2006-12-04 – 快照
http://www.chedong.com/blog/archives/001256.html