Tag Archives: AntiSpam

Spam, 这个所有 Blogger 都头疼的问题

今天雅虎中国开始了”搜虫大行动“, 其中一个目的就是为了对付 SPAM,说起 SPAM ,估计很多 Blogger 都恨的牙根痒。
最近我把Blog 的验证字插件 Scode 关掉了。一个原因是为了方便留言的读者,另一个原因是为了减少压力。反正用 Scode 的时候 Spam 留言是狂多的,对 Spam 机器人来说, Scode 验证字没什么用,直接找到留言的脚本发过来信息就成了,这些垃圾留言在后台一样需要手工清理。”死猪不怕开水烫”。
没有想到,我把 Scode 关掉之后,Spam 留言反而少了很多,怪哉。不过有了新变化:HTTP HERD REFER SPAM 多了起来。这一类的 SPAM 的目的就是为了通过 AWstats 的统计结果页面的 Refer 来提高自己页面的 PageRank, 我的 AWstats 统计入口登陆是需要验证的,坚决不让他们得逞。
中外 SPAM 的异同
总体来讲,国内的 SPAM 基本上还属于手工作业的阶段(虽然偶尔也会看到 SPAM 机器人). 而国外的 SPAM 机器人就灵活许多了,很多 SPAM 能够识别我改名后的 mt-comment.cgi 脚本,虽然不需要啥高深的技术含量,但起码能看到人家在改进。国外的 SPAM 机器人试图宣传的站点基本上都是与”赌博,色情”沾边。URL 都是巨长的那种。留言内容的形式风格都很相似,第一句话都是称赞你的 Blog 的,”Great Site”, “Good Blog”, 套套近乎,接下来就是大堆的垃圾信息了.
不知道这些专门开发 SPAM 的家伙都来自哪个国家,但肯定来自中国的非常少,所以说该给咱们的 “chongqed” 摘帽了吧? 现在中国天才们都集中精神研究流氓软件呢,那有时间搞 SPAM 啊。
现在使用的抵挡 Spam 的办法罗列一下:
*) 使用 Movable Type 的 插件 nofollow ;
*) 重命名 mt-comment.cgi 脚本 ;
*) 修改 AWstats 的脚本 awstats.pl, 把 HEAD 过滤条件($field[$pos_method] eq ‘HEAD’)去掉.
Trackback 的 SPAM 不用担心了–我已经关闭了 Trackback 的 Ping.
现在比较烦的另一个问题是经常有人在我的站点上找一些”dvbbs7.mdb”,”s8qq.txt”,”s8dvbbs6.mdb” 或者类似的文件,估计是用一些”黑客”工具在扫描有漏洞的论坛程序,我通过 URL rewrite 制定了几个规则。谁有其他什么好办法么?
EOF

Munging Email 地址,避免 Spam 骚扰

相信大家每天都被铺天盖地的垃圾邮件(Spam)烦透了,即使是目前对付垃圾邮件最好的Gmail,在我的邮箱里每天也会因为判断不明错放进来几十封。国外已经有些组织针对 Spam 开战,今天访问了 Project Honey Pot ,简单介绍一下该项目介绍的关于 Address munging 。
首先对于 “Munging” 这个词我还真不知道怎么翻译,来自英文 Wikipedia 的说法是:

Mung (or munge) is computer jargon for “to make repeated changes which individually may be reversible, yet which ultimately result in an unintentional irreversible destruction of large portions of the original item.”

Address munging is the obfuscation of e-mail addresses…

第一种方法是简单的替换法。例如:dbanotes#example.com (把# 替换为@)。当然也可把地址中的某个短语或者字母替换掉。 英文环境中用 dbanotes(AT)example.com 或者是 [email protected] 可能更人性化一些。
第二种方法是稍稍复杂一点,如果熟悉ASCII 码的话,@ 等价于 “.”, 可以在 HTML 代码中用这个替换 @ 如果 SpamBot 智商不太高的,基本可以骗过。从这一点出发,你可以考虑把整个邮件字符串都进行 ASCII 化。即使 SpamBot 比较高的智商,恐怕也束手无策了。
第三种方法则基本可以做到万无一失–除非 SpamBot 是人。 这个方法是脚本加上图片。很多 Blogger 站点上的联系方式都用图片,地址可以用一个 JavaScript 来代替。 具体的脚本获取在这里
道高一尺,魔高一丈,随着 Spam 技术的迅猛发展,很多 SpamBot 应该已经具备读取图片的能力(我的Blog 验证字已经不管用了),如果是网站站长,还可以协助 Project Honey Pot 来进行 AntiSpam。也可以考虑加上这个”稻草人”:

@ MEMBER OF PROJECT HONEY POT
Spam Harvester Protection Network
provided by Unspam

估计可能国外的 SpamBot 还能害怕一点点,国内的就不那么遵守流氓规则了。
EOF