Tag Archives: spam

Spam, 这个所有 Blogger 都头疼的问题

今天雅虎中国开始了”搜虫大行动“, 其中一个目的就是为了对付 SPAM,说起 SPAM ,估计很多 Blogger 都恨的牙根痒。
最近我把Blog 的验证字插件 Scode 关掉了。一个原因是为了方便留言的读者,另一个原因是为了减少压力。反正用 Scode 的时候 Spam 留言是狂多的,对 Spam 机器人来说, Scode 验证字没什么用,直接找到留言的脚本发过来信息就成了,这些垃圾留言在后台一样需要手工清理。”死猪不怕开水烫”。
没有想到,我把 Scode 关掉之后,Spam 留言反而少了很多,怪哉。不过有了新变化:HTTP HERD REFER SPAM 多了起来。这一类的 SPAM 的目的就是为了通过 AWstats 的统计结果页面的 Refer 来提高自己页面的 PageRank, 我的 AWstats 统计入口登陆是需要验证的,坚决不让他们得逞。
中外 SPAM 的异同
总体来讲,国内的 SPAM 基本上还属于手工作业的阶段(虽然偶尔也会看到 SPAM 机器人). 而国外的 SPAM 机器人就灵活许多了,很多 SPAM 能够识别我改名后的 mt-comment.cgi 脚本,虽然不需要啥高深的技术含量,但起码能看到人家在改进。国外的 SPAM 机器人试图宣传的站点基本上都是与”赌博,色情”沾边。URL 都是巨长的那种。留言内容的形式风格都很相似,第一句话都是称赞你的 Blog 的,”Great Site”, “Good Blog”, 套套近乎,接下来就是大堆的垃圾信息了.
不知道这些专门开发 SPAM 的家伙都来自哪个国家,但肯定来自中国的非常少,所以说该给咱们的 “chongqed” 摘帽了吧? 现在中国天才们都集中精神研究流氓软件呢,那有时间搞 SPAM 啊。
现在使用的抵挡 Spam 的办法罗列一下:
*) 使用 Movable Type 的 插件 nofollow ;
*) 重命名 mt-comment.cgi 脚本 ;
*) 修改 AWstats 的脚本 awstats.pl, 把 HEAD 过滤条件($field[$pos_method] eq ‘HEAD’)去掉.
Trackback 的 SPAM 不用担心了–我已经关闭了 Trackback 的 Ping.
现在比较烦的另一个问题是经常有人在我的站点上找一些”dvbbs7.mdb”,”s8qq.txt”,”s8dvbbs6.mdb” 或者类似的文件,估计是用一些”黑客”工具在扫描有漏洞的论坛程序,我通过 URL rewrite 制定了几个规则。谁有其他什么好办法么?
EOF

Munging Email 地址,避免 Spam 骚扰

相信大家每天都被铺天盖地的垃圾邮件(Spam)烦透了,即使是目前对付垃圾邮件最好的Gmail,在我的邮箱里每天也会因为判断不明错放进来几十封。国外已经有些组织针对 Spam 开战,今天访问了 Project Honey Pot ,简单介绍一下该项目介绍的关于 Address munging 。
首先对于 “Munging” 这个词我还真不知道怎么翻译,来自英文 Wikipedia 的说法是:

Mung (or munge) is computer jargon for “to make repeated changes which individually may be reversible, yet which ultimately result in an unintentional irreversible destruction of large portions of the original item.”

Address munging is the obfuscation of e-mail addresses…

第一种方法是简单的替换法。例如:dbanotes#example.com (把# 替换为@)。当然也可把地址中的某个短语或者字母替换掉。 英文环境中用 dbanotes(AT)example.com 或者是 [email protected] 可能更人性化一些。
第二种方法是稍稍复杂一点,如果熟悉ASCII 码的话,@ 等价于 “.”, 可以在 HTML 代码中用这个替换 @ 如果 SpamBot 智商不太高的,基本可以骗过。从这一点出发,你可以考虑把整个邮件字符串都进行 ASCII 化。即使 SpamBot 比较高的智商,恐怕也束手无策了。
第三种方法则基本可以做到万无一失–除非 SpamBot 是人。 这个方法是脚本加上图片。很多 Blogger 站点上的联系方式都用图片,地址可以用一个 JavaScript 来代替。 具体的脚本获取在这里
道高一尺,魔高一丈,随着 Spam 技术的迅猛发展,很多 SpamBot 应该已经具备读取图片的能力(我的Blog 验证字已经不管用了),如果是网站站长,还可以协助 Project Honey Pot 来进行 AntiSpam。也可以考虑加上这个”稻草人”:

@ MEMBER OF PROJECT HONEY POT
Spam Harvester Protection Network
provided by Unspam

估计可能国外的 SpamBot 还能害怕一点点,国内的就不那么遵守流氓规则了。
EOF

给垃圾邮件分分类

我的 Gmail 信箱大约 1 周能收到 3000 封垃圾邮件. 这些邮件源源不断的发来, Gmail 的 anti-spam 系统似乎力有未逮, 经常会漏掉. 每天我大约还要手工归档 50 封.
这些垃圾邮件, 大致分个类看看:
*) 发票代开. 非常符合中国国情的垃圾邮件.大约占 10% 是这一类的邮件. 估计再过一段时间, “办证”的也通过网络宣传了.
*) 培训信息. 我这个信箱很奇怪. 经常能收到一些什么针对人力资源的培训啦,文秘的培训, 高级经理培训/ 采购经验之类的. 从这类的广告我还了解到一个词:跟单员.第一次知道有这个工种.
*) 色情信息. 很大一部分是日文的.看不懂.还有一些打擦边球的, 卖成人用品的、”自拍”的, 这个能占 10% . ”食色性也”
*) 看不懂的. 还有一类是看不懂的文字, 排版的方式也千奇百怪. 不知道是什么文字。
*) 标准的垃圾广告. 指的是在标题上注有[AD]字样的垃圾邮件. 当然, 也有 [A.D], [A/D] 这样的挖空心思钻过滤空子的. 标题上还能看到什么星号, 方块, 波浪线什么的, 感慨垃圾邮件工作者这用心良苦. 正是他们的辛苦努力, 使得反垃圾邮件技术不断进化、发展.
*) 推销”廉价”产品. 什么二手笔记本, 打折机票, 优惠价格发表论文, 低价翻译公司。
最近 6.1 节, 当当网的垃圾邮件疯了一样的发过来, 有增无减.
前一段时间看到新闻说, 全球64%垃圾邮件服务器在台湾, 从我收到的垃圾邮件来看, 繁体中文的并不多. 难道台湾的垃圾邮件服务器都是被其他地区的利用么? 还是我只是个例?
又是一个”世界第一”阿! 和 Spam 有关的另一个中国地名是 Chongqing. 专门形成了一个词:

Chongq (verb): to retaliate against spammers of wikis and blogs.

制作垃圾的同胞请继续努力, 用聪明才智积极的 anti-anti-spam ,推动 anti-spam 技术进一步发展.
–End.

MT ‘nofollow’ plugin ,联手抵制SPAM留言

1月18日,Movable Type 发布了一个新的插件:‘nofollow’ 。因为是 GoogleYahooMSN 这三个搜索引擎巨头联手抵制 SPAM,估计总能对Blogger们深恶痛绝的SPAM留言起到一定的打击作用。通过对来访者添加的超级链接中自动添加 rel=”nofollow” 属性,搜索引擎能够有判断那些是 SPAM 留言,那些试图在 Comments 上获得更好的 Pagerank 的站点要白费气力了。

继续阅读

此文作者:, 位于 Web 分类 标签: , on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.