Monthly Archives: August 2006

Munging Email 地址,避免 Spam 骚扰

相信大家每天都被铺天盖地的垃圾邮件(Spam)烦透了,即使是目前对付垃圾邮件最好的Gmail,在我的邮箱里每天也会因为判断不明错放进来几十封。国外已经有些组织针对 Spam 开战,今天访问了 Project Honey Pot ,简单介绍一下该项目介绍的关于 Address munging 。
首先对于 “Munging” 这个词我还真不知道怎么翻译,来自英文 Wikipedia 的说法是:

Mung (or munge) is computer jargon for “to make repeated changes which individually may be reversible, yet which ultimately result in an unintentional irreversible destruction of large portions of the original item.”

Address munging is the obfuscation of e-mail addresses…

第一种方法是简单的替换法。例如:dbanotes#example.com (把# 替换为@)。当然也可把地址中的某个短语或者字母替换掉。 英文环境中用 dbanotes(AT)example.com 或者是 [email protected] 可能更人性化一些。
第二种方法是稍稍复杂一点,如果熟悉ASCII 码的话,@ 等价于 “.”, 可以在 HTML 代码中用这个替换 @ 如果 SpamBot 智商不太高的,基本可以骗过。从这一点出发,你可以考虑把整个邮件字符串都进行 ASCII 化。即使 SpamBot 比较高的智商,恐怕也束手无策了。
第三种方法则基本可以做到万无一失–除非 SpamBot 是人。 这个方法是脚本加上图片。很多 Blogger 站点上的联系方式都用图片,地址可以用一个 JavaScript 来代替。 具体的脚本获取在这里
道高一尺,魔高一丈,随着 Spam 技术的迅猛发展,很多 SpamBot 应该已经具备读取图片的能力(我的Blog 验证字已经不管用了),如果是网站站长,还可以协助 Project Honey Pot 来进行 AntiSpam。也可以考虑加上这个”稻草人”:

@ MEMBER OF PROJECT HONEY POT
Spam Harvester Protection Network
provided by Unspam

估计可能国外的 SpamBot 还能害怕一点点,国内的就不那么遵守流氓规则了。
EOF

V 字仇杀队(V for Vendetta)

如果 50 年后有人撰写世界电影的编年史, 2006 年的代表电影应该有 《V 字仇杀队》的一席之地。
这部电影注定要和《1984》扯上关系,那个无所不在的”伦敦之声”让你没办法不和”老大哥”联想在一起; 没有人知道真相是怎样,真理掌握在少数人手中,”真相也只为少数人所知”,这又彷佛和《黑客帝国》一脉相承(监制就是沃卓斯基兄弟)。
可能很多人会把”恐怖分子”的帽子戴在 V 的身上。或许革命就是暴力与牺牲。在 9.11 之后,整个西方世界太敏感,殊不知他们受到的一点点伤害其实也是由他们自己导演间接完成的么?(去看看中东的 Vendetta,如果没有美国,真的会导致现在的局面么?) 电影中那些学校里被毒害的孩子的事实被巧妙的嫁接,掀起整个民族对异族的愤恨,仇恨使得他们暂时忽略了集权给他们带来的痛苦。仇恨凌驾于自由之上。
或许被绿色长城”保护”的我们,也应该有权利知道真相。《V 字仇杀队》, 国内 Blogger 都应该看的电影。
—————–
V 的扮演者 Hugo Weaving ,就是黑客帝国里的那个 Agent Smith,从头到尾带着面具。
女主角扮演者Natalie Portman。(《这个杀手不太冷》中的那个小姑娘,她已经长大了。)
豆瓣上关于《V 字仇杀队》的更多信息.
EOF

Dreamhost 又掉链子了一回

刚才我的 Blog 所在的服务器宕机, 两个多小时才恢复正常.以往的宕机都是在我不更新 Blog 的时候,倒也不是太烦人, 不过这次有些火大.
刚才登录进去看了看, Load 高达 150 ,权限不够,看不到系统在做什么. 决定监控一下 Dreamhost 的可用性:
http://www.dbanotes.net’s SiteUptime
刚收到 Dreamhost 管理员来的邮件:

We apologize for the inconvenience that you have encountered. However,
we have resolved an issue with your server and dbanotes.net is working
now. It appears that the server was rebooted, which usually means a high
load or configuration problem. Fortunately, our admins were on top of it
and have corrected the problem.

火气小了很多 :)

Google Blogsearch 的时效性以及其他

其实这个现象观察到好久了,那就是 Google Blogsearch实效性非常好,一般情况下 4-10 分钟就可以通过 搜索结果RSS 观察到我刚发表的 Blog 。因为 Technorati 访问困难,很长一段时间里,Google Blogsearch 就成了我进行 Blog eogsurf 最常用的工具。
国内的 Blogger 中,Keso 应该是 Google Blogsearch 的最忠实用户:

“我还是很关心别人怎么说我和我写的东西,所以看到有人谈论我,我就会很感兴趣地去读那些博客。提到我的人,多半是我博客的读者,他们关注我,我也会关注他们。很多次,都是因为有人提到了我的名字,我才发现了新的博客。”博客搜索为博客群体彼此间进一步的交流提供了可能。”–Keso 接受《互联网周刊》的采访

可能是所有 Blogger 的天性,有的时候我也这样,看到别人链接或引用了我写的东西,总要跑上去看看有没有引发出来什么更新鲜的内容。
发现,有的时候也是一种乐趣。
Blogsearch 中的 inurl 语法虽然有效,但是搜索结果有很大问题。应该用 Blogurl 语法(如 blogurl:dbanotes.net 所以车东以前做的测试似乎不太能够说明问题。我的测试结果:

BSP 名字 结果数量
spaces.msn.com 105,881,316
myspace.com 73,014,029
Blogspot.com 66,813,563
Spaces.live.com 10,980,686
Livejournal.com 62,989,323
Typepad.com 4,405,857

MSN Space 是当之无愧的第一大 BSP。
国内的 BSP 除了 CSDN 结果有三万多,其他的 BSP 都少的可怜–有的还没有我个人 Blog 的多。推测原因可能第一个是网站页面结构普遍设计的不好,对 Blog 的一些内置的技术特性理会的不好,也难怪,人家都是用作新闻的手法搞 Blog 的。再一个或许是 Google 对中文用户还没有投入那么大的兵力( Blog 的及时性可能只是针对少数更新频繁的 Feed 抓取 )。 如果你知道原因,请告诉我。
EOF