有扩展性问题请向 Flickr 的 Cal Henderson 提问

《程序员》杂志在做关于 Web 可扩展性的专题,编辑朱海燕联系上了 Flickr 的 Cal Henderson, Web 2.0 应用最出色的架构师之一, 准备对他进行 e-mail 采访,如果大家有什么关于 Web 扩展性的相关问题,可以在后面留言或者发邮件给 [email protected] , 我代为转交。

五月份阿里巴巴举办的侠客行网络大会 Cal Henderson 因为时间的关系而没能成行,希望这次的采访能弥补一下不少人的遗憾。

EOF

eBay 的数据库分布扩展架构

在过去的 Blog 中, 我(插一嘴:这里的”我” 如果替换成 “Fenng” 似乎有些自恋, 也不是我喜欢的行文语气, 可发现转贴不留名的行为太多了,他大爷的)曾经介绍过 《eBay 的应用服务器规模》 , 也介绍过 《eBay 的数据量》,在这篇文章中提到过 “eBay 购买了 Quest Share Plex 全球 Licence 用于数据复制”,这个地方其实没有说开来。

对于 eBay 这样超大规模的站点来说,瓶颈往往最容易在数据库服务器上产生,必定有一部分数据(比如交易记录这样不容易水平分割的数据)容易带来大量的读操作,而不管用什么存储,能承担的 IO 能力是有限的。所以,如果有效的分散 IO 的承载能力就是一个很有意义的事情。

经过互联网考古学不断挖掘,路路续续又现了一些蛛丝马迹能够多少说明一些问题。客观事实加上主观想象,简单的描述一下。见下图:

ebay_shareplex_F5.jpg

通过 Quest 公司的 Share Plex 近乎实时的复制数据到其他数据库节点,F5 通过特定的模块检查数据库状态,并进行负载均衡,IO 成功的做到了分布,读写分离,而且极大的提高了可用性。F5 真是一家很有创新性的公司,虽然从这个案例来说,技术并无高深之处,但方法巧妙,整个方案浑然一体。

F5公司专门为Oracle 9i 数据库开发了专用的健康检查模块,通过调用F5专有的扩展应用校验(EAV)进程,F5能够随时得到Oracle 9i数据库的应用层服务能力而不是其他的负载均衡设备所采用的 ICMP/TCP 层进行健康检查。

这个图来自一篇《F5助力eBay数据库服务器负载均衡》的软文,真是一篇很好的软文,国外恐怕不会出现这样”含金量”极高的东西。

当然,这个技术架构可不算便宜。Quest 的 Share Plex License 很贵,而且,对于每个结点来说,都需要数据库 License 与硬件费用。但优点也很多:节省了维护成本; 数据库层面的访问也能做到 SOA; 高可用性。

国内的一些厂商比较喜欢给客户推存储级别的解决方案。通过存储底层复制来解决数据分布以及灾备问题。这个思路似乎太传统了,对于互联网企业来说多少有点过时。

BTW: 对 Amazon 的存储架构非常感兴趣,谁/哪里能提供点线索呢?

EOF

DBA 还要人品好?

有感而发。从 ITToolBox 上一则 Blog 看到这个文章:一位 DBA 涉嫌盗取了 230 万客户资料。其中 220 万是银行账户资料,9.9 万条是信用卡记录。不知道这位一时想不开的 DBA 最后是否获罪。如果在国内,可能问题不大,教育教育罚点款就差不多无事了,在美国可不好说了,弄不好要关个几年,个人信用估计也将受到影响。

做个 DBA 可不容易,不但要技术好,还要人品好,能顶得住不义之财的诱惑(有没有什么公司提供高薪养廉的机制?)。莫伸手,伸手必被捉。

这种来自公司内部的威胁其实挺多的,最近《二十一世纪经济报道》上也有文章说的是类似的事情:危险的后门:内部”黑手”探囊安全网络

EOF

代发招聘信息:产品设计(PD)

最近发的招聘信息多了一点 :)

招聘单位:阿里巴巴软件(上海)有限公司
工作地点:杭州
要求:
1、熟悉数据分析技术和熟练使用 Excel。
2、熟悉一种或两种产品设计模型。
3、熟悉互联网产品设计流程(包括线上产品修正流程)或熟悉IPD亦可。
4、对互联网行业敏感,对WEB2.0元素及其常用设计方法熟悉。
说明:
本职位常年招聘。有意者请发邮件给: [email protected]

EOF