分类归档: Review

世说新语: 汉语编程

很多人问我雅虎有没有可能在搜索领域赶上谷歌,我明确地回答–没有,因为雅虎不可能专注在这个领域。有时,一个好的公司不能完全按华尔街的意愿办事
–Google 吴军

支持方言编程!
–在 Twitter 上有人讨论到”汉语编程”这个笑话一般的话题. Yining 干脆来个荒谬到底.

大唐今天倒闭,我们明天就能用上3G
–网友 xlight 针对明白了大唐 3G 为啥不行的留言.

辞职完全属于员工自愿,没有公司强迫行为。绝大部分员工会通过竞岗回到原来的岗位
–华为回应媒体报道的”华为让万人辞职、重新签订合同”事件

抄一段独白:

该死的
整整一代人都在当加油工、招待员或者白领奴隶
广告诱惑我们追逐汽车和时尚
于是我们拼命工作
买那些没用的狗屎
我们是被历史遗忘的一代
没有目的、没有地位
没有世界大战、也没有经济大萧条
我们的战争就是心灵的战争
我们的生活就是经济大萧条
我们看着电视
相信有一天我们会成为百万富翁、影帝或是摇滚明星
但是
我们不会
这就是我们渐渐面对的现实
所以
我们真他妈的被激怒了

继续阅读

说说北京奥运购票系统瘫痪这事儿

奥运购票网站据说刚上线就瘫痪了,听说而已,没有亲见。奥运会这种”钱多人傻”的项目,自是财大气粗,听说购票系统所用的存储都是花费人民币千万级别的,即使花了大钱还是没办好事,遭到批评也是活该。

开始说是因为网络负载导致瘫痪,后来又辟谣说,“主要还是系统后台的数据库的处理能力,在设计、规划方面,还有待于改进”

那我们实际看一下具体数据。“票务系统已经做了多次压力测试,票务系统每小时将能处理3万张门票的销售(另外又说:三个售票渠道共同能够处理的售票能力是每小时15万张),以及承担每小时100万次以上的网上浏览量。”,这算下来,也就是每秒钟处理不到 9 个交易请求,平均每秒钟 278 个点击(这也难怪百度李彦宏唏嘘一把: 不要说800万次,就是每小时8000万次,对百度来说,也只是a piece of cake),这真是一个非常业务指标非常低的系统了。整个系统启动后,系统一个小时涌进来 20 万订单,其实平均每秒钟不过 56 个交易请求罢了。如果把问题推到数据库身上,还不如把问题推到开发人员数据库水平上。

抛开技术限制,门票的销售策略也让人觉得很傻,难道就不能一次只售一种项目的票麽? 先售那些比较冷门的项目分流一下访问压力,是很简单方便的真实压力测试。这只是奥运 IT 体系建设的第一次公共亮相,不由得让人担心其他方面的健壮性。

回头说李彦宏的自大。每小时 8000 万次,一天就是 19 亿 的 PV,百度能有多少? 雅虎也不过是 40 亿PV而已。就别小菜一碟了,再说这只是 PV,如果加上事务量,那是更难搞的。

对比一下国内比较大的交易网站,中国彩票协会的数据:

营收35,000,000元/日(博彩业钱真好赚), 目前系统每天交易笔数50,000,000笔,峰值处理4000笔/秒

这种压力估计还有的一搞。

EOF
Updated: 有人说其实是临时工的错,很有道理

WordPress 对 Gravatar 进行的优化

WordPress.com 母公司 Automattic刚收购 Gravatar 没几天,工程师就对 Gravatar 进行了一番手术,把 Gravatar 并入了 WordPress.com 的技术架构.

合并后的 Gravatar 在两个不同的数据中心各有一台应用服务器 + 1 台 Cache 服务器。Cache 服务器用的软件是 Varnish ,峰值能够处理 1000个/秒 的请求,效率很惊人,据说 Varnish 跑在 FreeBSD 6 或是Linux 2.6 上充分发挥性能,实际处理能力比这个还要强。

Web 服务器分两种:普通的为 Apache2 + Mongrel, 图片服务器则是 lighttpd + mod_magnet (看来 lighttpd 是图片服务器非常流行的使用啦 ),不过他们遇到了内存泄漏问题(Bug?),每隔一段时间要重新启动一次,对这个的控制用的是 Monit

Monit 这个小工具我是第一次知道,功能也很有趣。

小成本,高性能,这帮老外玩的就是透。国内的 Feedsky 啥的也需要加把劲儿了,最起码也要向豆瓣看齐吧?

EOF

Slashdot 网站架构补遗

Slashdot 前一段时间搞 10 周年庆典,公布了网站的架构信息(软件硬件)情况。国内的克隆站点 Solidot 有朋友对此做了介绍。看了之后感觉剩下没有介绍的还有嚼头,也写一篇记录一下。

前面本站介绍 Digg 网站架构的时候说他们只有 100 台左右的机器,Digg 在 Alexa 上排名是 100 名左右,而 Slashdot 大约在 750 多,相比之下,服务器也少多了。Web 服务器有 16 台。操作系统都是 Red Hat 9(比较古老)。Apache 是 1.3 版本,模块包括 mod_perl 和 lingerd(用以提高内存效率). 这 16 台中有一台是面向 https 的。MaxClients 设置都很小,面向动态内容的设置 5-15 ,面向纯静态内容的只有 25。因为瓶颈不在 IO 而在 CPU 上。

Web 服务器 IO 压力不大是因为用了 Pound 作为反向代理与负载均衡服务器,Cache 了大部分 IO 。

Slashdot 比较奇怪的一个地方是 NFS 的利用方式。 Web 服务器都用同样的软件, NFS 服务器输出一个只读的 目录,每台 Web Server Mount 该目录。NFS 服务器后台有任务定期写回。这个实现方式有点意思,看起来似乎 NFS 是个单点–写单点。

数据库有 7 台 MySQL,都运行在 CentOS 4 上。CentOS 是 RedHat Enterprise Server 的克隆版。一直以为是不登大雅之堂的。Slashdot 这次也披露了不少数据层的使用经验,感兴趣的朋友可以点击开头的链接仔细看看。

总的来说,Slashdot 毕竟算是个老网站了,和 Digg 这样的新贵来说,在架构上相对比较保守,但仍有许多东西值得借鉴。

EOF