作者文章: Fenng

南大招聘宣讲会

昨天晚上参加了支付宝 2009 校园招聘会 南京大学站。

毕业生就业压力大,以前只是说说,只有切实感受之后才会有真正的体会。会场来得人真多。远超出了我们的预期。在浙大的时候大约 500 同学来到了现场,之前预估南京大约有 600 人,可实际上根据考试卷的统计是大约 800 多人。很多同学都不能进场听宣讲,我个人觉得挺遗憾,宣讲内容挺精彩的。这次现场也有同学把简历带来的,现在很多同学的简历都是简洁的一页纸,这个很有必要,两页以上的简历其实有些累赘了,当然,能否参加接下来的面试是需要看笔试的结果的。

非常不巧的是南大的科技馆会议厅的中央空调居然坏掉了。导致会场实在过热,真是始料不及的事情,尽管和科技馆的负责人紧急联系了也无能为力。宣讲会之后很多同学就是在这个会议厅参加的笔试,非常辛苦! 我这里只能再说声抱歉! 也希望同学们不要到校园网上骂我们 … 另外,入场的时候宣传品因为人太多,后来的同学就没领到。也请不要介意。

笔试之后的阅卷部分很累人,比在浙大复杂了一些。今天凌晨 1:30 左右大部分同事才能休息,而负责录入与通知的同事可能就更晚了(也可能一直没休息)。

今天的面试估计更有挑战,同事们已经去现场了。我没和大家一起吃早饭,所以偷懒写点东西,其他内容等今天晚上补充一下吧(已经电话来催我了, Hoho)。

EOF

明天去南京

明天去南京,参加 支付宝 2008 校园招聘会南京大学站。自己算临时被抓壮丁的,主要是运维相关面试( SA / DBA ),如果有人对 Web 前端技术有兴趣,也可以谈一下。

早晨出发,中午到。下午要去参观一下途牛网,拜见一下几位大牛 (推荐一下隽辰同学这个敦煌相册,祖国大好河山就是美呀!) 。

2002 年的时候去过南京一次,当时也是出差,只记得南京的酱鸭了,不过现在不能吃这些东西了。

EOF

附:关于招聘的 FAQ

病中的 eBay

电子商务巨头 eBay 有恙,病在腠理,不治将恐深。已经好久不写针对竞争对手公司的评论了,但《福布斯》这篇文章真的让人感触良多。

硅谷的 IBM

谁的会议多,谁的效率低下:

公司内部流传着一个笑话,说eBay已经成了”硅谷的IBM”。20年前,IBM的官僚作风最终导致了公司风光不在,而这一比喻正是对eBay当前状况的真实写照。一些现任和前任eBay员工纷纷在采访中抱怨说,eBay总是有开不完的会,公司太看中幻灯片的演示而忽视了真正的创新。他们说,eBay成了 “商业咨询师”的聚集地,但是这些人大都是”纸上谈兵”,根本没有与客户进行深入的接触,而且缺乏技术眼光,行为方式过于保守,而真正工程师却只能在一旁听候指挥。

不吃自己的狗粮

eBay 管理人员不用自己的产品,自然也就无从知道用户的感受:

“eBay的管理人员都很聪明,但是这些聪明人却从来都不用eBay,也没有花费足够的时间来研究他人是如何使用eBay的。”

电子商务公司需要技术高层

除了刚刚加盟前网景公司联合创始人马克-安德森(Marc Andreessen)之外,eBay公司的最高管理层中找不到任何的拥有技术背景的人。

尽管有些问题,但是 eBay 仍然是需要我们仰视。

EOF

Cocolog 从 PostgreSQL 迁移到 MySQL 的经验

 Tips: 10 月 9 日我将去南京,参加支付宝 2008 校园招聘 南京大学站。

logo_cocolog.gifCocolog 是日本领先的 Blog 社区,基于 SixApart 的 TypePad 技术框架。运营公司是 NIFTY(最新的调查报告显示,NIFTY 在日本流量排名第 10 ) 。前一段时间看到这篇 Migrating from PostgreSQL to MySQL at Cocolog, Japan’s Largest Blog Community ,比较详细的描述了从 PostgreSQL 迁移到 MySQL 的经验,很有参考价值(日本互联网技术特点?),在这里做一篇学习笔记。

核心系统的支撑软件

  • Linux 2.4/2.6
  • Apache 1.3/2.0/2.2 & mod_perl
  • Perl 5.8+CPAN
  • PostgreSQL 8.1
  • MySQL 5.0
  • Memcached/TheSchwartz/cfengine

都是一些司空见惯的东西, cfengine 是用作软件维护、部署、分发的玩意儿。

初期技术架构示意图

这是我第一次知道 TypePad 除了 SixApart 自己的服务之外还支撑了第三方的站点(孤陋寡闻!)。

Cocolog_phase_1.png

初期 PostgreSQL 基本上是用来存储本地注册用户信息。这个阶段数据库分区之前,服务器数量在 10 个以下。

第二阶段

这阶段数据库分区之前,服务器数量在 50 个以下,可以看到 DB 还额外存储了富内容模板等元数据信息。系统各个模块紧耦合,数据库 Schema 变更有些费劲了。

Cocolog_phase_2.png

第三阶段

Web API 的引入在一定程度上消除了紧耦合的问题,Memcached 的引入很大程度减轻了 DB 的负担。服务器数量在 200 个以下,未分区之前。

Cocolog_phase_3.png

第四阶段

数据库分区之前,服务器数量在 300 个以下,增加对移动互联网的支持能力。这个时候 PostgreSQL 貌似还是单实例的样子。数据超过 100GB,40% 是索引。要忍受比较严重的数据碎片问题,备份是个麻烦事儿。

Cocolog_phase_4.png

在此之前,PostgreSQL 服务器在硬件上一直是 Scale Up 的思路,内存从最初的 1GB 扩展到 07 年底迁移前的 16GB,磁盘换到了阵列上,阵列是富士通的 E8000 。国内倒是很少遇到有把 PostgreSQl 扔到企业存储上的案例。

现阶段

这是迁移后的架构示意图。引入了多个 MySQL 实例。从原来的 Scale Up 切换到 Scale Out 的路线上。数据库分区,服务器数量 150 个。

Cocolog_phase_5.png

集群软件采用了 NEC 的 ClusterPro 。数据库是共享存储的,不过 I/O 瓶颈应该消除了,因为读的压力分散在每个 MySQL 服务器上,内存承担了大部分工作。写操作的压力在一台存储上,问题不会很大。

实施步骤

  • 1. 服务器准备;
  • 2. 全局写问题(Global Write) 应对策略:写用户信息到全局 DB 中;
  • 3. 全局读问题 应对策略:读、写用户信息在全局 DB 中折腾;
  • 4. 迁移序列  应对策略:全局 DB 承担;
  • 5. 用户数据迁移 (User Data Move) 应对策略:移动用户数据到用户分区中;
  • 6. 新用户分区 (New User Partition) 应对策略:所有新用户直接保存到新用户分区1中;
  • 7. 新用户数据处理策略   根据需求设定一个策略;
  • 8. 非用户数据迁移。

这几个过程都不难理解,数据迁移的一节倒是值得描述一下:

Cocolog_data_migrate.png

对上图做个解释(其实也是翻译 PPT 上的注释):

  • 1 Job 服务器提交一个新的Schwartz Job 迁移已有的用户数据,用户数据异步迁移;
  • 2 迁移中的用户发布的留言保存到 Schwartz ,稍后发布;
  • 3 迁移完毕后,所有用户数据存放在用户角色 DB 分区;
  • 4 一旦所有用户数据迁移完毕,只有非用户相关数据存在 PostgreSQL 中。

这个迁移的技术细节其实可能不那么重要,但重要的是必须有个迁移流程的制定过程,任何所谓的迁移,如果没有制定详细的计划,无疑会吃苦头。

迁移后的备份示意图:

Cocolog_data_backup.png

最后看一下架构概览图(点击可放大):

Cocolog_Overview.png

Tip:这个架构图中关于 NAS 部分,可能不那么可靠的。

上面引用的图版权归原 PPT 作者所有。转载我这篇流水帐的网站请不要随便给图片打水印。

EOF

P.S. 如果你有耐心看完前面的部分,你或许应该提出如下疑问:

  • 1)为什么要迁移到 MySQL ? PostgreSQL 也是支持分区的啊 …
  • 2) 这其实就是个数据 Sharding (分片)的问题, 作者为啥不直接说?
  • 3) 第五阶段, 服务器数量为什么变少了?
  • 4) 迁移全是在线进行的么? 有没有影响用户访问?

如果一个问题都没有, 其实和没看差不多。

又及:PPT 里面提到的监控指标也需要注意一下,你的网站监控了这些内容么?

response time of each post
number of spam comments/trackbacks
number of comments/trackbacks
source IP address of spam
number of entries
number of comments via mobile devices
page views via mobile devices
time of batch completion
amount of API usage
bandwidth usage