Monthly Archives: November 2006

随感, Six Apart, Web 2.0 时代的小巨人?

前几天看到业界猜测 “雅虎的困惑: 卖给微软还是收购AOL” 的时候,我倒是想雅虎为什么不收购 Six Apart 呢(后台技术架构也蛮符合的)? 当然,这不过是我一厢情愿的胡乱猜测,现在 Six Apart 活得滋润得很,而且,人家也胃口不小,在前一段时间流传的一份 Web 2.0 收购列表中,我们可以看到 Six Apart 也是和 Google / Yahoo 等巨头一起作为收购方出现的,Six Apart 收购有两笔,共 3000 万交易金额:

收购时间 被收购方 收购方 传闻价格
Jan-05 LiveJournal SixApart $20 million
Sep-06 Rojo SixApart $10 million

Six Apart 目前能够提供最为全面的 Blog 服务,从 Blog 这一点出发,可谓做足了功夫:
Movable Type: 企业级 Blog 内容发布平台,面向中小企业,对个人用户的版本免费,积累了很不错的口碑。
TypePad : 传统意义上的 BSP。面向传统 Blogger。
LiveJournal:面向 Geek 。
VOX: Blog 生活社区。 (超一流的用户体验,另,推荐 Flypig 的《Six Apart总裁访谈》一文)。
在这个外围,有最近收购的 Rojo, 提供在线 RSS Reader 服务。
或许是因为从 Movable Type 这样的工具起家的缘故,Six Apart 对所有产品 “打磨” 得都非常细致,功能可能未必是最全最强大,但是用户使用体验几乎都是一流的。我就是 Six Apart 的忠实用户–使用他们免费的产品 Movable Type 个人版快两年了。
相信 Six Apart 有机会成为 Web 2.0 时代的小巨人。从最初的夫妻店发展到现在,这本身也是一个不折不扣的传奇故事。
EOF

06 年 Oracle 杂志编辑选择奖

2006 年度 Oracle 杂志编辑选择奖已经出来了。
Steven Feuerstein 是 “年度PL/SQL 开发者”。这位 PL/SQL Guru 还在琢磨如何和布什见个面
Jonathan Lewis 是 “年度 Oracle 作者”,他的 Cost-Based Oracle Fundamentals 一书的确很见功力。Thomas Kyte 也有实力竞争这个奖,但 Tom 毕竟是 Oracle 公司的,多少也要避嫌一下–我猜的。
Eddie Awad 获得”年度 Oracle 相关 Blogger” 奖,我觉得这个大胡子写的其实也一般,谁让咱们不会用英文写 Blog 呢? 05 年的获得者是 Mark Rittman ,Blog 质量的确不错。
Tim Hall 获得 “年度 Oracle ACE”奖。Tim Hall 是 Oracle-Base 站长。他发表在 Oracle-Base 上的文章有一定的参考价值。到现在 我也不知道 Oracle 的 ACE 这三个字母都代表什么,A 是 advocates ? 总之, ACE 就是那些在 Oracle 技术圈子比较活跃的人,有些 Guru 级的人入选,也有些技术功底并非那么深厚但是在社区非常活跃的人入选。中国大陆似乎还没有 ACE。
Regent Roberge 获得 “年度DBA 奖”。对他的事迹不了解。
另外 还有个 “年度开源开发者” 被 Internet Archive 公司的 Gordon Mohr 得到,Oracle 杂志编辑选择奖本来和开源八杆子打不着,看来是收购 Sleepycat 之后专门为拉拢 Berkeley DB 开发社群而建的。
其它的得奖名目还有什么”年度 CIO” 之类的,没准是 Oracle 的关系客户。
EOF

Craigslist 的数据库架构

(插播一则新闻:竞拍这本《Don’t Make Me Think》,我出价 RMB 85,留言的不算–不会有恶意竞拍的吧? 要 Ping 过去才可以,失败一次,再来)
Craigslist 绝对是互联网的一个传奇公司。根据以前的一则报道:

每月超过 1000 万人使用该站服务,月浏览量超过 30 亿次,(Craigslist每月新增的帖子近 10 亿条??)网站的网页数量在以每年近百倍的速度增长。Craigslist 至今却只有 18 名员工(现在可能会多一些了)。

Tim O’reilly 采访了 Craigslist 的 Eric Scheide ,于是通过这篇 Database War Stories #5: craigslist 我们能了解一下 Craigslist 的数据库架构以及数据量信息。
数据库软件使用 MySQL 。为充分发挥 MySQL 的能力,数据库都使用 64 位 Linux 服务器, 14 块 本地磁盘(72*14=1T ?), 16G 内存。
不同的服务使用不同方式的数据库集群。

论坛

1 主(master) 1 从(slave)。Slave 大多用于备份. myIsam 表. 索引达到 17G。最大的表接近 4200 万行。

分类信息

1 主 12 从。 Slave 各有个的用途. 当前数据包括索引有 114 G , 最大表有 5600 万行(该表数据会定期归档)。 使用 myIsam。分类信息量有多大? “Craigslist每月新增的帖子近 10 亿条”,这句话似乎似乎有些夸张,Eric Scheide 说昨日就超过 330000 条数据,如果这样估计的话,每个月的新帖子信息大约在 1 亿多一些。

归档数据库

1 主 1 从. 放置所有超过 3 个月的帖子。与分类信息库结构相似但是更大, 数据有 238G, 最大表有 9600 万行。大量使用 Merge 表,便于管理。

搜索数据库

4 个 集群用了 16 台服务器。活动的帖子根据 地区/种类划分,并使用 myIsam 全文索引,每个只包含一个子集数据。该索引方案目前还能撑住,未来几年恐怕就不成了。

Authdb

1 主 1 从,很小。
目前 Craigslist 在 Alexa 上的排名是 30,上面的数据只是反映采访当时(April 28, 2006)的情况,毕竟,Craigslist 数据量还在每年 200% 的速度增长。
Craigslist 采用的数据解决方案从软硬件上来看还是低成本的。优秀的 MySQL 数据库管理员对于 Web 2.0 项目是一个关键因素。
EOF

本周言论 之 我死诸君思我狂

如果你愿意出200块的快递费,我给你找新丝路的模特儿给你送快递上门
–当当网李国庆
阿扁说当初提名我时忠心耿耿,现在不听话,我是对职务忠心耿耿,不是对你阿扁
–苏振平
我们的规模不是很大,没有很大的目标,我们希望通过服务的盈利模式在2008年底前实现盈利。
Ubuntu并不是非常有野心,我们不会成为微软这样的公司,我们是一个小公司
–Ubuntu 创始人 Mark Shuttleworth
博客实名制是势不可挡的
–方兴东
我死了以后,你们想我会发疯的,所谓’我死诸君思我狂’啊
–李敖. (这句话前半句方舟子说也可以,我支持方舟子)

继续阅读