国庆出游

这个国庆跑了一大圈。9 月 25 日就开始休假了，加起来一共十几天的假期过得其实挺累。我的路线是：杭州－>上海－>成都－>黄龙－>九寨沟－>成都－>沈阳－>抚顺－>长春－>杭州。

先去的四川成都，然后走马观花了去了黄龙、九寨沟和都江堰。其实我是个比较懒的人，不过是答应了 Laura 今年要出来玩一次的，要讲究诚信嘛。

黄龙我个人觉得一般般。到了景点才知道为啥叫做黄龙。起这个名字的人一定是搞航拍的。

同行的还有一对印尼来的 Thomas 夫妇，导游的英语似乎不过关，我有的时候自告奋勇冒充一下翻译，可怜我的洋汀浜英语……这俩人行程安排的可倒挺满，基本把国内著名景点都逛遍了，挺佩服他们的体力。

九寨沟的水：

九寨沟还是名不虚传的，所谓”九寨归来不看水”倒是一点也不夸张。其实游客都是挺自私的，景观虽好，但不会因为你来了而变得更美，只会更糟。昨天看到世界遗产的中国悲歌这篇文章，觉得文中的担忧是对的。游客这么多，到哪里都和蝗虫似的。

没经得起司机的撺掇，也顺便去都江堰转了一圈：

大家都知道都江堰是李冰父子主导修建的。到底李冰的儿子叫啥? 这龙套跑的，好几千年了也没多少人知道。搜索了一下，似乎叫做”李二郎“，好像只是个小名啊。

这一圈很多时间坐车/飞机, 搞得我颈椎现在有反应了，今天不得不跑去做推拿。

更多图片请移步：一，二

–EOF–

Amazon 的 Dynamo 架构

我在 DBAnotes.net 上记录过不少比较大的网站架构分析(eg: eBay [1], eBay [2]) ，Amazon 一直找不到太多的资料。国庆期间读到了一篇关于 Amazon Dynamo 的论文，非常精彩。Amazon Dynamo 这个高可用、可扩展存储体系支撑了Amazon 不少核心服务.

先看一个示意图:

从上图可以看出，Amazon 的架构是完全的分布式，去中心化。存储层也做到了分布式。

Dynamo 概述

Dynamo 的可扩展性和可用性采用的都比较成熟的技术，数据分区并用改进的一致性哈希(consistent hashing)方式进行复制，利用数据对象的版本化实现一致性。复制时因为更新产生的一致性问题的维护采取类似 quorum 的机制以及去中心化的复制同步协议。 Dynamo 是完全去中心化的系统，人工管理工作很小。

强调一下 Dynamo 的”额外”特点：
1) 总是可写
2) 可以根据应用类型优化

关键词

Key: Key 唯一代表一个数据对象，对该数据对象的读写操通过 Key 来完成.
节点(node)：通常是一台自带硬盘的主机。每个节点有三个 Java 写的组件：请求协调器(request coordination)、成员与失败检测、本地持久引擎(local persistence engine)
实例(instance)；每个实例由一组节点组成，从应用的角度看，实例提供 IO 能力。一个实例上的节点可能位于不同的数据中心内, 这样一个数据中心出问题也不会导致数据丢失。

上面提到的本地持久引擎支持不同的存储引擎。Dynamo 上最主要的引擎是 Berkeley Database Transactional Data Store(存储处理数百K的对象更为适合），其他还有 BDB Java Edition、MySQL 以及一致性内存 Cache 等等。

三个关键参数 (N,R,W)

第一个关键参数是 N，这个 N 指的是数据对象将被复制到 N 台主机上，N 在 Dynamo 实例级别配置，协调器将负责把数据复制到 N-1 个节点上。N 的典型值设置为 3.

复制中的一致性，采用类似于 Quorum 系统的一致性协议实现。这个协议有两个关键值：R 与 W。R 代表一次成功的读取操作中最小参与节点数量，W 代表一次成功的写操作中最小参与节点数量。R + W>N ，则会产生类似 quorum 的效果。该模型中的读(写)延迟由最慢的 R(W)复制决定，为得到比较小的延迟，R 和 W 有的时候的和又设置比 N 小。

(N,R,W) 的值典型设置为 (3, 2 ,2),兼顾性能与可用性。R 和 W 直接影响性能、扩展性、一致性，如果 W 设置为 1，则一个实例中只要有一个节点可用，也不会影响写操作，如果 R 设置为 1 ，只要有一个节点可用，也不会影响读请求，R 和 W 值过小则影响一致性，过大也不好，这两个值要平衡。对于这套系统的典型的 SLA 要求 99.9% 的读写操作在 300ms 内完成。

–待续–

更多阅读：Dynamo学习 — http://donghao.org/2008/10/dynamoni.html

高尚生活

偶尔看电视，光看广告就足以把人乐坏了。

记得以前有个白酒广告喊着“高尚生活元素”，恶俗的不得了。刚才看到一个某品牌方便面广告，也号称”高尚生活”，笑翻。这广告策划也不动动脑子。

什么时候吃方便面也高尚的话，那社会可就真和谐了。以后骂人没准都这么说：“你才高尚呢，你们全家都高尚！”

–EOF–

Digg 网站架构

本篇描述一下 Digg 的网站架构.

国庆期间又收集了一些关于网站架构的信息。一直没有进行系统的整理。越来越发现其实都是自我重复的劳动，后续的信息都是嚼别人剩下的甘蔗。--by Fenng

Digg 工程师采用 LAMP (Linux, Apache, MySQL and PHP) 模式。这个 Alexa 排名在 100 左右的、自我估价 1.5 亿美金的站点目前有超过 100 台的 PC 服务器(足够少了)，可以粗略分成三个部分：数据库服务器，Web 服务器，搜索服务器。

数据库方面，和其他成功的 Web 2.0 站点一样，也是 MySQL，不过 Digg 稍微”激进”一点，用 MySQL 5，而且号称从 MySQL 4 升级到 5 性能没有什么影响。 OLTP 应用用 InnoDB 引擎, OLAP 用 MyISAM。后端数据库的读比例达到 98%，写只有 2%，实际的读写比例应该高于这个数字，这应该是 Digg 在前端用 Memcached 以及 APC PHP accelerator / MCache 做缓存后的效果。在 IO 上似乎压力并不大。

数据库分割用 Sharding (分片)的机制。从透露出来的信息看，Digg 数据量并不大，仅仅刚超 30g . 看起来是只存储了一些元数据。至于这个 Sharding 或者 Shard, 其出发点有些类似于数据库的分区，差别可能就是不再一个库上吧，其实都是结合业务和应用来对一些数据对象进行分割。

搜索服务器用的是 Lucene。

进一步阅读：

–EOF–