DRBD - DBA Notes | 闲思录

如果有人问你一台 PC 服务器是否可以达到 99.99% 的高可用，该如何回答呢? 或许没有一台机器能”确保”达到这样的可用率，当然在某个时间段或许不会出问题，但这个肯定是看运气，而高可用基本上是没办法通过一台来达到目标的，我们更多的时候是设计方案确保在出问题的时候尽快接管故障机器，当然这要付出更大的成本。

对于 Oracle 的高可用方案可以参考 Maximum Availability Architecture (MAA) 白皮书，不过 Oracle 并不推崇操作系统级别的解决方案。MySQL 的指导策略倒是更为灵活一些，DRBD^® (Distributed Replicated Block Device) 就是个可以考虑的选择。以前关注过这东西，但是据我了解，好像国内实现的案例不多，不知道是不是处于对网卡同步速度的限制考虑。现在这个有了新的转机，在 8.3 版本上已经能够支持 InfiniBand 。而原来通过网卡同步数据块的方式毕竟受网卡延时和带宽的限制，InfiniBand 的支持的实现相信能赢得一部分企业用户的信赖。

Linux Kernel Summit 2009 上这次有对 DRBD 的介绍(注意对数据一致性的介绍)，这意味着能正式进入 Kernel 么?

相对专有的集群管理工具，也有开源的集群管理工具 Pacemaker (支持 Heartbeat 与 OpenAIS 标准)可供配套使用。Pacemaker 能够较为灵活的实现主备、N+1 、N-N 等多种模式。感人感觉会比较有生命力。

好的开源解决方案就是设计活动木板房，廉价灵活环保，当然，牢固肯定是第一目标。

补充：

根据 MySQLPerformanceBlog 的说法，MySQL 几种高可用解决方案能达到的可用性如下：

–EOF–

更新1：现在 DRBD 已经进入核心代码，预计 2010 正式并入 Kernel 。
更新2：Linux Kernel 2.6.33 发布，正式包含 DRBD

前几天 MySQL 站点上有个为期 12 天以 Scale-Out 为主题的活动，列举了不少成功的案例，每个页面有下方的这个图很引人注意：

注意到主备服务器之间的 HA 是通过 DRBD(Distributed Replicated Block Device)做到的。DRBD 号称是 “网络 RAID”，开源软件，由 LINBIT 公司开发，MySQL 与 LINBIT 达成了合作关系，大张旗鼓的搞了这个 “12 天 Scale-Out” 活动也是这个商业合作驱动的吧。DRBD 助力 MySQL, 号称可以得到四个 9 的可靠性，这不低于任何一款商业数据库软件了。

DRBD 的出现的确对 MySQL 集群的可用性有很大提高。而且，有独到的特点，非常适合面向互联网的应用。因为是在存储层的数据块同步，很容易的做到应用层的 IO 负载均衡(备机承担一定的读压力)，不但支持数据库失败接管，还能做到 IP 失败接管，接管时间小于 30 秒，真是穷人的绝佳集群解决方案(相比 Oracle 下的一些方案，比如 eBay 采用的方案，性价比还是不错的)。国外已经有很多成功的实现案例，国内的 Web 2.0 站点不知道是否已经有人在用，在这里推荐一下。更为有趣的是，已经有人通过 DRBD 来实现 Oracle 的另类集群。

怪不得前一阵子已经有开源爱好者开始宣称类似 “RAID即将成为过去式” 的激进言论。

–EOF–

记录一些关于互联网的信息碎片

Tag Archives: DRBD

DRBD 与 Pacemaker

DRBD 提升了 MySQL 的集群能力