FeedLounge 使用 PostgreSQL 的经验

这是我唯一看到的 Web 2.0 公司使用 PostgreSQL 的,可惜还失败了。

FeedLounge 是一个提供在线 RSS Reader 的站点。已经在今年 6 月 1 日黯然宣布失败。这里不去讨论他们失败的各种原因,只说说从他们 Blog 上看来的关于他们选择数据库的经验。

FeedLounge 在数据库的使用上路线是这样的:

MySQL(MyISAM) --> MySQL(InnoDB) --> PostgreSQL 

最初是 MyISAM 方式,迁移到 InnoDB ,数据库从大约 1G 膨胀超出了 10G,而且发现引发了新的性能问题,经过尝试发现不能解决后,迁移到 PostgreSQL,总存储从 InnoDB 方式的 34G 缩小到 9.6G,而且,恢复时间也只是原来的大约 1/5 (导出用 Mysqldump,载入用 psql ). 此外,关于内存利用方式上也有一些差异, MySQL : innodb_buffer_pool 6GB + O_DIRECT flush, PostgreSQL 设置上限 2G,只用了 1.2 G。遗憾的是,看不到切换前后性能数据更为详细的对比。

FeedLounge 当时每天要处理的事务量:每天超过 400 万次查询,超过 200 万次的更新/插入操作,高峰期每秒钟有 2000 个更新/插入操作(这应该是批处理阶段)。硬件如何呢? 数据库服务器的硬件:两路 Opteron CPU,8 GB 内存, 6 SATA 7200RPM 16MB 硬盘, RAID 5 ,控制器有 128M. 可以看出来了吧, 7200 转的硬盘 + RAID 5 根本不适合这样的应用。从这一点上说,数据库类型切换其实解决不了本质的问题。

另外看到的有趣参考信息:

FeedDigest 在当时每天有超过 400 万次的查询,超过 200 万次插入,机器硬件只用了双奔四 CPU(2.8GHz) ,1G内存

EOF

杭州真是卫生模范城市

昨天夜里就开始下雨,持续到今天,很大。下班的时候出来,还下着小雨。可是,一阵熟悉的”兰花草”音乐传来,放眼望去,马路上居然有一辆洒水车,而且还在洒着水。马路上还有积水的,洒水的又来了。太有才了。

说起洒水车播放的音乐,还真想起一个点子:唱片公司要想打垮竞争对手,买通管洒水车的,整天播放对手公司歌手的歌曲就行了。比如,洒水车专放”双节棍”,估计过几天就没有人听周杰伦了。

插播一则广告: 汪海的帖子收到了侯总的留言。不知道侯总? 你可以不知道芙蓉姐姐,可以不知道付笛声任静夫妇,但你不能不知道侯总 — “当今最牛的广告牛人”,候总说的”如果你错过了,那么我恭喜你,你买不到了”, “八心八箭” 等话势必成为接下来几个月网络流行”暗号”

其实今天心情挺沉重的。有些”轻”不容易承受。

EOF

此文作者:, 位于 MyLife 分类 标签: , on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

HDS 发布 Universal Storage Platform V (USP V)

HDS 在5月中旬正式发布了高端存储新产品: Universal Storage Platform V (USP V)。这个产品应该只是 TagmaStore USP 的升级版,其定位是和 EMC 的高端存储 DMX-3 进行竞争,目前市场上也只有这两家在高端上有一拼,IBM 那用两个 p5 570 拼起来的盒子很多人都信不过。

看官方介绍,说 USP V 在性能上有很大提升,iops 达到了 350 万(USP 是 250 万),这样的数字怕是不能说明什么,毕竟是最理想情况出来的数据。而从规格列表上看,Cache 最大容量仍然只是 256GB,而且,没有特别介绍 Cache 算法有什么改进。估计总体性能和 USP 相比也仅仅是有所提升,肯定不能达到 “飞跃” 的层次。

存储能力,相对与以前的版本的确是很惊人了,最大 247PB (内部最大 332T),这倒是挺唬人的,估计也只能是用来唬人。在连通性方面也有所增强,这个在意料之中。当然,还是 Crossbar 交换式架构,这是第四代了。

软件方面新加了一些关键特性,Thin Provisioning,好像都翻译成”精简自动配置”, 面向存储虚拟化。这个功能简单的理解似乎就是能虚拟出来一个大的存储池(在实际磁盘并不足的情况下),然后对存储空间按需分配,以后用多少添加多少实际的硬盘。某种情况下能减少总体拥有成本(TCO)。这个功能 Netapp 和 EMC 的 NAS 产品应该据有的。我怀疑在高端存储上未必能有多大作为。另外, HDS 的监控软件仍然不够好,启用这样功能的用户,监控上可要费心思了。

HDS USP V 真正的支持 4GB FC ,包括各个环节。 这一点要比 EMC DMX-3 先进,DMX-3 只是部分支持。

下面这个图是 USP V 的规格列表(PDF,版权是 HDS 的):
USP_V_Spec.png

闲说 Yahoo 中国

深受网民喜爱的 Flickr 这两天被封掉了,不少网友愤怒之余,不知道是否有人产生这样的疑问:雅虎中国会不会把 Flickr 移植到国内来? Flickr 是个好产品,但想到 del.icio.us 的在国内的正宗克隆版: Yahoo! 收藏+ 的发展状况,几乎可以断言,Flickr 进入国内怕也不能有多大作为。

抛开其他的原因不谈,个人觉得雅虎中国(中国雅虎)现在的产品状况有些陷入”焦油坑”,尤其是在技术上,很难真正的施展拳脚。所作的一些产品还是依赖于美国的技术架构,尤其是底层的基础架构,举例来说,对于很多 Web 页面,用户发起的 URL 请求都必须要和美国的服务器发生 IO 交互。有这样的问题存在,无论 UE 工程师怎么在本地改进,都是无济于事的。近日有传言谷歌打算把服务器放到国内一部分,而雅虎中国可是早在 2005 年就把 2000余台服务器搬到了国内。这么久还藕断丝连,只能说已经太过于纠缠,没办法大刀阔斧的调整了。

在另一方面,域名的混乱程度我认为也导致了很多问题。域名是:yahoo.com.cn (跳转到 cn.yahoo.com , 服务大多是三级域名,相册是: gallery.i.cn.yahoo.com, 这么复杂的域名 100个人有 99 不能正确输入,四级域名的服务也有,’博客’, blog.i.cn.yahoo.com…), 搜索 yahoo.cn …… 我一直很好奇 Alexa 怎么正确统计雅虎中国的访问量 :)

雅虎最近的动作不可谓不多,比如新推出的 Omni-Search ,的确让人眼前一亮,可是看业界的反应,总有些怪怪的,对,就是不够轰动,没有神秘感。试想,如果是 Google 发布这样的产品,业界的反响会是怎样的?

对于一些除搜索外的其他老牌产品,比如电子邮件,现在越来越不够重视。我觉得电子邮件是一个很好的突破口,如果可以做到市场第一,为什么偏偏要跑到第二去呢? 电子邮件本身或许不赚钱,但是带来的相关收益可绝对不容忽视。远的不说,腾讯不也是 QQ 一个产品带活了一大片麽 ? 而现在,埋头做社区、SNS 那一套玩意儿,胜算不知几何。

BTW: Blog 首页最下方有文责声明.

EOF