Monthly Archives: November 2007

Tailrank 网站架构

tailrank_logo.jpg

每天数以千万计的 Blog 内容中,实时的热点是什么? Tailrank 这个 Web 2.0 Startup 致力于回答这个问题。

专门爆料网站架构的 Todd HoffKevin Burton 进行了采访。于是我们能了解一下 Tailrank 架构的一些信息。每小时索引 2400 万的 Blog 与 Feed,内容处理能力为 160-200Mbps,IO 写入大约在10-15MBps。每个月要处理 52T 之多的原始数据。Tailrank 所用的爬虫现在已经成为一个独立产品:spinn3r

服务器硬件

目前大约 15 台服务器,CPU 是 64 位的 Opteron。每台主机上挂两个 SATA 盘,做 RAID 0。据我所知,国内很多 Web 2.0 公司也用的是类似的方式,SATA 盘容量达,低廉价格,堪称不二之选。操作系统用的是 Debian Linux 。Web 服务器用 Apache 2.0,Squid 做反向代理服务器。

数据库

Tailrank 用 MySQL 数据库,联邦数据库形式。存储引擎用 InnoDB, 数据量 500GB。Kevin Burton 也指出了 MySQL 5 在修了一些 多核模式下互斥锁的问题(This Bug?)。到数据库的JDBC 驱动连接池用 lbpool 做负载均衡。MySQL Slave 或者 Master的复制用 MySQLSlaveSync 来轻松完成。不过即使这样,还要花费 20% 的时间来折腾 DB。

其他开放的软件

任何一套系统都离不开合适的 Profiling 工具,Tailrank 也不利外,针对 Java 程序的 Benchmark 用 Benchmark4j。Log 工具用 Log5j(不是 Log4j)。Tailrank 所用的大部分工具都是开放的。

Tailrank 的一个比较大的竞争对手是 Techmeme,虽然二者暂时看面向内容的侧重点有所不同。其实,最大的对手还是自己,当需要挖掘的信息量越来越大,如果精准并及时的呈现给用户内容的成本会越来越高。从现在来看,Tailrank 离预期目标还差的很远。期待罗马早日建成。

EOF

此文作者:, 位于 Review 分类 标签: , on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

Google Matrix

这则小道消息不知道为什么 GSeeker 没报道:GigaOM 消息说, Google 在自行研造万兆交换机。

Google 自造交换机还是有必要的,2006 年估计五大互联网巨头在网络硬件上支付了 50 亿美元,而 在 GigaOM 的那篇文中说 Google 每个月要消耗 5000 个网络端口,这么看来,自行研制将会节省大量费用。

Google 什么时候弄个 Matrix 出来呢?

EOF

此文作者:, 位于 Review 分类 标签: on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

iWoz 与 IJobs

iWoz.jpgSteve Wozniak 的自传名为 iWoz: Computer Geek to Cult Icon ,这个小写的 i 蛮符合苹果近年来的产品命名习惯。IJobs ,这个大写的 I 倒也比较符合一切以自我为中心的那个被神话的商业偶像 Steven Jobs。

Jobs 没有为 iWoz 这本书做序,看完这本书你会明白当然不是因为 Jobs 「太忙了」(你会想象郭敬明给庄羽的新书写序麽?) Jobs 获得了苹果的大部分荣耀(虽然 Woz 并不在乎),到今天怕是还有很多人认为是「他和沃兹」一起发明的 Apple I。老罗的那篇《关于苹果的老总》只是说了真话而已,从那个「设计电子游戏的活儿」的报酬的故事来看,老罗应该是看过 iWoz 这本书的。

整本书你不会找到沃兹对 Jobs 的一句坏话。但是沃兹对「苹果 III」的厌恶以及对「苹果 II」的喜爱足以说明一切。虽然沃兹说「苹果III」的失败的原因在于那是一个市场部门开发的产品,而不是工程师开发出来的产品,言犹未尽。我好奇的查了一下维基百科,有这样一段话:「Apple III的设计师被迫遵循乔布斯的极高和有时不切实际的要求,据说乔布斯觉得散热扇不雅致因而被省略了,结果导致电脑容易过热,这迫使最早期的型号被回收。」

Jobs 曾经一毛不拔,Woz 则一贯乐施好善; 乔布斯足够伟大,但并不是神; Woz 头上没有 Jobs 那样耀眼的光环,而他才是仙!

(很多人非常推崇的 Jobs 在斯坦福大学毕业典礼的讲座,视之为经典,我跑到 YouTube 上看了看,Jobs 拿着稿子念来念去的感觉不到怎么牛,还不能证实那些话是不是都是他自己写的呢)

「你可以告诉记者或者政治家任何事情,他们都将深信不疑」, 你可以告诉崇拜者任何话,他们都将深信不疑。在自传中沃兹澄清了一些事实:

关于 iPod 、iMac ,在 Jobs 返回苹果之前就已经在研发,而且主要设计师是乔纳森·艾维, 只是 Jobs 的重返苹果容易让人产生「他一回来,这么牛的产品就有了」的错觉–谁知道是不是 Jobs 故意为之呢?

苹果不是「车库创业」的公司,更为准确的说是「宿舍创业」的公司, 沃兹强调了这一点。

沃兹掏钱举办的是 US Festival 音乐节,而不是 WoodStock(这可能只是自己长久以来的错误记忆),真正的一掷千金(千万美金)。

顺便说一下,这本书的中文版副标题为「一段硅谷和苹果的悲情罗曼史」,恶俗到家,而且和原书的主旨南辕北辙。沃兹有必要「悲情」麽? 一个视金钱如粪土的人有必要悲情麽? 一个一心要给五年级孩子做电脑课教师的 IT 英雄有必要悲情麽?

EOF

Paypal 黑帮形成的条件

国内媒体还是很快的,关于 Paypal 黑帮 的话题现在已经遍布各个新闻站点了,虽然对照该文英文版来看,中文版本漏掉了不少信息。

为什么会形成 “Paypal 黑帮”? 公认的一个原因应该是那是在美国硅谷,而不是中国的中关村。要有那样的土壤才会产生那样的生命。

中文版的翻译者自做主张的加上了个章节叫做“为何成为创业者摇篮”,可是读完了那一段发现并没有解决这个问题。没错,Thiel 和 Levchin 只招聘跟他们一路的人,用 Web 2.0 行话来说,就是他们只用自己的 “SNS” 圈子的人,这样的确会让这个团伙彼此产生深厚的友谊。缺钱? 缺人脉? 创建新公司的最主要的两个问题在这个圈里不是问题。

为什么会形成 “Paypal 黑帮” ? 我认为最主要的还是 Thiel 的开放性管理风格下的公司管理信息开放使得这些家伙都”学会”了如何成为企业家。Thiel 把“客户记录、营收流、欺诈损失、以及资本支出等方面的数据” 公之于每个员工,耳濡目染大家也能学会公司运转是怎么回事了吧? 换了另一家公司能做到麽? 比如那个被神化的 Google 能做到这样麽?

若干年后或许就像曾经的 Palo Alto 研究中心那样,人们在感叹那些商业 Geek 的时候也会想起 Paypal。

EOF

此文作者:, 位于 Review 分类 标签: , on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.