分类归档: Review

世说新语: 中产阶级

等级界限森然,身分壁垒如山,权能使鬼推磨,势可令人成仙
–同事 Jametong 的 MSN 签名。这句话第一次在秦晖的文章《中国能否走出“尺蠖效应”的怪圈?》中看到

PayPal与谷歌的最大不同在于:谷歌希望招聘博士,而PayPal则希望招聘那些读到博士又放弃的人。这是两种完全不同的气质。
–曾经担任 PayPal 首席财务官的罗勒夫·巴萨(Roelof Botha)说

你是否不敢结婚,或不打算生儿育女? 孩子未来的教育费用是否让你忧心忡忡? 如果有任何一个答案为“是”,你就不算中产!
–这是日本人大前研一给出的中产标准

一个人的个人魅力大小取决于另一批无知者数量的多少
–带三个表《三个记录片》

该软件(瑞星2008防火墙)对网络的干扰和破坏力甚至大于很多计算机病毒
–吉林大学网络中心发布的重要通知(来源)

继续阅读

GFW 三定律

翻看以前的 Twitter 记录,把这三句话检了出来:

GFW 第一定律:只要是 “用户产生内容”(User-generated content, UGC) 的国外网站都会被和谐。

GFW 第二定律:只要是被和谐的网站,国内一定会至少有一个克隆版。

GFW 第三定律:没有被和谐的网站一定不是同类竞争者中最出色的。

今天是几个月来非常郁闷的一天。是以为记。
EOF

此文作者:, 位于 Review 分类 标签: , on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

Tailrank 网站架构

tailrank_logo.jpg

每天数以千万计的 Blog 内容中,实时的热点是什么? Tailrank 这个 Web 2.0 Startup 致力于回答这个问题。

专门爆料网站架构的 Todd HoffKevin Burton 进行了采访。于是我们能了解一下 Tailrank 架构的一些信息。每小时索引 2400 万的 Blog 与 Feed,内容处理能力为 160-200Mbps,IO 写入大约在10-15MBps。每个月要处理 52T 之多的原始数据。Tailrank 所用的爬虫现在已经成为一个独立产品:spinn3r

服务器硬件

目前大约 15 台服务器,CPU 是 64 位的 Opteron。每台主机上挂两个 SATA 盘,做 RAID 0。据我所知,国内很多 Web 2.0 公司也用的是类似的方式,SATA 盘容量达,低廉价格,堪称不二之选。操作系统用的是 Debian Linux 。Web 服务器用 Apache 2.0,Squid 做反向代理服务器。

数据库

Tailrank 用 MySQL 数据库,联邦数据库形式。存储引擎用 InnoDB, 数据量 500GB。Kevin Burton 也指出了 MySQL 5 在修了一些 多核模式下互斥锁的问题(This Bug?)。到数据库的JDBC 驱动连接池用 lbpool 做负载均衡。MySQL Slave 或者 Master的复制用 MySQLSlaveSync 来轻松完成。不过即使这样,还要花费 20% 的时间来折腾 DB。

其他开放的软件

任何一套系统都离不开合适的 Profiling 工具,Tailrank 也不利外,针对 Java 程序的 Benchmark 用 Benchmark4j。Log 工具用 Log5j(不是 Log4j)。Tailrank 所用的大部分工具都是开放的。

Tailrank 的一个比较大的竞争对手是 Techmeme,虽然二者暂时看面向内容的侧重点有所不同。其实,最大的对手还是自己,当需要挖掘的信息量越来越大,如果精准并及时的呈现给用户内容的成本会越来越高。从现在来看,Tailrank 离预期目标还差的很远。期待罗马早日建成。

EOF

此文作者:, 位于 Review 分类 标签: , on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

Google Matrix

这则小道消息不知道为什么 GSeeker 没报道:GigaOM 消息说, Google 在自行研造万兆交换机。

Google 自造交换机还是有必要的,2006 年估计五大互联网巨头在网络硬件上支付了 50 亿美元,而 在 GigaOM 的那篇文中说 Google 每个月要消耗 5000 个网络端口,这么看来,自行研制将会节省大量费用。

Google 什么时候弄个 Matrix 出来呢?

EOF

此文作者:, 位于 Review 分类 标签: on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.