作者文章: Fenng

淘宝开放平台重装上阵

淘宝开放平台( Taobao Open Platform, TOP ) ,面向第三方的开放式电子商务服务基础服务框架,重装上阵。前一段时间提前接触了一点这个项目,真是个非常有想象空间的事情。

可以肯定的是,这是”大淘宝”战略的一个重要环节。从最初的 Taobao.com 一个站点,现在是一个平台,将来再到一个更大的商业生态系统

Taobao TOP 蓝图
(上图出处)

去年下半年淘宝有过一次尝试(“淘园”项目),与上次的初步尝试截然不同的是,这次已经不再通过阿里软件这一层进行接入,从开发者使用角度上看,减少了交互环节,更加直接方便。此外,可供使用的应用程序接口愈加丰富,更贴近用户使用习惯。随着开发者社区的成熟和开发者规模的扩大,淘宝提供平台化的支持也是可以想见的事情。

对于所有的开放平台开发者来说,最关心的问题莫过于盈利模式。现在 TOP 关于盈利模式主要有两种形式:一是淘宝客佣金模式,再一个是淘宝插件分成模式。还是比较清晰的。就我个人而言,更倾向于前者的模式。也期待淘宝运营人员能够根据实际情况制定更加有利于开发者的策略,积极促进与开发者之间的互动。胜,在于人。

与其在一些 SNS 网站捣鼓那些游戏插件,还不如来开发电子商务第三方应用呢。你说呢?

以上仅为个人看法。所用信息均为公开资料。请勿跨公司抓捕 :) 

EOF

Voldemort — 分布式 key-value 存储系统

拜读了关于 LinkedIn 几位工程师写的构建 TB 级的 key-value 系统的经验:Building a terabyte-scale data cycle at LinkedIn with Hadoop and Project Voldemort。具体实现过程有大致的描述,就不鹦鹉学舌了。

linkedin_arch.png

其实现在很多公司可能都面临着这个抽象架构图中的类似问题。以 Hadoop 作为后端的计算集群,计算得出来的数据如果要反向推到前面去,用什么方式存储更为恰当? 再放到 DB 里面的话,构建索引是麻烦事;放到 Memcached 之类的 Key-Value 分布式系统中,毕竟只是在内存里,数据又容易丢。Voldemort 算是一个不错的改良方案。

值得借鉴的几点:

  • 键(Key)结构的设计,有点技巧;
  • 架构师熟知硬件结构是有用的。越大的系统越是如此。
  • 用好并行。Amdahl 定律以后出现的场合会更多。

关于 key-value 应用的解决方案又多了一种。LinkedIn 对此应用案例也还在发展中。如果业务类型类似,不妨关注一下。

EOF

大技术团队的危险性

技术团队小的时候,似乎只有人手不够才是最大的问题。而随着队伍壮大之后,管理者会最终发现除了徒增更多的沟通交流成本之外似乎并没有带来额外的生产力。

一个庞大的技术团队就好比那艘叫做 瓦沙 (refer 2) 的大船,看似将来可以横行海上,其实自身恰恰最为危险。

大野心

这是大技术团队中最容易发生的一个问题。兵强马壮,高手云集,那就造一艘大船!逐一制定看似切合实际而实际超出团队能力的目标,要做就做大的,颠覆性的、革命性的、划时代的….项目,而对小项目根本不屑于一顾。历史给我们的经验教训是,凡是过于庞大的东西迟早要毁灭

对于大项目,我最喜欢讲的一个故事是”大山临盆”:

大山临盆,天为之崩,地为之裂,日月星辰,为之无光,
房屋倒塌,烟尘滚滚,天下生灵,死伤无数
--最后生下一只耗子

大一统

团队一大,管理者喜欢制定一些条条框框的东西,”规范化”是一把双刃剑,这事情本身没错,但不可采取”拿来主义”照搬别人的做法,也别听一些厂家的蛊惑而购买”停不下来的红舞鞋”。切记不可抹杀团队成员个性,不要降低团队成员生产力,不能以浪费团队成员激情为代价。不然的话,大团队也必然暮气沉沉。团队成员能动性发挥不出来,再加多少人力也于事无补,只能陷入焦油坑,越挣扎越难摆脱困境。

乱想录@BetaCafe

EOF

《Apache源代码全景分析》

上半年好像我写了不少推荐序。《Apache源代码全景分析第1卷》已经面市一段时间了。读过这本书的电子稿,先睹为快之后写下推荐序。


如果说没有 Apache 就没有 Internet 可能有些夸张,但至少可以说没有 Apache ,互联网不会发展这么快。根据互联网研究公司 NetCraft 的统计,多年来 Apache 一直是稳居 Web 服务器市场头把交椅,至今仍占据超过 50% 的市场份额。就整个互联网来说,Apache 仍然是最重要的软件之一。

Apache_Source_Code.jpg

尽管近几年来涌现出不少以”高性能”为卖点的新的 Web 服务器软件,比如 LighttpdNginx 等,吸引了不少用户注意力,不过 Apache 因其功能广泛,有些仍具有不可替代性,在技术领域仍然是 Web 服务器风向标。话说回来,”重剑无锋,大巧不工”,有的时候软件性能表现不佳,更多原因可能是对其了解不够、使用不当造成,并非软件自身有多大缺陷。 对 Apache 来说,更是如此。所以,通过分析源代码了解 Apache 软件架构体系,熟知其本质,方能更有效的使用 Apache Web 服务器,从而发挥出最大效能。为网站节省资源,为企业节省资金,也能为用户提供更好的访问体验,好处多多。

此外,随着互联网业务的复杂化,很多网站使用 Apache 的过程中也遇到了新的挑战,常常要在业务的驱动下对 Apache 进行扩展性的开发(例如扩展日志模块以便于更复杂的日志统计)。这个时候,源代码分析是绕不过去的一件事儿,尽管源代码获取是轻而易举之事,但 Apache 代码毕竟凝聚了开源软件界的群体智慧,要想高效分析却是并非易事,相信这本书能让有此需求的读者少走弯路,剥丝抽茧,获得更多启发与借鉴。

说起源代码分析,其实几年前市面上出现过一些此类话题的图书,不过基本上是印上大段源代码加上几句注释了事,读者可能会有吃到注水猪肉的感觉。而本书的读者对这一点大可放心,书中代码只是点到即止,相对环保多了。

后记:此书编辑够用心的,这里这个案例可见一斑。

EOF