分类归档: Review

谈谈阿里系的技术积累

喧嚣的双 11 促销活动已经结束,淘宝、天猫、支付宝等阿里旗下的网站在当天爆发出惊人的能量,让人瞠目结舌:全天总交易额达到 191 亿,其中天猫132 亿,淘宝 59 亿,支付宝日订单数量超过一亿笔。金额已经超过美国去年”网购星期一”最高纪录,当然也超过今年的黑色星期五的 10.42 亿美元。尽管大淘宝在促销开始的时候服务稍有不稳定,但整天下来服务堪称可靠。这是个值得称赞的成就。 从另一个角度看数据,峰值数据是每分钟 89678 笔交易,峰值时刻一分钟超过 1700 万人民币的交易额,对比之下,eBay 披露的数据是每秒钟 2500 美元(峰值或许会更高一些)。但经此一战,可以说,阿里系在电商领域上的技术积累的确是全球独步了。

阿里系能达到今日的技术积累,绝非一朝一夕之功,依笔者个人的看法,以下几个先决条件素不能不提:

第一,支付宝、淘宝团队在大规模分布式事务(Transaction) 处理能力上多年来的技术积累,这份经验相当宝贵;

第二,在 2009 年,阿里巴巴骨干传输网 ABTN (Alibaba Backbone Transmission Network) 的建成为整个阿里系子公司的网络服务能力提供了网络基础保障,这也是国内第一家运营商级别的电子商务骨干网;

第三,以开源领域技术专家,LVS 项目创建人章文嵩先生加盟淘宝为标志,淘宝在底层基础设施上的技术能力大幅提升,章带领的基础核心软件研发团队基于 LVS 实现高性能负载均衡组件,构建了强大而且高效的 CDN 系统,CDN 系统大量采用低功耗服务器( GreenCompute.org ),绿色节能;

第四,硬件带来的红利。固态硬盘(SSD) 与 PCI-E Flash 等硬件组件技术已经足够成熟并被大规模应用,为数据库服务器处理能力提供了硬件层面上的支撑能力,可以更加灵活部署,成本更低,不必再像过去那样单纯依赖于小型机与高端存储的支撑。

第五, 在 2008 与 2009 年大刀阔斧的系统结构改进,比如外界所知道支付宝的 SOA 化,淘宝五彩石项目等,最近两三年仍然在做精细化的提升,但是总结架构没有太大的变动。

第六,淘宝技术团队对运维能力的掌控与技术积累(为防止阿里云掠美,必须要说一下此事与阿里云无关,各自是独立的团队) ,具备相当灵活的分配调度硬件以及网络资源的能力。或许有人会指摘限流的问题,要知道,对系统限流的能力也是技术实力的体现,以前的几次大促活动中某银行网管因为对流量控制措施不当,直接导致核心设施不可用,造成了非常大的负面影响。

在 2010 年与 2011 年的两次双 11 促销活动中,技术团队积累了足够的运维与运营经验,能够有针对性的进行全面准备,而且,通过过去几次”压力测试”,也促使国内银行系统对于网银网关处理能力进行了扩容与改造,否则,按照今天的交易量,各家银行网关也无法承载如此大的支付请求的冲击。

阿里技术团队这几年来,在开源软件研发上进行了很大的技术投入,比如在 MySQL 数据库研发与部署实践上,已经能够有实力解除对 Oracle 数据库的依赖,而本次活动中,最核心的MySQL集群一天共支持了 20 亿个事务,MySQL 核心数据库顶住了每秒钟 10 万次事务、百万次 SQL 执行(不过支付宝最核心的数据库依旧是在 Oracle 数据库 上,淘宝天猫的核心库已经在 MySQL 上)的压力;在 Java 核心技术上的技术投入,针对业务特点优化定制的 JVM (TaobaoJVM) 已经在淘宝、天猫等网站上线,全部替换了 Oracle(Sun) 官方 JVM 版本,成果显著,并已经逐步反馈到开源社区中去;再比如淘宝在 Nginx 基础上改进的 Web 服务器 Tengine … 此外,淘宝根据电子商务业务自行研发的各种关键组件,比如流控与防攻击模块等,也对这次成功大促起到了很好的保障作用。技术团队在开源软件领域的投入取得了惊人的回报,现在来看,此乃相当有前瞻性的举措,值得肯定。阿里技术团队正在试图掌控整个网站体系中的所有组件的核心技术,这将是一个趋势。

最后,技术的背后,最关键的还是人和团队。阿里巴巴数年来在电子商务技术领域领域吸引了不少业界技术专家,如王文彬,章文嵩等,造就了一批顶尖技术牛人,也培养并且储备了一大批技术人才,锻炼了一个有实战经验有战斗力的技术团队。正是这一批踏实肯干的技术人使得这一切成为可能。

后记:或许有人说这是在神话或者神化淘宝技术团队,应该说,以上只是客观事实。国内想跟淘宝同台竞技的团队,更应该反思一下到底差距在哪里,哪些地方可以借鉴并且少走一点弯路。

延伸阅读: 纽约时报:12306 该向淘宝学什么?.

EOF

此文已经刊发于《创业家》杂志 2013. 1 月刊.

此文位于 Review on by .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

再见, IE 6

两年前,我写过从国内 IE 6 的市场份额说开去,抱怨了一下,一切皆有可能,现在中国大陆 IE 6 市场份额终于大幅度降下来了,年底有可能降到 20% 以下。 无论如何,对前端工程师来说,这是一大好消息。

IE6.png
(refer)

这张图体现的其实是中国互联网跟世界的某种差距吧。遗憾的是,业内媒体似乎对这些都不太关心。

这次,360 的确做了一件好事。不管动机是什么,起码这个结果是好的。很久以前我说过一句玩笑话「内容审查、GFW、带宽差费用高、IE 6 已经成为制约中国互联网进一步发展的四大障碍」,现在 IE 6 的制约即将消除,接下来会是什么呢?

我不知道。你说呢?

EOF

此文作者:, 位于 Review 分类 标签: , on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

微信公众平台: 对话即服务 对话即搜索

微信公众平台堪称是本年度国内互联网产品领域国内最大的创新,有朋友问我怎么看微信公众平台,我其实没怎么「看」 ,因为我一直在尝试学习利用微信公众平台,在做运营上的实践。我个人运营了公众帐号「小道消息」,微信号: WebNotes ,基本上是每天一篇文章,和朋友们交流一下我的一些观点;丁香园团队前一段时间也利用微信的开放消息接口做了「用药助手」的即时信息查询的功能,目前来看还只是具备一定的功能,改进的地方还有许多。

小道消息二维码

如果非要我说微信公众平台是怎么回事,那么可能一句话就够了「对话即服务 对话即搜索

对话即服务 这里说的「对话」,是指用户和微信公众帐户的交互。对话即服务,或许是微信公众平台的初衷。通过公众平台帐户让第三方服务直接在这里完成,Web 端和移动端有效的结合起来。最常见的是客服服务,微信公众平台本身就是个绝佳的客服反馈系统,用户遇到问题,发个消息过来,服务人员在 Web 后台看到,立刻可以跟进处理,信息是异步的,直达的,经济而有效。随着公众帐户越来越多,可以看到能够完成的第三方服务正在增加。

从信息的到达率上来看,微信公众帐户群发到每个真实的用户,因为基本上可以认为每个微信使用者是活生生的人,而不是一个匿名的网络身份. 到达率和用户群细分远比 App Push 精准. 从 Email 到 SMS 到 App Push,再到微信,信息到达的成本越来越低。

对话即搜索 什么叫「对话即搜索」呢? 举个例子来说,你关注了「用药助手」,然后发送「药品 阿司匹林」过去,用药助手给你返回的消息就是关于阿司匹林的药品说明,这就是一个搜索服务,同样,对于「大众点评」和「微信路况」这样的公众帐户来说,用户发送当前的地理位置过去,返回的消息则是周边的饮食和路况信息,这已经是不折不扣的搜索服务了。我相信腾讯自己的搜索用不了多久即可进入,或许这帮家伙还没意识到,不用离开当前应用即可完成搜索服务,这是以前所有非搜索类 App 无法完成的问题。

从这个角度来说,微信一定会蚕食搜索引擎的市场。如果搜索引擎愿意接入微信,那是另外一回事了。

搜索本质上也是服务。天气、旅游、电子商务购物、股票… 皆可扩展。

微信的一些弱点:信息的「纵深」远远不如微博。相比微博而言,多数都是一些信息;信息缺乏可挖掘的能力,比如,天然的无法搜索内容,甚至自己在朋友圈分享的信息都无法搜索,无法回溯。微信公众平台后台数据目前还无法进行量化分析,这个或许是时间问题,相信微信团队能够解决。另外,微信公众平台的数据,可查询性还不够,有必要增加数据查询服务。

有人问,在微信上创业怎么样? 微信是个平台,是个媒介,通过这个去做你做的事情,如果能给用户带来价值,为什么不可以? 前景如何? 但做好事,莫问前程。当你为这些事情纠结的时候有人已经赚的盆满钵满了。

有些人绝对高估了微信,但也有另一些人低估了微信。 「对话即服务 对话即搜索」,请记住这句话。

EOF

技术含量的问题

你一定听过那个小工识别生产线上的空肥皂盒的故事。

让我简明扼要的将这个故事复述一遍:某大型日化公司引入了一条国外肥皂生产线,这条生产线将肥皂从原材料加入直到包装箱自动完成。不过产品线有瑕疵,个别肥皂盒是空的,这家公司联系厂商后被告知这是设计上的缺陷,无法避免。于是老板要求工程师们解决这个问题,以数名博士为核心形成一个技术攻关团队,耗费大笔资金之后,终于宣告解决。解决的办法是在生产线上安装一套 X 光机进行扫描识别。在另一家私人企业,老板让新来的小工解决问题,小工所用的办法是,找来一台电风扇放在生产线旁边…不知道这个故事是编造出来的还是真的发生过。

在现实中,类似的没有技术含量的解决方案,但是又奏效的确实很多。

国内某个厂商曾经发布过一款日常安排的移动 App , 这个产品的独到之处是能够把语言转化为日程,准确率相当高,曾经一度令人惊讶,不过后来有人证实其真正的做法是:远端用人接听这些语音,然后手工输入进去。所以,准确率不成问题。最起码要超过苹果的 Siri 系统。

又比如某个商务社交应用的名片识别应用,也曾经有网友证实产品发布的初期时候技术还达不到要求,所以有的时候后台是用人工识别。这个产品在初期果然赢得了不少用户的信赖。

再比如验证码(CAPTCHA), 每个上网的人都见过这个东西,我们知道世界上有一些计算机科学家在研究验证码的自动破解工作,而且,屡屡传出各种新进展。不过,我们也不要忘了,世界上还有一个第三世界国家的网民热衷从事的工作叫做「打码」,人工识别各种验证字,效率也很好。据说,为了提升协作效率,有些专门打码的网站已经对外提供程序接口了,要说没有技术含量,他们肯定不承认。

这些有点遥远的例子说完之后,我要说一下我的一位朋友亲口对我说的经历。这位朋友的创业项目是做个电商导购网站,本来想找几个人在算法上下功夫,做商品「智能」推荐后来算了一本帐,成本上抗不住,因为这样的技术人才工资都不低,而且,还要投入一定的服务器,一定时间后才能看到效果。他的解决办法简单直接:找 5 个编辑人员,直接用人工推荐,人力成本极低;效果?当然直接超过了「人工智能」。我问他一旦数据量大了怎么办?他的回答很简单,人的效率还能提升。比算法提升的幅度还大。

这是个复杂的世界。技术含量当然重要,但有的时候在低成本下有效解决问题更重要。

敬请注意: 本文已经发布在《创业家》杂志.

EOF

此文作者:, 位于 Review 分类 标签: on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.