Tag Archives: Yupoo

对 Pinterest 类应用的一点思考

最近一段时间 Pinterest 类应用相当火爆,引发了不少讨论。我自己最近也一直在使用花瓣 ,也在捉摸为什么这一类应用这么有魔力。知乎上有个问题是: Pinterest 好在哪里?,尝试做了一下回答,也稍作整理,发在这里做个记录,会随着理解再做进一步修改。

本质上,Pinterest 类应用属于社会化书签站点的延续,只是要处理的数据对象变成了「图片」,而不是传统社会化书签的URL。这是社会化信息处理的一次改良。

提到社会化书签,不得不提 Del.icio.us ,不过或许 Del.icio.us 模式已经到头了,即使现在从Yahoo! 手里卖给了陈士骏,也不太可能玩出新花样,因为核心的数据对象没变。

相比 Flickr 来说,Pinterest 主要的生成内容动作是 Pin (花瓣叫采集),而 Flickr 则是 Upload,这个动作上的不同导致 Flickr 向左,Pinterest向右。Flickr 重心是「照片」(Picture),尤其是原创照片,而非图片(Image)。 Flickr的一个弊端是大量的图片没有标题,这意味着元数据的先天不足,不太可能和其他网络内容进一步结合起来。但是也要说一下,Flickr 现在的价值是被低估了。

Pinterest 相对 Flickr 来说,恰恰是一种互补,每张图片基本可以关联到一条URL,进一步可以抽取其他信息。

从用户行为的角度上看,满足了用户天生的「收集癖」,很多人都有看到一张照片想顺手存起来的冲动,没有Pinterest这类产品之前,这个交互操作太费事了… Pinterest 无疑弥补了人的这个原始的需求。

Pinterest 类应用的创新之处我认为是「降低了收集信息的门槛」,或者,至少做到了这一点。其价值是不言而喻的,每一次信息处理的门槛降低都会得到商业价值的变现,你可以不信。

要有足够好的技术团队支撑、足够好的数据处理能力才能走到最后,这也是在国内众多产品中我看好花瓣(huaban.com)的主要理由。

EOF

2009年国内值得关注的初创公司

受邀做2009中文互联网开放式评选(ChinaMode)的观察员,在评审候选网站的时候,我发现,在过去的一年中,或许是经济危机的影响,国内互联网方面的 Startup 并不多。这里回顾一下个人认为值得关注的几个初创公司。

VMKid – 手机虚拟机与无线互联网技术平台

年底的时候,猛犸科技( VMkid.com ) 在杭州 BetaCafe 举办了产品发布会,演示了他们令人心动的手机虚拟机技术以及无线互联网平台解决方案。这是一家颇为神秘的初创公司,甚至官方站点到现在还没有正式对外开放,不过已经得到了阿里集团旗下子公司淘宝的大力支持。创建人在硅谷爬摸滚打了多年,对技术趋势的把握非同一般。相信在 2010 年,这家公司会在业界有不小的动作。

Updated:该公司已经被阿里巴巴收购。

Yupoo — 图片托管解决方案提供商

又拍(Yupoo.com) 虽说是在几年前创建的,不过在 2009 年开始了二次创业。创始团队在 2008 年底被迫离开,到了 2009 年末颇有戏剧性的取回了控制权,宣布再度归来。随后的 Yupoo 进行了一系列的调整,无论是个人摄影爱好者还是电子商务网店用户,都有对应的图片解决方案。年底的时候 51.com 悄然对封锁了图片外链,给不少网店用户带来了恐慌,相信会给第三方图片托管一个很好的发展契机。国内需要有个第三方图片托管服务,期待 Yupoo 接下来会大展拳脚。

DNSPod – 智能DNS解析服务提供商

因为 2009 年 6 月份暴风影音域名解析引起的大规模断网事件让 DNSPod 引起了很多人的关注,也让更多人知道了站长吴洪声,不到半年的筹备后,DNSPod 已经进行了正规的商业运作。依托 DNS 的服务国外有大家颇为熟知的 OpenDNS,而 Google Public DNS 的发布无疑也给了 DNSPod 足够的信心。考虑到国内独特的互联网环境,DNSPod 自然不愁客户。

射手影音播放器 — 一站式多媒体播放工具

射手影音播放器是射手网站长发起的项目,到现在或许还没有进行商业运作,不过谁说一定要商业运作呢? 说起播放器,在国内客户端工具竞争到白热化的今天能做到创新是不容易的,但是射手播放器仍有独到之秘。且不说绿色无广告,依托射手网的字幕资源的”智能下载匹配字幕”功能让用户再也不用担心找不到精确的字幕。这也是 2009 年我唯一新安装的一个桌面客户端工具。

监控宝– 网站性能监控的在线服务

监控宝提供第三方网站运维服务,主要针对网站性能、服务器状态的监控。对于大网站来说,绝大多数都会自荐监控系统。监控宝则有点像服务于初创公司的初创公司,很多还在起步中的网站要么没任何监控服务,要么自己费力做的监控成本太高,这个服务的出现倒是弥补了市场上在这方面的空缺。

在新的一年,在新的互联网形势下,相信创业会更加艰难,不过,寒冬过去才是春天。想到这些,才有希望。

EOF

有感于 Yupoo! 被亮”黄牌”

看到 Yupoo!亮“黄牌”。Yupoo!的兄弟们估计也哭笑不得,算是被免费公关了一回。

在国内办个网站真不容易,只要是用户产生内容的,基本上都要额外的耗费很多精力去和那些人打交道,有个风吹草动的就可能被请去”喝茶”。我总觉得,在国内 Web 2.0 的创业其实比国外要难多了。第一个横在眼前的问题就是电信网通之间的鸿沟,要多追加不少投资,才能针对不同地域的用户提供一致的用户体验。第二个难题就是必须要和相关监管部门打交道,不得不花费不少心思。很多技术创业型的公司在这一块经常要吃亏。

当然,既然选择加入这个游戏,基本的游戏规则还是应该遵守的,如果纵容用户恶意利用资源,很容易就会弄出来”破窗效应“。所以,在运营上绝对不能短视,利用一些突发事件的噱头是能引来短期流量,但是无疑会改变网站的长期形象。在这方面 Yupoo! 一直挺有操守的,只是 “每天网友上传约10万张照片” ,要想 “先审后发” 的确难上加难。还没有听说在这个方面有什么”技术类”的解决方案。这是 Yupoo!的困境,怕也是很多类似网站需要面对的一个问题。

顺便说一下,“每天网友上传约10万张照片”,按照这样的计算一月 300 万张。加上不同的格式,可真的需要海量的存储空间啊。

EOF

Yupoo! 的网站技术架构

又有机会爆料国内 Web 2.0 网站的架构了。这次是 Yupoo! 。非正式的采访了一下 Yupoo!(又拍网) 的创建人之一的 阿华(沈志华)同学,了解了一些小道消息。

作为国内最大的图片服务提供商之一,Yupoo! 的 Alexa 排名大约在 5300 左右。同时收集到的一些数据如下:

带宽:4000M/S (参考)
服务器数量:60 台左右
Web服务器:Lighttpd, Apache, nginx
应用服务器:Tomcat
其他:Python, Java, MogileFS 、ImageMagick 等

首先看一下网站的架构图:

Yupoo_Arch.jpg

该架构图给出了很好的概览(点击可以查看在 Yupoo! 上的大图和原图,请注意该图版权信息)。

关于 Squid 与 Tomcat

Squid 与 Tomcat 似乎在 Web 2.0 站点的架构中较少看到。我首先是对 Squid 有点疑问,对此阿华的解释是”目前暂时还没找到效率比 Squid 高的缓存系统,原来命中率的确很差,后来在 Squid 前又装了层 Lighttpd, 基于 url 做 hash, 同一个图片始终会到同一台 squid 去,所以命中率彻底提高了”

对于应用服务器层的 Tomcat,现在 Yupoo! 技术人员也在逐渐用其他轻量级的东西替代,而 YPWS/YPFS 现在已经用 Python 进行开发了。

名次解释:

  • YPWS–Yupoo Web Server YPWS 是用 Python开发的一个小型 Web 服务器,提供基本的 Web 服务外,可以增加针对用户、图片、外链网站显示的逻辑判断,可以安装于任何有空闲资源的服务器中,遇到性能瓶颈时方便横向扩展。
  • YPFS–Yupoo File System 与 YPWS 类似,YPFS 也是基于这个 Web 服务器上开发的图片上传服务器。

【Updated: 有网友留言质疑 Python 的效率,Yupoo 老大刘平阳在 del.icio.us 上写到 “YPWS用Python自己写的,每台机器每秒可以处理294个请求, 现在压力几乎都在10%以下”】

图片处理层

接下来的 Image Process Server 负责处理用户上传的图片。使用的软件包也是 ImageMagick,在上次存储升级的同时,对于锐化的比率也调整过了(我个人感觉,效果的确好了很多)。”Magickd“ 是图像处理的一个远程接口服务,可以安装在任何有空闲 CPU资源的机器上,类似 Memcached的服务方式。

我们知道 Flickr 的缩略图功能原来是用 ImageMagick 软件包的,后来被雅虎收购后出于版权原因而不用了(?);EXIF 与 IPTC Flicke 是用 Perl 抽取的,我是非常建议 Yupoo! 针对 EXIF 做些文章,这也是潜在产生受益的一个重点。

图片存储层

原来 Yupoo! 的存储采用了磁盘阵列柜,基于 NFS 方式的,随着数据量的增大,”Yupoo! 开发部从07年6月份就开始着手研究一套大容量的、能满足 Yupoo! 今后发展需要的、安全可靠的存储系统“,看来 Yupoo! 系统比较有信心,也是满怀期待的,毕竟这要支撑以 TB 计算的海量图片的存储和管理。我们知道,一张图片除了原图外,还有不同尺寸的,这些图片统一存储在 MogileFS 中。

对于其他部分,常见的 Web 2.0 网站必须软件都能看到,如 MySQL、Memcached 、Lighttpd 等。Yupoo! 一方面采用不少相对比较成熟的开源软件,一方面也在自行开发定制适合自己的架构组件。这也是一个 Web 2.0 公司所必需要走的一个途径。

非常感谢一下 Yupoo! 阿华对于技术信息的分享,技术是共通的。下一个能爆料是哪家?

EOF