北京, 北京 798工厂

周日,京城各大衙门都不办公。计划好了要带着 Laura 去 798 工厂看看,假装一次小资。外面阳光充足,也非常适合出行。

798 里面,慕名而来的老外、艺术青年、有钱有闲小资一如既往的多。沾了奥运的霉气,798 厂区内的道路都被挖开了,偶尔一股小风吹过,尘土满脸。我以前倒是一个人逛过,这次来基本还是找不到北,新展览层出不穷,个人觉得比较经典的几个场景都看不到了。

从进门开始就看到《占卜者之屋:黄永砯回顾展》的广告牌子,这是唯一的一个收门票的展览,收门票没啥,关键是里面的东西真的没什么意思。那些东西展示”文化撞击”的东西估计老外看了还有兴趣。

看了黄永砯,没劲,顺便对尤伦斯当代艺术中心也比较反感。基本上看不到原来厂房的模样了,有些类似于原木凳子刷了油漆的感觉。

有体育迷么(准确一点说是乔丹迷)?“铸造传奇” 迈克尔·乔丹展览 绝对值得一看,我和 Laura 对乔丹这尊神的确不太感兴趣,也还是进去看了一圈儿。

比较可惜的是没看到吴冠中的新作展

附:几张照片(大部分都是 Laura 拍的,个别图片俺提供一点创意。还没 PS,光线似乎有问题,拍照这事儿我不懂):
798 内的一家三口
IMG_5964
IMG_5841
IMG_5935
EOF

北京, 北京

周六下午到的北京。一出机场,顿时感觉北京真是和杭州不一样,天灰蒙蒙的,相比之下,杭州的天空算得上”蓝天”了。与几年前相比,交通还是那个老样子。12 点的飞机,大约 4 点半才赶到预定的汉庭安顿下来。晕机,加上稍微有点冷,一趟下就睡了两个多小时。

起来,网上搜索了一下附近的饭店,在北京工作的时候,有次租房子就在这附近,所以感觉相对比较熟悉(除去那些新拔地而起的高楼)。虽然海底捞据说不错,不过不能多吃火锅了,最后折衷一下,去权金城吃烤肉。回到北京,顿时感觉比南方豪放多了,菜谱都 1 米来长,翻着都有些费劲儿。值得一说的是,点了个”老虎菜”,好几年没吃到这个东北常见菜了。

汉庭的服务应该说是不错的,最大的毛病和如家是一样的–隐私性差很多。走廊有人路过听的清清楚楚,说话都不太敢大声…从 80-20 的原则出发考虑,门的因素很关键。如果装修上能稍微用一点隔音效果更好点的材料,估计就能起到很好的效果。想想这个价位,咱就别挑毛病,知足吧…

EOF

闲谈 Web 图片服务器

现在很多中小网站(尤其是 Web 2.0 站点) 都允许用户上传图片,如果前期没有很好的规划,那么随着图片文件的增多,无论是管理还是性能上都带来很多问题。就自己的一点理解,抛砖引玉,以期能引出更具价值的信息。

事关图片的存储

把图片存储到什么介质上? 如果有足够的资金购买专用的图片服务器硬件或者 NAS 设备,那么简单的很;如果有能力自己开发单独存储图片的文件系统,那么也不用接着往下看了。

如果上述条件不具备,只想在普通的硬盘上存储,首先还是要考虑一下物理硬盘的实际处理能力。是 7200 转的还是 15000 转的,实际表现差别就很大。是选择 ReiserFS 还是 Ext3 ,怎么也要测试一下吧? 创建文件系统的时候 Inode 问题也要加以考虑,选择合适大小的 inode size ,在空间和速度上做取舍,同时防患于未然,注意单个文件系统下文件个数别达到极限。

独立,独立的服务器

无论从管理上,还是从性能上看,只要有可能,尽量部署独立的图片服务器。这几乎成为常识了(不过在我做过面向 Web 的项目之前就这个问题也被人笑话过)。具备独立的图片服务器或者服务器集群后,在 Web 服务器上就可以有针对性的进行配置优化。比如采用传说中更有效率的 Lighttpd

如果不想在几台机器间同步所有图片,只用 NFS 模式共享一下即可。注意软、硬连接可能带来的问题,以及 NFS 特定的传输速度。

独立,独立的域名

如果大部分 Web 页面必须要载入很多图片,那么需要注意 IE 浏览器的连接数问题(参见对该问题的测试)。

前几天有个朋友在线上问我,”一些大网站,图片服务器为什么都用另外一个域名? 比如yahoo.com 图片服务器用了 yimg.com 的域名?” ,粗糙一点的答案:除了管理方便,便于CDN 同步处理,上面说的 IE 连接数限制也是个考虑因素吧(其他原因我也不知,有请 Yahoo!的同学发言) 【还有一个我没考虑到的是 Cookie 的因素,参加楼下高春辉的留言】

雅虎 Web 优化 14 条

关于雅虎 YSlow 工具倡导的 优化 14 条规则,建议每个 Web 维护人员必须倒背如流,当然也应该辩证来看–介绍这 14 条规则的页面本身也只能得到 70 多分…其中的第九条和上面说的独立域名之间多少有些矛盾。实际情况要根据自己的 Benchmark 与具体需求而确定了。

有效利用客户端 Cache

很多网站的 UI 设计人员为了达到某些视觉效果,会在一些用户需要频繁访问的页面模块上应用大量的图片。这样的情况,研究表明,对于用户粘度比较高的站点, 在Web 服务器上对这一类对象设置 Expires Header 就是十分有必要的,大量带宽就这么节省下来,费用也节省了下来。顺便说一下,对于验证码这样的东西,要加个简单的规则过滤掉。

服务器端的 Cache

在国内,CDN 也是有钱才能玩得起。而类似 Amazon S3 这样的一揽子存储服务,国内还没有出现。所以,充分利用服务器端的 Cache 也是有必要的。Squid 作为反向代理服务器,缓冲图片效果应该说尚可,新浪技术团队贡献的 Ncache 据评测,效果更佳。

服务器端做Cache的好处是显而易见的,一个数据对象的请求时间会控制在 100ms 以内,否则的话,至少要几百个 ms 甚至更长。

高解析图片问题

如果网站存在大量高解析度的图片,那么有必要考虑部署 IIPImage 或者类似的软件。

运营问题

很多比较有规模的网站对于用户上传的图片不做任何处理,结果页面上还能看到很多 BMP 格式的图片(个人觉得任何网站出现 BMP 格式的图片都是可耻的)…这完全是运营上的策略之误了。找个程序员投入一点时间写个图片处理模块,对那些”截屏”得来的图片做个转换,投入成本可能远比存储上的开销小,而用户再访问该图片,质量未必能有什么损失,浏览速度无疑好多了。哪种处理方式更让人接受,不言而喻。

EOF

图片处理工具的选择

可能大多数网站都是选择 ImageMagick 做为基础库,不过这里也有一篇 GraphicsMagick 1.2 vs ImageMagick 6.3.6 Benchmark Report,如果图片处理量巨大,性能问题又怎能不考虑?

Lighttpd 的 ModCache 模块非常值得推荐。

Updated: 对于创业团队来说,推荐又拍云服务,用了都说好。

第二届中国网络工程师侠客行大会

China_Web_Conf.png

五月杭州,侠客行。第二届网络工程师侠客行大会 即将在 2008 年五月二十四号举行(旧贴日期有误)。

这可能是业界最有可能全部面向技术层次的会议,去年 来了很多业界牛人。相信今年能更加务实一些

希望能拉来更多业界“乐于分享”的技术高手,而不要通过简单的 Google 搜索来判断某人在业界的影响力。

非常值得关注的是 Flickr 的架构师 Cal henderson 今年会来。另外 Terracotta 的 Ari Zilka 的演讲也值得期待。

最新动态请关注 官网地址

豆瓣上该活动的信息

EOF