Tag Archives: yahoo

Google 站内 URL 地址处理的有趣现象

一直误以为 Google 的 URL 地址是大小写不敏感的。偶然间发现:
https://www.google.com/adsense (可以访问)
https://www.google.com/adSense (http 404 错误)
看来不是。继续测试一下其他地址:
http://www.google.com/intl/zh-CN/options/ (可以访问, 中文)
http://www.google.com/intl/zh-cn/options/ (可以访问, 英文)
http://www.google.com/intl/ZH-CN/options/ (可以访问, 英文)
http://www.google.com/iNtl/zh-CN/options/ (不可访问, 404 错误)
Apache 的 mod_speling 如果启用的话,并且 httpd.conf 文件 配置了

CheckSpelling on 

的话,Apache 则大小写不敏感。但这样性能会很差。
也或许,Google 这样做就是为了追求更好的性能而没有使用类似的模块(Google 当然没那么简单)或者其他处理,毕竟 Google 整个站点的入口页面并不是那么多。
Updated: 雅虎的站内地址几乎都是大小写不敏感的. 下面两个地址等价:
http://sports.yahoo.com/MLB/scoreboard
http://sports.yahoo.com/mlb/scoreboard
Yapache 还是有技术含量地。
EOF

雅虎通推出 PingMe 服务,酷!

雅虎通新推出了一个很有趣的服务: 雅虎 Pingme
这个 Pingme 的服务在雅虎通用户与非雅虎通用户之间建立了一个便捷的桥梁,雅虎 Pingme 服务是基于 Web 页面的,非雅虎通用户无需下载任何客户端无需任何设置,只需要点击一下鼠标即可轻松与雅虎通用户沟通。
雅虎通用户可以申请这个服务并把一小段HTML代码粘贴到 Web 页面上,随时随地与网友沟通,非常适合 Blogge — 对 Blogger 来说相当于一个活动的留言版 。看看我的例子:
给我发送雅虎通即时消息
发送时候的效果(左边是发送窗口,右边是接收端的窗口):
Yahoo_messenger_pingme.png
如果是 Spam 留言,可以直接举报,这一点考虑得周到。除了用于 Web 页面的代码,还有针对电子邮件的代码,粘贴到模版里即可。
雅虎 Pingme 还有一点瑕疵:
1)雅虎提供的代码段,Image 没有 Alt 属性(上面的例子我已经加上去了) ;
2)应该支持回车发送;
3)发送页面应该加一个提示,我第一次用,直接到上面的窗口去输入了,结果当然是不行,对这两个窗口加上说明会很清晰.
另外,如果在该页面能放置一个反馈的入口就更好了。
这个服务,很有创新性,酷!
EOF

Yapache-Yahoo! Apache 的秘密

作为世界上 NO.1 的 Web 站点,Yahoo!Web 服务器定有独到之处. 这也应该是很多 Web 技术人员关心的一个问题。
前一段时间, Yahoo! 架构软件组的技术经理 Michael J. Radwin 在 OSCON 2006 上作了一个题目为 Hacking Apache HTTP Server at Yahoo! 的报告,透露了很多关于 Yahoo! Apache 的技术信息。
Yahoo! Apache = Yapache , 这是雅虎内部使用的名字吧。发音是(why·apache)(注:根据下面的留言,读音应为[ya`pache])。 YApache 是基于 Apache 1.3 进行 hack 的,目前在向 Apache 2.2 迁移(Prefork Multi-Processing Module ?)。 Michael 介绍说构建 YApache 的原因有三个:
1) 安全性;
2) 节省带宽;
3) NETSCAPE GUIDE BY YAHOO–这是 97 年的时候 Yahoo! 与 Netscape 联合推出的 一个互联网信息与导航服务,需要用到富媒体内容,当时的 Apache 对这样的内容支持较弱,所以雅虎不得不动手改造 Apache (要知道97 年的时候 Netscape 就好比现在的 Google 啊)。据说这才是主要原因。
Apache 1.3 的功能对雅虎来说已经够用 (在 98 年对 yapache 添加了 gzip 的支持),所以这个版本一致用到现在。YApache 的一个倾向性的原则是用进程而不用线程,相对比较保守,不过这样选择的原因也是很明显的:进程更加稳定,线程对与程序员来说,更容易引入新的问题。
接下来 PPT 描述了一些关于 LOG 格式的内容,继续看下去,我感兴趣的是关于配置参数 StartServers / MaxSpareServers / MinSpareServers / MaxClients 的问题。很多 Web 技术人员往往要在这个地方反复推敲。YApache 一般只设置 MaxClients,这个值一般小于 100, 对于 99% 的站点是足够用了。尽量让系统(Yahoo! BSD) Kernel 来处理 Buffer, 在这个地方关于 几个 kernel 参数的设置很有讲究。
关于SSL 的部分我不太感兴趣,倒是最后的 ysar (Yahoo! sar) 看起来是一个有趣的工具.
这样的定制对于 Yahoo! 这样需要大量 Web 服务器的站点来说(现在平均每天接近 40 亿 的 PV),得到的收益无疑是巨大的。对于规模相对较小的 Web 2.0 站点,类似 LightTPD 这样的轻量级 Web 服务器更为适合(比如豆瓣):

$ curl -I www.douban.com
HTTP/1.1 200 OK
Connection: close
Status: 200 OK
Content-Length: 13213
Content-Type: text/html; charset=utf-8
Set-Cookie: dbcl2="MPmAySb0OYE::"; path=/; domain=douban.com; \
expires=Thu, 01-Jan-2009 00:00:00 GMT
Date: Fri, 22 Sep 2006 12:34:16 GMT
Expires: -1
Server: lighttpd/1.4.11

(那些盯着豆瓣页面看的模仿者,很少有人留心豆瓣的运维技术吧)
在线查看这个PPT: Hacking Apache HTTP Server at Yahoo! (PDF Version) (其实这个文档和 05 年的内容基本上是一致的)。

继续阅读

阿里巴巴收购 Yahoo! 中国之后的风险

在经过了几日的沸沸扬扬之后,阿里巴巴收购 Yahoo! 中国尘埃落定!.那些对阿里巴巴收购Yahoo!中国一事不相信、不服气的评论家们暂时闭上了嘴(有的是立刻改了嘴).虽然,更多的人认为这次收购对双方有益,但是我认为更大的风险还是在阿里巴巴的这边.

第一个问题是公司文化上阿里巴巴整合Yahoo的难度.众所周知,周鸿祎这个”野蛮人”在任的时候一度和原 Yahoo! 中国的”文明人”发生强烈的冲突,这种程度很大程度是公司文化和理念的冲突.据说:…上次雅虎中国被它收购来的3721接管,很多老雅虎中国的员工有种沉重的失落,绝大多数人选择离开。阿里巴巴和 Yahoo! 中国两种公司文化能否很好融合,这绝对是一个悬念.

第二个问题是阿里巴巴如何处理自身的股权问题.这个股权问题不是各个大股东之间的问题,而是普通员工股权的问题.有股权的员工和无股权员工之间的微妙关系如何处理? 是个艺术问题.公司早期的员工拥有大量纸上财富后的心态肯定不会和旧时一样的了,会对公司产生怎样的影响?还会踏踏实实的做小兵么?

继续阅读

此文作者:, 位于 Review 分类 标签: on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.