Awstats 新的搜索引擎定义: 114.com.cn

从后台日志上观察到有大量来自 114.com.cn 的搜索。最开始没有注意,还以为是 VNet 过来的–都有个 114 嘛。这两天查询突然暴增,仔细一看,还真不是一回事:

$ grep  114.com.cn access.log |awk  '{print substr($11,1,80)}' |head
"http://so.114.com.cn/usearchp?keyword=\xd4\xbd\xd3\xfc\xb5\xda\xb6\xfe\xbc\xbe&
"http://so.114.com.cn/usearchp?keyword=\xd4\xbd\xd3\xfc\xb5\xda\xb6\xfe\xbc\xbe&
"http://so.114.com.cn/usearchp?keyword=\xd4\xbd\xd3\xfc\xb5\xda\xb6\xfe\xbc\xbe&
"http://so.114.com.cn/usearchp?keyword=\xd4\xbd\xd3\xfc\xb5\xda\xb6\xfe\xbc\xbe&
"http://so.114.com.cn/usearchp?keyword=\xd4\xbd\xd3\xfc\xb5\xda\xb6\xfe\xbc\xbe&
"http://so.114.com.cn/usearchp?logo=1&keyword=\xd4\xbd\xd3\xfc\xb5\xda\xd2\xbb\x
"http://so.114.com.cn/usearchp?logo=1&keyword=\xd4\xbd\xd3\xfc\xb5\xda\xd2\xbb\x
"http://so.114.com.cn/usearchp?keyword=\xd4\xbd\xd3\xfc\xb5\xda\xb6\xfe\xbc\xbe&
"http://so.114.com.cn/usearchp?keyword=\xd4\xbd\xd3\xfc\xb5\xda\xb6\xfe\xbc\xbe&
"http://so.114.com.cn/usearchp?keyword=\xd4\xbd\xd3\xfc\xb5\xda\xb6\xfe\xbc\xbe&  

为了节省空间,没有把 URL 都打出来,所用的参数极为诡异,后面还有几个奇怪的参数,AWstats 也根本不能探测到引用的关键词是什么。
搜索了一下,这个站点叫”中国网上黄页”, 是厦门的一家叫什么”中资源”的公司做的。
添加了一下这个搜索引擎的定义,暂时叫他 ‘114’ 吧. 添加定义挺简单的,我做的修改:

$ diff search_engines.pm search_engines.pm.backup1003
192d191
< '114\.com\.cn',
366d364
< '114\.com\.cn','114',
578d575 < '114','keyword=',
754d750
< '114','114',

观察到的效果:

来自搜索引擎  
17 个不同的搜索引擎转介参观者到本站 网页数 百分比 文件数 百分比
Baidu 3231 63.3 % 3461 60.6 %
Google 1602 31.4 % 1896 33.2 %
SoSo 78 1.5 % 78 1.3 %
Yahoo! 53 1 % 54 0.9 %
3721 29 0.5 % 29 0.5 %
NetEase 27 0.5 % 27 0.4 %
SoGou 23 0.4 % 23 0.4 %
Google (Images) 12 0.2 % 18 0.3 %
VNet 10 0.1 % 10 0.1 %
114 10 0.1 % 10 0.1 %
Unknown search engines 8 0.1 % 8 0.1 %
Windows Live 7 0.1 % 71 1.2 %
MSN Search 4 0 % 4 0 %
Iask 3 0 % 5 0 %
ZhougSou 2 0 % 2 0 %
Google (cache) 1 0 % 7 0.1 %
Ask 1 0 % 1 0 %

感觉国内的个别搜索引擎根本不关心什么规范之类的事情,Bot 随便爬,爱咋咋地的态度。
EOF

网易中秋赛诗大会

网易仲秋赛诗大会


网易仲秋赛诗大会

Originally uploaded by Fenng(dbanotes).

网易这个创意很能体现 Web2.0 。虽说有点恶搞,但是这个”赛诗大会“的确好玩,通过简单输入几个词汇,即可欣赏自己的”诗作”,忍不住想笑。自从”丽华体”风靡互联网,忽然发现,每个人都是生活中的诗人呀。
今天,你写诗了没有?
在众多网站靠一些花边新闻、色情擦边球拉流量的今天,网易的做法值得借鉴。用这样一个有点老的点子,不同的方式用在不同场合,也算是门户网站的一种创新吧。
EOF

相机,手机,笔记本, 一个都不能好

昨天笔记本液晶屏幕花了! 下午在办公楼之间跑了一趟,回来笔记本就要罢工。开始的时候还不太严重,勉强可以看见屏幕的内容,把显示输出到了外接液晶显示器上。
今天早上到了公司,就不那么容易了,”摸着黑”, 折腾了半天,才把显示调到外接显示器。这个笔记本到我手里已经换过了网卡,键盘,这次看来轮到显示器了,国庆期间,IBM 蓝色快车也休假,800 电话告诉我 10 月 8 日工作人员才上班.
这是最近坏的第三个”家用电器”了。
前一段时间,家里的相机坏了,液晶屏出现不规则条纹,搜索了一下,说是 CCD 的问题,现在寄回厂家维修,回复说”两个月之内可以修好”。
值班第一天,发现手机没有声音。折腾啊折腾,确定是扬声器的问题。现在手机调整成震动状态。勉强可以用。
相机,手机,笔记本, 一个都不好… 这个国庆有点郁闷
EOF

Yahoo! BBAuth: Browser-Based Authentication

这次 Yahoo! Hack Day 最引人瞩目的成果当属:BBAuth(Browser-Based Authentication)。在日常上网使用各个站点的服务的时候,身份验证就让我们很烦,在一个站点输入用户名、密码; 到了另一个站点,还是要输入用户名、密码;个人管理这些安全信息就是一个麻烦事情,而这些身分认证的管理对于一些中小站点来说,也是一个不小的负担。BBAuth(基于浏览器的身份验证) 就是雅虎试图解决这个问题的推出的一个方案。
BBAuth 的示意图如下:
BBAuth 示意图
(图是借用官方站点上的)
第三方需要用户身份确认,请求页面重新定向到 Yahoo! 登陆页面,Yahoo! 验证后返回凭证给改第三方站点。
这个服务和 OpenID 都在尝试解决同样地问题。不过,差别还是不小。
Yahoo! BBAuth 的优点是第三方站点可以直接与雅虎的所有用户进行交互。身份验证的成本大大降低。缺点是,不够开放。Yahoo! 相当于一个大磁铁,把使用 BBAuth 服务的 Web 站点集中在自己周围。
OpenID 的优点是开放性好,不存在集中化的弊端。但是没有大商业团体的推动,如果构建的话,总体的成本偏高。
其实我更关心 Yahoo! 认证时候的网络响应速度 :)
对于一些特定的 Web 应用,BBAuth 优势很明显,比如解决 Blog 牛皮癣(Comment Spam) 的问题。
Updated: 已经有人在使用 BBAuth 进行 Blog Commenter 的身份验证
EOF