07 年 DBA notes 在抓虾上被推荐最多的文章

看到这篇 2007 抓虾最热 50 篇文章分析,甚感惭愧。没一篇是自己写的。翻了一下抓虾上被推荐的文章列表,看看这一年抓虾用户给了 DBAnotes.net 多大的关注程度。

重新安装系统后的几件事情 >> 推荐数:70
本想写给自己备忘的一篇文章反而收到了最多的关注程度(不过即使最多也没超过 100 个推荐)。始料未及。或许是越简单的东西反而越普适.

网站架构分析篇

WikiPedia 技术架构学习分享 >> 推荐数:51
架构类文章被推荐最多的一篇,之所以受到了更多关注怕还是沾了 WikiPedia 名头的光。

YouTube 的架构扩展 >> 推荐数:43
Google 收购 YouTube 后,迫不及待的把 YouTube 纳入自己体系架构中。YouTube 也是大树底下好乘凉。

财帮子(caibangzi.com)网站架构 >> 推荐数:27
采访了财帮子的 Meng Yan 后整理的资料。07 年财经类站点很火。08 年相信他们会更有机会。这也是唯一一篇爆料国内网站架构的文章。

WordPress 对 Gravatar 进行的优化 >> 推荐数:22
WordPress 收购 Gravatar 后,干了啥好事?

Yahoo!社区架构 >> 推荐数:30
关于雅虎技术背景的爆料。

Twitter 架构扩展:100 倍性能提升 >> 推荐数:30
Twitter 是 2007 年我用的比较多的服务了。这个站点现在还需要不停的扩展

Internet Archive 的海量存储浅析 >> 推荐数: 13
从写这篇分析开始,我有了写更多系统架构分析文章的念头。

技术备忘篇

Unix 速成小法 >> 推荐数:35
这篇和另一篇 GNU 核心工具 遥相呼应。算是我对 Unix 使用中的一点感悟。

Bash Shell 快捷键的学习使用 >> 推荐数:33
Shell 学习笔记,备忘。俗语说,好记性不如烂笔头,诚然。

GNU 核心工具 >> 推荐数:18
关于GNU Core Utilities 的小小介绍。

从 MySQL 迁移到 Oracle (傻瓜篇) >> 推荐数:16
从 Oracle 迁移到 MySQL 的文章很多,从 MySQL 迁移到 Oracle 的文章则很少。本文算是抛砖引玉。

探讨篇

Web 2.0 站点扩展性问题随感 >> 推荐数:27
Web 2.0 站点扩展性问题越来越突出,已经成为制约 Web 2.0 发展的一个障碍. 一点想法以及探讨。

Windows 上最好用的 GTD 工具是哪一个? >> 推荐数:21
GTD 工具林林总总,可最好用的是哪一个?怕是没有最好,只有哪个合适而已。

扯淡篇

G FW 三定律 >> 推荐数:22
这篇文章被关注绝对不是因为写的好,而是因为痛恨 GF W 的人太多了。

诡异篇

推荐本站在 del.icio.us 收藏最多的文章 >> 推荐数:28

一点题外话:
1)抓虾数据仍有潜力可挖掘。像我的最被关注的帖子,如果能给自动做个分析该有多好?

2) del.icio.us 和 抓虾用户兴趣点多有重合之处。但普及类的文章在抓虾上怕是更受关注。

3) 被推荐多或者被收藏多的文章不一定得到比较多的评论

不早了,改天想起来再写

EOF

此文作者:, 位于 SiteLog 分类 标签: on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

圣诞节收到”天使”的礼物

公司有个老传统节目叫做“国王与天使“,随机抽签,”天使”要给”国王”送个小礼物。我的天使给我送来了什么? 一双袜子,仔细一看,还是女袜…说看我的名字以为我是女孩子,问题是,有名字这么难听的女孩子麽? 不管怎么样,谢谢这位同事!另外,每个人都是自己的天使,圣诞快乐!

这两天比较忙,忘了我自己也当”天使“这个事情,查找一下才知道我的”国王“远在北京,只好通过 IM 问候一下。

翻看了一下 我在 2007 年的 Wish List,居然一个都没实现。看来 Wish 还不是现实。

EOF

此文作者:, 位于 Review 分类 标签: on .
转载须以超链接形式标明文章原始出处和作者信息及版权声明.

37Signals 架构

如果没有 37signals ,恐怕也没有 RoR 的如此流行。37signals 对于很多 Geek 来说,是一家非常迷人的公司。他们是网络上的另类新星。

37Signals 在 Signal vs. Noise 上披露了比较详细的运营数据,Ask 37signals: Numbers?

存储数据量

截止到 2007 年 11 月,总存储量统计:

  • 5.9 T 用户上传的数据
  • 888 GB 上传文件 (900,000 请求)
  • 2 TB 文件下载 (8,500,000 请求)

这包括 BasecampHighriseBackPackCampfire总的数据统计。总的用户量其实并不多,只有 200 万。

这些数据存放在 Amazon S3 上,37Signals 用了这个服务已经一年多了,他们对此比较满意。事实上,Amazon S3 已经成为 Web 2.0 分布式存储的既定事实的解决方案。

服务器状况

37Signals 当前正在部署虚拟化软件产品,当然不用 VMware,而用开源的 Xen。当前大约有 30 台服务器,从单 CPU 的文件服务器到 8 CPU 的应用服务器都有,总共 100 颗 CPU、200GB 内存。预计 XEN 部署完毕后,服务器数量降低到 16 台,92 颗更快的 CPU、230GB 的内存量。这样做的主要目的是管理起来更方便(至于性能是否更好,我个人还是有点怀疑的–Fenng)。

关心 ROR 以及具体一些策略具体实现的朋友不防去看看那个帖子下面的留言。

之前还真的很少有听说哪家 Web 2.0 公司部署 XEN 的,37signals 的这个动作或许是个积极的信号。2007 年也是个”虚拟化”年,相信随着虚拟化的技术成熟,开源力量的壮大,会有更多的公司收益于 XEN 虚拟化架构.

EOF

年度回顾:这么多的数据泄漏事件

到了年底了,要预防安全事故,数据泄漏更要预防。CSO 杂志列举了 2007 年的 10 大数据泄漏事件。这里有一份比较全的数据泄漏列表。我觉得这个 美农业部数据库漏洞泄漏十五万人资料 其实也很有实力入选年度 10 大,但不知为何没入 CSO 杂志作者法眼。

原以为这些事件都和什么黑客入侵有关的,真实情况倒是大相径庭:有好几个是着了 “社会工程学” 的道儿:光是硬盘、笔记本被盗就有好几个。金庸老先生说了,”重剑无锋,大巧不工”;小平说了,能拿到数据的黑客就是好黑客。光盯着软件的漏洞下手,还不如奔着人下手容易(比如电影《防火墙》里描述的那样)。比如企业内部网络安全固若金汤,那可以盯着他的备份磁盘磁带下手嘛,要不盯着他出差的总裁、CTO 啥的,在机场、火车站偷丫的。所以,如果要黑某个公司的网络,还不如扮作捡垃圾的,每天检查一下这个公司的废纸。扯远了…

DBA 们,一起来评选一下咱国内的 10 大数据泄漏事件吧? 不过,我好像一个都没听说过,虽说,好事不出门,坏事传千里,可谁让咱报喜不报忧呢。

EOF