Tag Archives: Web2.0

豆瓣推出新功能: 我上

在网志年会上,阿北透露豆瓣将在最近有新的东西推出,不过当时没有刨根问底,只是问他会不会推出针对电子产品(比如数码相机,笔记本)这样的频道,得到的回答是否定的。今天看到新华网对阿北的访谈,阿北透露了豆瓣新功能”我上”:

豆瓣网在推新的功能,以前有很多读书、电影、音乐,我看、我听,我们把它们合并起来,有空间能够放“我上”。

这个产品是”个人空间”还是”Digg”?

同时我们在做一些新东西,近期有一个栏目“我上”将推出,是博客推荐,从中你可以发现一些不是很知名,但很有意思的东西。

Blog 推荐,似乎是有点 Digg 的味道。目前国内还真没有一个很出色模仿 Digg 的站点,更容易切入。
图书、电影、音乐、旅游 + Blog,给每一个用户感兴趣的东西一个展示的机会 ?
豆瓣存在给每一个客体产生微内容的平台的可能。
Updated:
中午向朋友推荐的时候还不见这个功能,现在已经推出来了。见图:
豆瓣的新功能:我上
试用了一会儿,发现这个功能对于 Blog 拥有者来说,更有粘度
EOF

Craigslist 的数据库架构

(插播一则新闻:竞拍这本《Don’t Make Me Think》,我出价 RMB 85,留言的不算–不会有恶意竞拍的吧? 要 Ping 过去才可以,失败一次,再来)
Craigslist 绝对是互联网的一个传奇公司。根据以前的一则报道:

每月超过 1000 万人使用该站服务,月浏览量超过 30 亿次,(Craigslist每月新增的帖子近 10 亿条??)网站的网页数量在以每年近百倍的速度增长。Craigslist 至今却只有 18 名员工(现在可能会多一些了)。

Tim O’reilly 采访了 Craigslist 的 Eric Scheide ,于是通过这篇 Database War Stories #5: craigslist 我们能了解一下 Craigslist 的数据库架构以及数据量信息。
数据库软件使用 MySQL 。为充分发挥 MySQL 的能力,数据库都使用 64 位 Linux 服务器, 14 块 本地磁盘(72*14=1T ?), 16G 内存。
不同的服务使用不同方式的数据库集群。

论坛

1 主(master) 1 从(slave)。Slave 大多用于备份. myIsam 表. 索引达到 17G。最大的表接近 4200 万行。

分类信息

1 主 12 从。 Slave 各有个的用途. 当前数据包括索引有 114 G , 最大表有 5600 万行(该表数据会定期归档)。 使用 myIsam。分类信息量有多大? “Craigslist每月新增的帖子近 10 亿条”,这句话似乎似乎有些夸张,Eric Scheide 说昨日就超过 330000 条数据,如果这样估计的话,每个月的新帖子信息大约在 1 亿多一些。

归档数据库

1 主 1 从. 放置所有超过 3 个月的帖子。与分类信息库结构相似但是更大, 数据有 238G, 最大表有 9600 万行。大量使用 Merge 表,便于管理。

搜索数据库

4 个 集群用了 16 台服务器。活动的帖子根据 地区/种类划分,并使用 myIsam 全文索引,每个只包含一个子集数据。该索引方案目前还能撑住,未来几年恐怕就不成了。

Authdb

1 主 1 从,很小。
目前 Craigslist 在 Alexa 上的排名是 30,上面的数据只是反映采访当时(April 28, 2006)的情况,毕竟,Craigslist 数据量还在每年 200% 的速度增长。
Craigslist 采用的数据解决方案从软硬件上来看还是低成本的。优秀的 MySQL 数据库管理员对于 Web 2.0 项目是一个关键因素。
EOF

CSDN 推出的网摘服务

下午上线,看到 CSDN 曾登高 大侠给我的留言中的一个地址,点击过去原来是CSDN 网摘系统
乍看上去这个系统和 365Key 很相似。用起来还是有很多差异性的。比如 CSDN 网摘首页的热门话题把每一则作为一个主题,点击下去并不是直接到该目标页面,而是显示该则网摘相同收藏者等信息。而”实时网摘“每一则点击下去,则会显示相似的主题收藏(应该是通过 Tag 关联到的)。当然每个主题的下面都有原 URL 的链接,看得出设计者在这个方面下了一番斟酌,不过还是多少有点挑战用户习惯的意思,用惯了 del.icio.us 的用户未必会喜欢这样的设计。
CSDN 最近一段时间在 Web 2.0 方向又做了很多尝试,前一段时间也推出了一个 CSDN Tag 服务,开始有计划的抓取站外的 Blog 内容(只是改进不那么迅速),而这个网摘服务刚好可以作为 Tag 服务的一个补充。目前类似 del.icio.us 的网络书签服务已经有一大串,如何避免与这些服务的雷同,而发挥出来独特的作用呢?
我个人认为以前 CSDN 对于站内用户产生的内容挖掘方面做的并不好,虽然技术论坛内积累了很多有质量的内容,可这些内容的关联性得不到,附加价值就不能产生,现在这两个服务的推出或许能够多少缓解这个问题,由用户来协助解决这样的问题,是一个实惠又取巧的办法。可能是因为刚发布的问题,现在的收藏内容还是集中在 CSDN 站内论坛内容,我想登高恐怕志不止于此,应该会大力发展站外新用户。
BTW:已经在每个页面的下方加入了一键收藏的代码,CSDN 的注册用户可以方便一些。
EOF

Sixapart Acquires Rojo

Sixapart Acquires Rojo


Sixapart Acquires Rojo

Originally uploaded by Fenng(dbanotes).

Sixapart 宣布收购 Rojo. 一直以为 Sixapart 会被别的大公司吞掉. 一年多过去了, 活得更加滋润了.
Rojo 的在线 RSS 聚合服务并不如 Bloglines 出色(最近也迁移到新的技术架构了,还没来得及表现). 不过 Sixapart 如果组合拳(LiveJorunal+Rojo+Vox) 打好了还会是很精彩的.