作者文章: Fenng

什么是 egosurf

最近好多人尝试了 egosurf.org 这个站点提供的服务:egosurf . 什么是 egosurf ? 这个词拆开来是 ego(自我.本我.心理学术语)+ surf(网络冲浪). 根据 Eric S. Raymond 的《黑客大辞典》中的定义:

To search the net for your name or links to your web pages(在网络上搜索自己的名字或者自己Web页面的链接). Perhaps connected to long-established SF-fan slang egoscan, to search for one’s name in a fanzine.

最早了解这个词是从车东(怎么又是这个家伙:)的 ego Surfing = ego + Surfing . Blogger 进行 egosurf 的应该不少(虽然很多人可能没意识到), 其实如果把一个站点看作一个互联网实体,也是应该进行 egosurf 的. 因为通过这个行为能够做到以下几点:

  • 1. 更好的了解自己的站点信息,以便吸引更多的有针对性的读者
  • 2. 知识发现. 了解哪些用户通过自己的站点内容引发出更多的内容,这些内容有哪些与自己提供的信息能够互补.
  • 3. 满足自己的虚荣心 ;) 或者了解自己/站点的影响力

下面说说我进行 egosurf 的一点点经验:

  • 谁链接了我?. 通过搜索引擎的搜索反向连接.比如 Google 可以用 link:www.dbanotes.net/
    此外,针对单独页面的 Refer 脚本也可以尝试一下. 但要注意,站外的脚本因为数据交互的问题可能会拉慢页面.
  • 谁引用了我的内容? 针对 Blog, 如果针对 Blog , 可以 Google 的 Blog Search 输出 RSS , 然后用RSS 阅读工具即可动态反映相关的 Blog 引用信息.Technorati 是一个很好的选择. 可以查看所有引用我Blog内容的链接信息.
  • 谁收藏了我的页面? del.icio.us365key 是必须的工具.先收藏自己的一些重要的页面,然后就可以观察有哪些读者把页面收藏为书签.
  • 我的站点那些内容吸引读者? 针对这个问题, AwStats 工具是一个不错的选择,而且, AwStats 也提供反向链接信息, 以及关键字信息, 这也是必不可少的功能; 另一个好工具是 Google 的 Analytics 服务. 虽然以前我曾经对这个工具产生怀疑,但是使用了一段时间之后,发现 Analytics 的交互性要比 AwStats 强多了. Analytics 其实也提供一些其他 egosurf 功能, 但是因做不到实时性,显得有些受限制.
  • 我的 Twitter/微博 Twitter 的搜索并不是特别便利,但是微博的搜索倒是个很好的 egosurf 工具.

想 egosurf ? 在自己常用的搜索引擎上搜索一下自己的名字或者网络常用的 ID , 看看会有多少结果? 简单吧?

更多了解:
Egosurfing with PHP and Google
Ego Surfing = Ego + Surfing

EOF

Updated: 2013.03.10 发现此贴被原封不动搬到百度百科上之后. 简单更新了一下.

Hammerora — 开源的 Oracle 压力生成工具

此前我曾经在 利用开源工具实现自己的TPC-C 中介绍过 Hammerora , 经过了一段时间的发展, Hammerora 这个工具也已经有了一些变化。如果你正在寻找一款 Oracle 压力生成工具准备用来测试你的 Oracle 数据库, Hammerora 是一个非常好的选择。

这款工具是用 Tcl/Tk 写的(国内能用 Tcl/Tk 的人似乎非常少).其工作原理很简单:

……解析 Oracle 的 Trace 文件,并把它们转化为 OraTcl 程序,然后在 Oracle 数据库中用多个用户并发的对用户的事务进行”回放”。我们知道,Oracle 的 Trace 文件能够翔实的记录用户对数据库的操作。这样 Hammerora 能够保证对用户环境的真实模拟。

这个工具的优势:

  • 开源软件,用户可以添加自己需要的功能。而那些商业软件连 UI 字体修改一下都几乎是不可能的;
  • 开源软件,成本更低。相比之下 LoadRunner 之类的工具太庞大了,而且 License 费用不菲;
  • 基于 Oratcl 与 Oracle 交互。可以真实反应 SQL 在数据库中的运行信息。而本身的开销很小。

继续阅读

用 Sitemap Generator 创建 Google Sitemap

今天偶然注意到 Google 对我的站内搜索数量锐减,从前一段时间的将近 1 万 变成现在的不到 1 千了.稍加分析了一下,原来在每篇文章的页面最上方也加了站点的描述内容,最初的目的完全是为了美观,没想到搜索引擎把这些页面都当作相似页面成处理了.雅虎和百度的站内搜索结果也是类似的.
不由得想起另一个问题: Google 的爬虫到底能不能遍历我的站内所有页面 ? 似乎不太可能.回想起 Google 的 Sitemap 也发布很久了, 并且不提供联机创建 Sitemap 的功能, 已经能够说明对很多比较复杂的站点 Google 仍有不足之处. Google 推这个工具的功能恐怕也是为了用户能从客户端把信息推到搜索引擎这一端(Google 用意).
此前我的站点 Sitemap 采用的是 MT 模板的方式 ,参考 Google Sitemaps using Movable Type , 这样我的旧站的内容就忽略掉了. 我现在使用的 Dreamhost 的服务,是支持 Python 的 ,并且可以 Shell 登陆, 准备用 Google 推荐的 sitemap-generator 来”帮助Google一下”. 具体的操作在 Google 的帮助页面有很详细的说明. 需要注意的是,该工具要通过代理才可以下载,不知道其他人是不是也和我一样.

继续阅读

Blog, Blogger,博客与网志

今天看到公司的杂志架上有本 06 年 1 月期的《福布斯》(中文版),封面上大大的标题”如何迎接来自博客的攻击“引起了我的注意,拿起杂志注意到封面也出现了“网志”的字眼,博客 vs. 网志,不由得想起 04 年 12 月的那场关于 Blog 译名的争论。说实话,我也不太喜欢”博客”这个字眼,我的 Blog 的读者可能会注意到我几乎从来不说”博客”这个词,最近我也在 页面的右下方贴了一个 “Blogger is not 博客“的图标。稍微表达一下我的立场。
回头还说《福布斯》这一期的文章,读下去会发现文中的网志/网络日志指的是 Weblog,但”博客”却对应 Blogger 这个词,给人的感觉怪怪的。据我所知,这份杂志中文版的文章都是翻译出来的,而且,译者的风格不统一也可以想见(Technorati 被翻译为”贴诺”)。我之所以不喜欢这个词,主要的原因还是“博客”这个称呼因为某些人别有用心的滥用,而令更多人产生误导,有些令人生厌。正如 “黑客” 这个词一样。

继续阅读