今天看到:WebLeOn's Blog: Longhorn拥抱RSS,之前层出不穷的客户端RSS订阅工具要小心了,“缺省”威力目前还是很大的。相比之下我感觉在线的RSS订阅无疑会成为以后更有前景的模式。BlogLines就是目前人气较高的RSS在线订阅服务之一。
我使用BlogLines比较少,BlogLines缺省的按照作者分类的RSS阅读模式效率不高,还是更习惯根据时间倒排的新闻流水,所以一直尝试着使用Lilina每天生成一份RSS报纸。但除此之外:还是能感受到BlogLines这种中心化服务的一些优势:很容易从订阅关系中发现RSS的热门程度和帮助订阅者之间产生更多的交流互动。要知道,目前很多BlogLines的用户本身也是blog的作者:那么让你看到自己的RSS被多少人订阅了无疑是满足了他们的EgoSurfing的需要(FeedBurner也有类似的RSS订阅计数器功能):如果订阅者的RSS书签是公开发布的:那么你还能看到具体的订阅者是谁,从而找到更多的“同好”:很难想像,居然还有人订阅了我的del.icio.us。
类似于del.icio.us中:发现和你收藏相同URL的其他用户的功能。
仔细用用Bloglines还能发现更多的有用的功能:比如发布blog,订阅天气预报啦之类的。虽然中心化服务有些危险: Bloglines提供了符合OPML规范的RSS书签的导入/导出功能,我试了一下,能够和Lilina的书签互换。
但是从另外好的一方面说:和FeedBurner一样,BlogLines的RSS订阅可以帮助你看到从国内访问有些路由阻尼的网站:比如GoogleBlog。
2005-06-26
关于去中心化:如何搭建一个类似于BlogLines的服务呢?
我自己尝试使用Lilina实际上也是在尝试搭建一个BlogLines类似服务所需要的技术准备,目前体会到的有以下几点:
1 缓存机制:缓存机制可以大大降低对于RSS发布源的负载;
2 RSS纠错/容错机制:很多RSS甚至不是严格的XML,而时间戳问题可能是一个非常普遍的问题。
3 动态更新机制:由于大部分RSS的更新并不是很频繁,所以如何智能一些的动态调整RSS同步周期也是需要考虑的:比如可以按照某个最新5篇内容的平均间隔做为RSS的更新频度。
4 RSS的死链检查:很多国内BSP的RSS发布地址不是很稳定,当服务升级后,如何能动态的升级到新的RSS发布地址?
在开发RSS搜索引擎也遇到了RSS数据源的发现问题:靠机器抓取需要增加的识别比较麻烦,而且也很难看出每个RSS的重要程度,如果有一个BlogLines一样的社群帮助动态发现/排序,无疑会是一种非常好的补充。