电脑技术学习

RSS: 简单协议使得互联网可编程

dn001

原先需要进行多次订阅的数据源:现在用http://feeds.feedburner.com/blog2这一个URL即可,并且还添加了XSLT,可以比较高版本的IE浏览器中直接看到可读性较好的内容:


点击查看详细图片

Feedburner还提供一些商业性内容的嵌入,比如:Amazon的广告推广和最近推出的Google AdSense支持等。

很多RSS上面都有Add My Yahoo! / Subscribe with BlogLines这样的连接:

都是由原来的分布式的用户间RSS订阅变成了一些半中心化的服务:中心化的服务的好处在于代理分工,可以节省BLOG发布者的RSS带宽,由于很多RSS软件每隔一定时间就来服务器上,这样对于一些受到带宽限制的虚拟主机用户来说,经常就会出现带宽不够的情况,转向到中心的大的代理服务商,的确是一个解决办法。而中心的代理商由于为很多RSS订户服务,因此可以充分利用本地的缓存提高派送效率:同时也减少了对RSS数据源的访问压力。因此:对于RSS中心服务商来说:主要要解决就是一个缓存机制问题:

USER1 / RSS1

USER2 -[Rss Cache] - RSS2

USER3 /

虽然有一些中心化的风险:但是就像大家已经很少自己做馒头一样,更多丰富的功能添加还是应该由专业代理服务商进行的。

其他一些特色服务,RSS的死链检查和容错性设计:

如果RSS数据源出现错误,BlogLines会进行一些提示。RSS浏览器如果真的非常依赖严格的XML解析器,我想最终胜出的仍然会是RSS容错性最好的工具和提供校验服务的平台。现在不规范的RSS真是太多了,RSS的URI设计也需要注意尽量避免使用动态网页:这样在OPML导出中可以避免很多&没有转移导致的XML解析错误。

基于点击统计的用户行为分析:

Attention.XML这个标准专门基于用户点击的统计输出:类似与Windows桌面上的动态开始菜单。可以根据用户的点击行为(时间,URL,内容统计)反馈给内容的发布者。

RSS之间的SNS分析:

RSS的出现也降低了搜索引擎抓取的难度:TechnoRati是一个BLOG搜索引擎(后台也是Lucene),数据源是通过用户提交BLOG实现的:还会提示在TechnoRati会员之间的相互引用关系

RSS的自动分类:

RSS是草根新闻,为了提高很多用户约定俗成都用一些组合词表达一些特殊的主题,形式很像Wiki用的CamelWord:10PlacesInMyCity 10BooksIRead Yahoo360Share。非常的SearchFriendly 可以将RSS背后的个人和他们之间的引用关系可以交织出一个更复杂的人际关系网络视图,这之间的链接关系和信用机制和搜索引擎对网页Ranking机制是非常近似的。

RSS做为在线书签:

如果你收藏了上百个RSS后,RSS的书签管理就是很大的问题了,OPML就是相应的XML标准格式,一般RSS阅读工具都支持OPML的RSS书签导入和导出。我自己的OPML:http://www.chedong.com/cache/opml.xml。

小结:

我觉得RSS是目前在线新闻媒体的进化:内容的生产者(blogger)和内容的分发者(feedburner/bloglines)和内容的接收者(rss reader/浏览器)都因为RSS这个标准而有了更多的选择和展现方式。和以往的新闻模式不同,基于RSS的新闻传播:数据源更广泛(BLOGGER),用户的可选择余地更多(代理商),用户的可定制化程度更高(浏览器) ,而不一定都要去忍受目前很多新闻网站过大的首页:Amazon的Lite版就是很好的例子。

内容的提供商会更加专心于内容的开发,有了简单的API后,很多网站可以将原来界面比较复杂的网站都可以做得更LITE点,成为更好的分销商。不过RSS也使得网站内容的复制/镜像变得非常容易,这对于搜索引擎来说可不是什么好消息。