电脑技术学习

垂直搜索威力大 分类网站应该警惕酷讯

dn001

媒体最近有一些关于酷讯网(www.kooxoo.com)的报道,这些报道基本有两个主题:一是酷讯网是做分类信息的“垂直搜索”;二是创始人陈华在搜索方面的“资深”背景。总之,这些报道都试图把酷讯网包装成一个“搜索概念”的网站。

凑巧的是,在这些报道出来之前,我就开始关注并跟踪酷讯网的动向。我的观点恰恰和媒体的报道相反。我认为,酷讯在“搜索”方面并没有什么特别之处。酷讯的本质,并不是搜索,而是分类信息的入口网站(门户网站);这应该值得国内各个分类网站警惕。

一、搜索?

我们先说搜索。Google、百度代表一种模式,可以说是全网的基础搜索模式;而qihoo和daqi代表另一种全网模式。这里我想详细说说:从表面看,qihoo和daqi目前都是对BBS内容进行聚合,似乎是“垂直搜索(聚合)”,但其实他们也是基于全网的广域搜索和聚合――即基本上针对所有中文bbs;所以我并不把他们看作是“垂直”的。而第三种搜索模式,就是酷讯网为代表的,真正的“垂直搜索”――他们不用索引海量的网站,直接索引相关信息的宿主网站就可以了。而根据酷讯的业务范围,我分析,比如租房这块,他们索引主要的百来个租房网站即可。

而一个真正的搜索网站,主要需要三个功能:1,爬虫系统分析海量未知网站的网页;2,索引经过爬虫抓取回来的网站网页;3,对用户搜索请求的分析和响应。在上一段中,我之所以试图澄清目前三种不同类型的“搜索”网站,是因为这三种不同搜索模式,在搜索的三个功能上,技术含量是完全不同的。Google,baidu的技术含量要求最高;而酷讯模式的技术含量最低。

因为第一,酷讯根本不需要用爬虫分析未知网站,只需要人工对有限的分类信息宿主网站进行分析,然后爬虫定向抓取即可;(酷讯是否采用机器分析另说,我只是说明人工分析在此点上能达到同样效果);第二,索引这些宿主网站也不需要特别的策略,因为几个分类确定了,信息就很容易格式化,比如,租房无非就地点,房租,联系方式等等信息;最有趣的是第三――其实真正的搜索网站,对用户搜索请求的语义理解,技术含量非常高;但酷讯采取了两个“取巧”的方式,降低了这方面的技术难度:(1)“限定”用户的查询请求,以降低系统对用户语义解释的难度。以租房为例,提示用户输入名词的“地名”,这样系统对用户语义的解释就很容易了――但即使如此,酷讯做的也不好,比如,搜索“北三环”有1033条信息;而搜索同义的“北三环附近”只有143条信息;“北三环一带”只有7条信息;(2)网站列出了主要查询条件,类似分类,用来降低用户个性化查询请求的可能性,因此降低了系统语义解释的难度。同样以租房为例,酷讯通过几个最常用的分类推荐,实际上用户完全可能不用再搜索,只点选这几个“分类”即可,系统也就不用去理解用户的语义

通过如上分析可知,理论上,其实不太需要搜索技术,酷讯网站就可以被做出来。所以说酷讯是一个搜索概念的网站,看起来有点勉为其难,比较恰当的定位应是一个分类网站“mashup的轻量级应用”。

值得一提的是,酷讯比较引以为豪的一些“技术”,其实也恰恰是mashup的应用。比如,“拉框搜索”,即是分类和mapbar的地图服务的mashup;又比如,“世界上第一个会‘冒泡’的搜索引擎”,其实就是爬虫爬得勤快点,再加上页面的ajax就能解决――这些“世界第一”的技术,看起来“酷”,其实如上所述,真正从技术上看也都是轻量级的“花活儿”。

二、脆弱的产业链

也就是说,酷讯其实就是分类信息的用户入口网站,即用户如果要找相关分类信息,首先去酷讯,这个是目前酷讯的真实定位。这种垂直portal的定位,其实和新浪的新闻门户定位是一样的,只是新浪在产业链中的“宿主”是传统报纸,而酷讯在产业链中的宿主是:分类网站。

那么酷讯在分类信息产业链中,这样的定位合适吗?

要回答这个问题,我们先看看国外分类信息第一网站craigslist的遇到的两个案例:当craigslist成为最大的分类信息网站之后(请大家务必注意行业老大这个背景),craigslist允许housingmaps.com引用他们的数据,但是拒绝了另外一家Oodle。

对此,非常凑巧,我写此博客,搜索资料的时候发现,酷讯网站方就有一篇文章谈论此问题,摘抄如下:

。。。。。。一直有朋友关心,酷讯这种分类信息搜索与分类信息发布网站是否存在必然的对立和竞争关系,分类信息发布网站是否会因为利益冲突而拒绝分类信息搜索网站进入其网站获取数据呢?

粗看起来,这两类网站好象存在一定的竞争关系,而且朋友们一般都举美国垂直搜索网站Oodle 被craigslist 警告“希望不要再使用”来自其列表的信息的例子,来证明这种说法非常有根据。

但是,仔细分析后,就会发现这是一个伪命题。先说oodle与craigslist的故事。为什么craigslist并不屏蔽整合其信息的其他搜索引擎,而独独对oodle进行警告呢?只要看看oodle网站就知道了,——它把来自多个分类列表的信息汇聚在一个页面下,看起来简直就是第二个craigslist。这就好比google如果抓取雅虎的新闻,而表现形式又和雅虎新闻频道毫无区别,必然会被雅虎警告。这也只能说明,如果搜索引擎的业务模式与原信息提供者过度重叠,而不是另辟蹊径或有技术上的创新,那么势必会与原信息提供者形成冲突。

从craigslist 并不拒绝其他垂直搜索引擎(如housingmaps )整合其内容也可以看出,craigslist 在美国分类信息发布社区中虽然享有“一哥”的地位,却也无法抵挡互联网整合和共享的大趋势。从酷讯的用户行为分析调查也发现,用户并不是只停留在酷讯网站上面,几乎每位用户对于感兴趣的信息,都会点击进去看原数据网页。酷讯作为分类信息搜索门户给众多分类信息发布社区带去了活跃的用户。

从上面的分析中我们可以发现:分类信息搜索与分类信息发布这两种商业模式就像一对相互需要的寄生动物,相伴相生。。。。。。

这篇文章可以作为酷讯解释自己产业链位置的官方文章。他们也是对比了craigslist对待oodle和housingmap的区别;并认为这是“伪问题”。但有意思的,这个问题酷讯看来是“伪问题”,而我站在第三方的角度看来,却是最重要的问题。因为酷讯对这个“伪问题”的解释并不能说服人。

第一,craigslist对oodle的拒绝和对housengmaps的允许,根本原因是这两个网站对其“利益”的潜在威胁程度,而不只是界面表现形式,更不是什么“无法抵挡互联网整合和共享的大趋势”。Oodle.com的alexa排名4000多,是一个商业网站;houseingmaps的排名4万多,是一个非商业的个人网站――对于处于相对垄断的“一哥”地位craigslist,现在完全可以忽视housingmaps这样的非商业“玩闹”,但他们还不敢忽视oodle这样的商业网站。(如果houseingmaps真的火了,比如排名进入了alexa的前1000,我不认为craigslist还会对之视若无睹)

因为craigslist是大鱼,所以不妨对“小虾”网开一面,这是craigslist在处理上述事件时的竞争背景。但国内的情况完全不一样,国内分类信息网站和酷讯,基本还都是“小虾”阶段,谁也不能对对方视若无睹,正是你死我活竞争激烈的时候。

因此,国内分类信息网站考量上述craigslist案例时,只需想想两个问题:1,酷讯是非商业网站吗?2,国内的分类信息网站有哪一家现在已经如craigslist那样拥有产业链相对垄断的地位,因此可以无视“小虾”的存在?――这两个问题想清楚了,那么再看看下面酷讯是如何对待你们的。

第二,请国内分类网站的运营人员使用一下酷讯的“住房搜索”,它的结果页面项目如下:

“标题 户型 来源 面积 价格 联系方式 更新时间”

很明显,任何一个用户访问到此页面,通过这些信息,即可直接联系到房源提供人员,完成找房的需求,而没有必要再次访问宿主分类网站。即,恰恰和上述酷讯官方博客的说法相反,我观察到的是:用户到了酷讯,很多时候,其实完全没必要再访问宿主网站――酷讯本来只需隐藏“联系方式”,即可让用户访问宿主网站,但他们并没有这么做。

“互联网整合和共享的大趋势”,是啊,确实是大趋势――把有用的信息都全部直接整合到咱酷讯,这就是酷讯的“大趋势”啊!

第三,现在酷讯所有作为,都在促使形成这样一种用户使用习惯:当人们上网寻找分类信息,第一念头就想到去酷讯,而不是去58.com或别的分类网站。这实际上类似新浪这样的门户,只是酷讯垂直于分类信息行业。

因此,为了缓解和分类网站的冲突,酷讯辩解自己并不“发布”分类信息,似乎这样就不会抢58.com等宿主分类信息网站的饭碗。但这其实不符合逻辑。因为――如果按照酷讯的逻辑推演,必然会形成这样一种形态的产业链:用户浏览分类信息去酷讯,发布分类信息去分类网站;也就是说,“浏览/发布”分类信息被“割裂”成两类网站的行为。

世界上存在这样被“割裂”的分类信息网站吗?绝对不会!因为“分类信息”的传播是一个统一体,不可割裂;即使浏览和发布分属两类不同的人,但“分类信息”的传播会在同一网络环境完成――永远不可能有只做浏览的分类网站,或只做发布的分类网站。

也就是说,酷讯号称自己不“发布”分类信息,并不能解决他们和分类网站的真实利益冲突。所以我认为酷讯的商业逻辑是不能成立的,而按照酷讯现在的行为推演,将会可能出现的情况是:用户越来越把酷讯当作寻找分类信息的首选站――酷讯流量越来越大,影响力越来越大――相关宿主网站的浏览用户越来越少,流量越来越小(参考上一节,酷讯的搜索结果)――酷讯成为事实上最大的分类信息网站,即中国的craigslist

如果到了那一天,我觉得非常幽默的是:国外的craigslist成为“一哥”,是Craig独自一人,十年苦撑的结果;而酷讯成为“一哥”,是国内众多分类信息网站“众人拾柴火焰高”,大家一起成全了他――成全了一个“聪明”的mashup的轻量级网站。

三、博弈

说到底,酷讯的“聪明”在于用轻量级的技术,就轻松获得了一种博弈的优势地位。但这种优势地位不是稳定的,因为酷讯越强,其和分类网站群体的利益冲突就会越明显,而酷讯又“暂时”需要他们提高原始信息。

由于上面我们谈到,分类信息的传播不可能被“割裂”,所以酷讯和分类网站群体之间的暂时博弈均衡,必然只能以两种方式打破:

第一, 酷讯成长为行业“一哥”,足够强大,酷讯自己做分类信息“发布”

第二, 主要的分类网站联合起来,形成联盟,不让酷讯成长为“一哥”

我不认为这场博弈,还会有第三种结局。因为,我再一次重申:分类信息的传播不可能被“割裂”。

四、结语

我相信酷讯的朋友如果看了这篇文章,会有不同意见。在keso文章的留言中,我已经见识了一个署名“可笑”的酷讯fans对待批评意见的态度。我相信,在我的这篇文章出来后,酷讯的fans们会说:酷讯现在的做法,是方便了用户,真正为用户服务云云――就好像酷讯的官方博客中写的,“无法抵挡互联网整合和共享的大趋势”――酷讯的朋友们擅长用宏大的叙事,坚强的自我逻辑来证明自己网站的意义。

但同时,他们也会毫不客气地把发布者的“联系方式”呈现在搜索结果上,断绝了宿主网站最后一条活路。陈刚