用户满意度和投资回报程度
信息分类学是网站开发人员的好伙伴,它可以帮助我们达成在设计网站时需要考虑的两个非常重要却又容易忽视的目的:用户满意度和投资回报程度。如果在设计时对信息分类考虑较少甚至不予考虑,那么就算效率再高的搜索引擎也难以圆满实现这两个目的。
信息搜索不论成功与否仍然存在问题
尽管近些年来搜索引擎技术越来越先进,但在互联网上的信息搜索不论成功与否仍然存在问题。使用过搜索引擎的人都有过这样的体验,有时候你什么结果也搜索不到,而有时候你会得到上百万条搜索结果。实际上,第二种结果更加难以处理,要想从百万条搜索结果中找到你真正需要的信息,简直是大海捞针。而目前互联网的蓬勃发展正在不断加重这种信息冗余的问题。就算是在信息量较少的企业内部网中,如果网站在开发前没有经过认真规划,同样会出现上述问题。
公众获取信息的途径
在互联网出现以前,公众获取信息或知识的一个主要途径就是图书馆。借助专业的信息检索,图书管理员知道如何通过布尔逻辑、加号、减号以及其他符号完成复杂的查询工作。这种复杂的查询依赖于对信息架构的正确分类和明确标记。但是当互联网兴起时,人们认为解决信息查询问题的方法就是将大量信息一股脑的抛到这个信息高速路上,而没有考虑该如何组织这些信息。
搜索引擎:辛苦搜集信息的工具
这种局面造就了搜索引擎,这个在整个互联网上辛苦搜集信息的工具。不幸的是,我们中的大多数人都没有受过图书管理方面的培训,无法准确告诉搜索引擎我们所需信息的关键词。而互联网在经过几年的迅速发展后,在我们面前的互联网已经成为了一个无边无际的电子信息海洋。它带给我们的好处就是超级丰富的信息量。然而由于没有良好的内容结构,我们无法在这些信息内容中快速找到所需信息,甚至根本就找不到所需信息,更糟的是也许我们找到的只是一堆不需要的东西,而我们却还在这堆垃圾中挑来拣去的寻找根本没有的东西。 [中国站长站]
缺乏结构性带来的问题
无结构性的互联网内容带来的问题无法用量化的标准来说明,因为借助搜索引擎,搜索者很少知道为什么会搜到这个结果或者这个信息来源何处。因此,我们将网络内容缺乏结构性带来的各种问题总结如下:
不成功的搜索所浪费的时间
由于搜索者无法找到所需信息,因此信息收集存储的投资回报很低,比如数据仓库和内容管理。
由于不完整或者不精确的信息造成的决策失误。
不成功的搜索给搜索者带来的不良体验会破坏公司形象、公司与客户/合伙人间的关系,以及内部人员的关系。
分类学给网站开发带来的益处
生命科学家用分类学将所有的生物进行有组织的分类。图书管理学家和信息科学家们也将这种技术和方法用于信息搜索和数据检索。借助于这种技术和方法,我们可以开发一种网络分类框架,将先前无法快速访问的容转换为具有结构性的Web内容以便于访问。
分类学牵扯到网站开发的很多方面
分类学牵扯到网站开发的很多方面,比如网站设计、内容管理以及网站内容的搜索过程。下面让我们具体来看看分类学是如何给这些方面带来益处的。
分类学给网站设计带来的益处
分类学具有两个方面:结构分类和视图分类。网站设计所涉及的更多的是视图分类,它通过将信息按主题分组达到将网站内容逻辑化的目的。在利用外观分类实施网站设计时,我们可以利用直观的组织和标识来建立一个有效的网站导航系统。当网站内容被合理的组织并有了清晰明了的标识后,网站访问者就可以轻松的导航和定位所需内容,这种体验可以有效提高访客的回头率。 中国站长_站,为中文网站提供动力
分类学给网站内容管理带来的益处
图书馆根据美国国会图书馆分类系统(Library of Congress Classification System)或者杜威图书分类系统(Dewey Decimal System)对书籍和杂志进行组织。每一项都用一系列标准属性来标记,比如图书编目号码、主标题、标题和作者等等。然后,这些书籍和杂志可以放心地入库,以后可用人工或计算机化的卡片编目来方便地检索。
同样,企业也可用结构分类来组织其信息资源如文档、网页等等。结构分类提供了一个层次化的分类系统,它基于一个已经定义好的范围和背景。在内容管理过程中,可采用结构分类的标准术语来统一分类及标记信息资源。在内容管理工作流中,内容管理员通过提供一个层次化的类别列表以推行分类结构。
内容管理系统
最终的结果就是,企业或公司范围内的所有信息都存储到一个内容管理系统中,而且每项信息都与一个或多个类别相关联。之后就可通过一个视图分类或者搜索引擎,在网上更有效地检索这些分类信息资源,这和传统的图书馆检索并没有多大的区别。内容管理系统最终的目标就是使企业的内容达到最大的可用性。因此将结构分类集成到内容管理过程中,就能改进内容管理系统的可用性。
分类学给网站搜索带来的益处
无论视图分类还是结构分类,在网站搜索过程的不同阶段都会被涉及。搜索执行之前,搜索引擎首先要遍历一个目标范围的内容,并为其建立索引。有的搜索引擎如Autonomy,可利用结构分类的方法通过对一个示范性的文档集进行分析来学习每个类别的特征。这种学习能力有助于对搜索结果的相关性进行精细的调节。
在搜索执行期间,结构分类可以通过网站的多级分层结构作为视图分类显示出来,就像Yahoo的目录列表那样。站点访问者可浏览每个类别的Web内容列表,或者向下深入到某个更具体的类别,再在该类别的范围中执行一次搜索。例如,他们可进入Computers & Internet → Software → Natural Language Processing类别后再执行搜索。
搜索执行后,搜索结果可根据一个或多个由系统定义的结构分类进行组织。例如,Convera‘s RetrievalWare可采取多种方式对搜索结果进行分类,比如按国家、语言或者主题等。这种分类能力显著缓解了信息汪洋的问题。你不再需要在返回的大量结果中逐个寻找所需的内容,只需按国家、语言或者主题等等进行筛选。例如,在Yahoo上搜索"content management system"会返回3790000个结果(2003年4月20日的搜索结果)。如果按主题对它们进行分类,比如按"最佳操作"、"工具"等等,就能快速找到最佳结果。
在Web搜索过程中全面集成分类学,可提供更有效的搜索体验。这将显著减少因搜索失败或查找错误信息所浪费的时间,从而可确保一个有效的决策过程。