卡巴斯基实验室宣布已于2009年1月13日获得联邦知识产权、专利及商标处颁发的专利,在俄罗斯注册了世界尖端的反垃圾邮件技术专利。该技术能够有效、深入地检测到图片中的垃圾信息。
该项领先技术由卡巴斯基实验室的反垃圾邮件研发组经理、该技术的研发人员Eugene Smirnov研发,能够有效地识别和检测光栅图像中的文本和垃圾信息,而不需要机器识别图片技术的辅助。该技术能实现高速检测,并且能识别几乎所有的文本语言。
卡巴斯基称,当今的反垃圾邮件过滤器对于检测文本中的垃圾信息没有什么困难,所以现在很多垃圾邮件散布者经常使用隐匿技术将垃圾信息藏于图片中。而过滤图片中的垃圾信息比过滤文本中的要远远复杂得多。在反垃圾邮件过滤器判断一段文本中的信息是否为垃圾信息前,必须要能够检测到图片中隐藏的文本信息。而大部分用于检测图片中文本信息的方法都依靠于机器识别图片技术。但机器识别技术对于其中符号的大小、风格和布局都要求很高的统一性。垃圾邮件发布者正是利用机器识别技术这一局限性,故意在图片中进行扭曲并制造“干扰,从而使得识别变得更困难。
卡巴斯基的这项新专利技术基于概率和数理统计方法。一个图片中是否包含文字信息,取决于图片中的图案的布局是否组成单词和句子,以及这些字母和单词组成的内容。专用的过滤器能够保证系统不受图片中干扰元素或者文本碎片的影响。而该技术中独特的文本行识别方法又能够有效地对付图片垃圾邮件中使用的干扰技术,如图形扭曲或者旋转等。同时,新的反垃圾邮件系统还能够通过比较其自身数据库中的垃圾邮件模板,从而有效地判定检测到的文本是否为垃圾信息。
标签: