据专业人士分析,Google的搜索数据可能用于电子商务。阿里巴巴收购雅虎,大力发展搜索业务,则是我们看到的事实。搜索的运用,不仅是我们普通用户输入关键词这么简单。事实上,从图书到求职网站,都在把搜索技术的追逐列为业务突破方向之一。
大家都纷纷给出自己对将来搜索引擎的进一步发展方向:
1、中文信息处理
百度公司副总裁刘建国在《中文搜索引擎技术未来展望》认为“中文语言的处理技术将得到进一步的发展,并会首先中文搜索引擎上得到大规模的应用。如果做中文的搜索引擎的话,对于中文的语言的处理,对中文语意的理解对信息的抽取必须达到一定的规模。”
由此可见,百度认为中文信息处理技术对中文搜索引擎的表现是关键性的因素。微软在北京一个研究人员就明确表态,搜索引擎表现与语种区别,至少在现阶段,并无明显的关系。
百度认为中文信息处理很重要,也是由他们立场所决定。在这方面相关的技术努力方向有:汉语语料库,中文分词技术,语义网,自然语言理解。道路很遥远,但对于将来发展占领至高点,是必需的。
2、个性化
上个月,搜索行业的主管在哈佛商学院的Cyberposium 会议上,都认为如何“说服用户共享更多的信息,才是个性化的关键。”提供更多更好的服务,让用户把该网站服务当成自己的家就对了。像Google提供邮箱,很自然地骗你个性化了自个儿搜索界面。日集月累的用户信息才是最宝贵的网站资本。雅虎把自己的各国分站帐号通用在从group到flickr各种服务上通用,都是个性化的坚强支持基础。
3、用户体验与用户需求
Jobui的创始人郑泽锋则认为“不要干扰用户的意图,培养用户的使用习惯和技巧……专注用户体验的改善,任何的宣传炒作都是空乏无意义的,搜索引擎的核心在于用户体验,你只要改善用户体验,比别人强一点点,那么其它人的炒作和宣传都在为你打工”。
4、垂直搜索引擎
对于内容的提取与组合是技术关键。
我列出这几点,不能说是没有任何倾向性。因为我自己曾经的论文题目叫《从用户中心论的角度,谈中文信息处理技术在中文搜索引擎中的重要性》,所以,立场决定眼光的局限性。我们老师在我完成题目后终于明确表达自己观点:搜索引擎发展到现在,如想进一步明显提高表现,已经进入一个平台期。包打天下的通用搜索引擎在表现上,将输给那些在语种上有针对性开发的搜索引擎或垂直搜索引擎。
要提高搜索引擎的表现,什么专家都用得着。计算机专家,情报学专家自然不必提,更有语言学,认知心理学,社会学,统计学......什么热门研究方向都可以进来为提高搜索引擎的表现掺一脚,机器学习、数据挖掘、模糊逻辑、语义网、自然语言识别、机器翻译……
但是,要澄明的一点,我个人反对动辄就提人工智能。能回答问题的机器人情报学家当然完美得像科幻小说。但是如不是用于商业炒作或表达一个抽象目标,在技术圈与商业圈内,最好说打算用人工智能的哪点儿边角技术来提高搜索引擎的表现。有个做过投资与媒体的文科生知识面很宽,听见我对搜索引擎感兴趣,给我推荐一个台湾的搜索软件,说是人工智能化的。我只好说,要不,明白告诉我这搜索倒底强在哪儿,现阶段就说人工智能化的搜索引擎我真的听不懂。(宁檬)