本博客的参考文献: 《信息检索技术》 孙建军、成颖 科学出版社
百度百科
利用百度搜到的一份PDF(未署名: )
0. 信息检索的定义 (Information Retrieval)
信息检索是指信息用户为处理解决各种问题而查找、识别、获取相关事实、数据、文献的活动及过程。
信息检索研究是伴随着科学技术的发展和信息数量的剧增而兴起的研究领域。
信息检索的研究领域:
信息检索理论、信息检索语言、信息检索系统的构建及评价、信息检索技术与方法等。
1. 信息爆炸规律:
英国科学家詹姆斯.马丁认为:
人类的科学知识在19世纪70年代是每50年增加一倍, 20世纪中叶是每10年增加一倍, 在20世纪70年代就已经缩短到每5年增加一倍; 同时,信息分散,交叉引用频繁,人类信息的生产能力超过了人类对信息的处理、组织和吸收能力,从而产生了信息爆炸的危机。
2.信息检索技术的发展历史(简要) (手工检索和机械检索)
a. 手工检索 : 是一种传统而又基础的检索手段。
用手工的方式来处理和查找文献工具,如文摘、索引、目录、参考工具书等
优点是回溯性好,没有时间限制,不收费,缺点是费时,效率低。
b. 光盘检索
c. 联机检索
d. 网络信息检索
网络信息检索一般指因特网检索,是通过网络接口软件,用户可以在一终端查询各地上网的信息资源。这一类检索系统都是基于互联网的分布式特点开发和应用的,即:数据分布式存储,大量的数据可以分散存储在不同的服务器上;用户分布式检索,任何地方的终端用户都可以访问存储数据;数据分布式处理,任何数据都可以在网上的任何地方进行处理。
网络信息检索与联机信息检索最根本的不同在于网络信息检索是基于客户机/服务器的网络支撑环境的,客户机和服务器是同等关系,而联机检索系统的主机和用户终端是主从关系。在客户机/服务器模式下,一个服务器可以被多个客户访问,一个客户也可以访问多个服务器。因特网就是该系统的典型,网上的主机既可以作为用户的主机里的信息,又可以作为信息源被其他终端访问。
3. 信息检索的核心----信息获取能力
a.了解各种信息来源
b.掌握检索语言
c.熟练使用检索工具
d.能对检索效果进行判断和评价
判断检索效果的两个指标:
查全率 = 被检出相关信息量 / 相关信息总量 (%)
查准率 = 被检出相关信息量 / 被检出信息总量 (%)
4. 信息检索模型 (此处是我从PDF上截图获得的)
信息检索模型的数学形式和分类:
5. 信息检索(此处留空!)
阅读(1873) | 评论(0) | 转发(0) |