阿里巴巴是个快乐的青年
发布时间:2014-08-28 12:29:48
中文分词一直都是中文自然语言处理领域的基础研究,也是中文搜索引擎的核心模块之一。目前而言的分词系统绝大多数都是基于中文词典的匹配算法,其中,最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) ,而MM算法有三种:一种正向最大匹配、一种逆向最大匹配.........【阅读全文】
发布时间:2014-08-25 09:29:43
一、网页构成1、基本元素和树状结构 简单来讲,HTML网页就是一种使用HTML语言撰写的文档。但是,现在的网页基本上都是动态网页(Dynamic HTML),也就是网页可以出现动画,可以与用户交互,这就需要CSS样式语言和JavaScript语言,其中,JavaScript代码用来控制网页内部的逻辑,CSS.........【阅读全文】
发布时间:2014-08-21 13:15:20
http_load与apache ab是非常不错的服务器性能和压力测试工具,本文将简要介绍如何使用这两个工具。一、http_load1、简介 http_load以并行复用的方式运行,用以测试Web服务器的吞吐量与负载。但是它不同于大多数压力测.........【阅读全文】
发布时间:2014-08-20 13:03:43
互联网的海量数据信息,使得通用搜索引擎提供给用户的不相关信息太多,垂直搜索引擎专门针对某一类主题信息,以避免通用搜索引擎带来的“噪音”。 垂直搜索引擎通常由四个部分组成:信息采集模块、索引模块、查询模块和UI模块组成,换句话说.........【阅读全文】