阿里巴巴是个快乐的青年
发布时间:2014-09-10 19:14:32
一、原理 Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer,例如:采用shell脚本语言中的一些命令作为mapper和reducer(cat作为mapper,wc作为reducer) $HADOOP_HOME/.........【阅读全文】
发布时间:2014-09-02 12:19:52
一、从servlet容器说起 Servlet容器有很多种实现,比如:Jetty、Tomcat,这里以Tomcat为例介绍。在Tomcat的容器等级中,Context容器直接管理Servlet在容器中的包装类Wrapper,所以Context容器如何运行将直接影响Servlet的工作方式。Tomcat容器模型如下图: .........【阅读全文】
发布时间:2014-08-28 12:29:48
中文分词一直都是中文自然语言处理领域的基础研究,也是中文搜索引擎的核心模块之一。目前而言的分词系统绝大多数都是基于中文词典的匹配算法,其中,最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) ,而MM算法有三种:一种正向最大匹配、一种逆向最大匹配.........【阅读全文】