阿里巴巴是个快乐的青年
发布时间:2015-04-05 20:10:44
感谢关注我博客的朋友们,前18个月博客访问量突破80W大关,接下来的8个月再次增加80W,突破160W大关,平均日访问量超过2084,期待320W。。。加油!......【阅读全文】
发布时间:2015-02-21 18:11:36
一、格式 crontab格式如下: 分 时 日 月 星期 要执行的命令 第1列:分钟1~59 第2列:小时1~23(0表示子夜)&nbs.........【阅读全文】
发布时间:2015-01-26 21:07:22
一、简要介绍 word2vec是Google在2013年发布的一个开源项目,它能够将词表征为实数值向量的高效工具,采用的模型有CBOW(Continuous Bag-Of-Words,即连续的词袋模型)和Skip-Gram两种。word2vec项目详细信息请参见这里。 .........【阅读全文】
发布时间:2014-09-30 18:04:08
在网页解析,比如:爬虫应用中,网页内容的编码转换是一件令人头痛的事情。 比如:一般中文网页编码是gbk,用libcurl下载网页后,用C/C++代码解析网页内容时,看到的会是乱码,因为C/C++默认的编码是utf-8。 &nb.........【阅读全文】