Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1201374
  • 博文数量: 259
  • 博客积分: 10
  • 博客等级: 民兵
  • 技术积分: 2518
  • 用 户 组: 普通用户
  • 注册时间: 2012-10-13 16:12
个人简介

科技改变世界,技术改变人生。

文章分类

全部博文(259)

发布时间:2016-02-17 14:37:44

今天处理一个nginx(版本nginx-1.8.0.tar.gz)的问题,访问网站的时候没有日志输出,同样部署两台机器,配置一样,一台有日志,一台没有日志,很奇怪,分析下配置文件,nginx开启了zip压缩,尝试注释下,重启nginx,访问日志出现了,    # 启用zip压缩    gzip on;    g.........【阅读全文】

阅读(2556) | 评论(0) | 转发(0)

发布时间:2016-02-16 16:08:21

使用LZO过程会发现它有两种压缩编码可以使用,即LzoCodec和LzopCodec,下面说说它们区别:LzoCodec比LzopCodec更快, LzopCodec为了兼容LZOP程序添加了如 bytes signature, header等信息如果使用 LzoCodec作为Reduce输出,则输出文件扩展名为".lzo_deflate",它无法被lzop读取;如果使用LzopCodec作为Reduce.........【阅读全文】

阅读(2507) | 评论(0) | 转发(0)

发布时间:2016-02-14 14:50:59

模型的开发周期有多个不同的阶段,从数据收集开始直到模型建立。不过,在通过探索数据来理解(变量的)关系之前,建议进行假设生成(hypothesis generation)步骤(如果想了解更多有关假设生成的内容,推荐阅读(why-and-when-is-hypothesis-generation-important)。我认为,这是预测建模过程中最被低估的一个步骤。花.........【阅读全文】

阅读(2327) | 评论(0) | 转发(0)

发布时间:2016-02-05 15:47:51

Python程序—九九乘法表点击(此处)折叠或打开#!/usr/bin/env python# -*- coding:UTF-8 -*-for i in range(1,10):    for j in range(i+1):        result.........【阅读全文】

阅读(2294) | 评论(0) | 转发(0)

发布时间:2016-02-05 09:30:14

#!/usr/bin/env python    # - coding:utf - 8 -*-import re,syswith open('access_test.log') as f:    for line in f:        parseip = re.search(r'(.*?) - - ', line)        parsetime = re.search(r' .........【阅读全文】

阅读(2634) | 评论(0) | 转发(0)

发布时间:2016-02-04 15:29:30

使用python将文件切分为两个文件#!/usr/bin/env python# -*- coding:UTF-8 -*-import os,sysN = 0.8lines = open('access_2013.log','r').readlines()#读取文件lines_for_b = int(len(lines)*N)#计算行数open('a.txt','w').write(''.join(lines[:lines_for_b]))#生成第一个文件open('b.txt','w').write(''.join.........【阅读全文】

阅读(2127) | 评论(0) | 转发(0)

发布时间:2016-02-03 16:15:23

近期公司Zookeeper得log文件将系统占用快满了,查看相关文档,从3.4.0开始,zookeeper提供了自动清理snapshot和事务日志的功能,通过配置 autopurge.snapRetainCount 和 autopurge.purgeInterval 这两个参数能够实现定时清理了。这两个参数都是在zoo.cfg中配置的,将其前面的注释去掉,根据需要修改日志保留个数:.........【阅读全文】

阅读(3403) | 评论(0) | 转发(0)

发布时间:2016-01-26 12:53:08

这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门?资源的取舍很让人纠结,我不得不努力从一个机器学习的程序员和初学者的角度去思考哪些资源才是最适合他们的。.........【阅读全文】

阅读(1836) | 评论(0) | 转发(0)

发布时间:2016-01-26 11:52:19

常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:http://www.cs.waikato.ac.nz/ml/weka/UCI收集的机器学习数据集ftp://pami.sjtu.edu.cnhttp://www.ics.uci.edu/~mlearn/\MLRepository.htmstatlibhttp://liama.ia.ac.cn/SCILA.........【阅读全文】

阅读(2052) | 评论(0) | 转发(0)

发布时间:2016-01-25 13:56:40

1、安装必要的包yum install lapack lapack-devel blas blas-develyum install numpyyum install scipy如果没有安装gcc,要先安装gcc 和g++yum install gcc  yum install gcc-c++  如果不安装lapack lapack-devel blas blas-devel 会报错(截取一部分):lapack_opt_info:  openblas_lapack_inf.........【阅读全文】

阅读(3589) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册