迷彩 潜伏 隐蔽 伪装
发布时间:2013-01-15 15:55:05
ORACLE_SID 区分大小写 Linux 环境下 ORACLE_SID 区分大小写,太久没用今天装系统被坑了半小时。完。---------------------错误现象:sqlplus /nologSQL> conn sys/xxx as sysdbaERROR:ORA-01031: insufficient privilegesoracle 密码有两种,普通用户密码保存在数据库,sysdba角色用户才能启动数据库,【鸡生蛋蛋生鸡】使用 sys/xxx as sysdba 登陆时是使用密码文件验证密码文件存在于 /opt/oracle/product/11.2.0/dbh......【阅读全文】
发布时间:2013-01-15 15:53:10
linux 下,strace是很好的调试工具。strace常用来跟踪进程执行时的系统调用和所接收的信号.跟踪进程:strace -p 进程号。结合gdb 等可很好的分析程序core dump......【阅读全文】
发布时间:2013-01-15 15:49:23
应用场景: 同一个集群内有些服务器磁盘 2T,有些服务器 500G,2T 的服务器磁盘得不到有效利用,这是就需要对 500G 的磁盘做限额配置. 配置方法: 在 hdfs-site.xml 里配置如下参数,注意,那个 value 的值是配置该磁盘保留的DFS不能使用的空间大小,单位是字节. (如果多块硬盘,则表示为每块硬盘保留这么多空间) <property> <name>dfs.datanode.du.reserved</name> <!-- cluster variant --> <value>236223......【阅读全文】
发布时间:2013-01-15 15:49:09
hadoop的使用中,一般只关注运行结果。对于mapper和reducer之间的处理逻辑往往不care。比如key-value对到达reducer的先后顺序等目前接触到的运用场景有:1.根据用户操作时间来整理事件链,在网站分析里比较常用。需要按时间先后顺序来处理,如果过亿的访问操作全在reducer里来排序,对计算能力和内存都是一个挑战。2.海量数据处理中,求去重distinct这种操作,往往需要先缓存很大的数据集,对单个reducer的内存要求很高,特别是上亿的数据时,很容易就撑爆内存。这里如果在reducer进入前就排好序,后续处理就简单的多。二次排序相当于把一个reducer的负载推给了......【阅读全文】