Chinaunix首页 | 论坛 | 博客
  • 博客访问: 750342
  • 博文数量: 239
  • 博客积分: 60
  • 博客等级: 民兵
  • 技术积分: 1045
  • 用 户 组: 普通用户
  • 注册时间: 2009-03-22 18:25
文章分类

全部博文(239)

文章存档

2019年(9)

2018年(64)

2017年(2)

2016年(26)

2015年(30)

2014年(41)

2013年(65)

2012年(2)

分类: Oracle

2016-09-29 12:59:01

1、一个分析场景,分析某公司主账号登录的集中情况,数据源为一个月登录原始日志:
  1.        ID    MASTERLOGINID    USERNAME    PACKAGETIME    CLIENTIP    SERVERIP    APPLICATIONID    OPERATENAME    OPERATETYPE    RETURNCODE    LOG_TYPE    ORGNAME    CONTENT


2、各个字段的意思:
日志id,主账号,用户姓名,操作时间,客户端ip,服务器ip,应用系统id,操作名称,操作类型,返回码,日志类型,组织结构,操作内容
表结构:

  1. SQL> desc int_main_acct_login_100;
  2. Name Type Nullable Default Comments
  3. ------------- -------------- -------- ------- --------
  4. ID VARCHAR2(64)
  5. MASTERLOGINID VARCHAR2(50) Y
  6. USERNAME VARCHAR2(64) Y
  7. PACKAGETIME VARCHAR2(64) Y
  8. CLIENTIP VARCHAR2(32) Y
  9. SERVERIP VARCHAR2(256) Y
  10. APPLICATIONID NUMBER Y
  11. OPERATENAME VARCHAR2(1024) Y
  12. OPERATETYPE VARCHAR2(1024) Y
  13. RETURNCODE VARCHAR2(1024) Y
  14. LOG_TYPE VARCHAR2(32) Y
  15. ORGNAME VARCHAR2(1024) Y
  16. CONTENT VARCHAR2(4000) Y
  17.  
  18. SQL>
3、执行分析,查看每分钟、每天的登录数量:

  1. select to_char(to_date(t.packagetime,'yyyy-mm-dd hh24:mi:ss'), 'yyyy-mm-dd hh24'),count(t.operatetype) from int_main_acct_login_100 t group by to_char(to_date(t.packagetime,'yyyy-mm-dd hh24:mi:ss'), 'yyyy-mm-dd hh24')
  2.  order by to_char(to_date(t.packagetime,'yyyy-mm-dd hh24:mi:ss'), 'yyyy-mm-dd hh24');
  3.        TO_CHAR(TO_DATE(T.PACKAGETIME,    COUNT(T.OPERATETYPE)
  4. 1    2016-05-01 00    62
  5. 2    2016-05-01 01    41
  6. 3    2016-05-01 02    34
  7. 4    2016-05-01 03    36
  8. 5    2016-05-01 04    40
  9. 6    2016-05-01 05    37
  10. 7    2016-05-01 06    70
  11. 8    2016-05-01 07    469
  12. 9    2016-05-01 08    1001
4、存在的问题和解决方案:
由于部分时间(某些小时、某些分钟、某些天)没人登录,最终产生的数据的时间不连续,图表的效果不好,根据和厂商一个开发人员沟通,创建一个常量的表,通过这个表进行两个表关联左连接查询就可以了:
创建该表的话,通过存储过程来处理:
首先创建表结构:

  1. create table yk_tb_time(mtime timestamp,pid number);
#oracle时间运算:
当前系统日期加1天:
select to_date(sysdate,'YYYY-MM-DD') +1 from dual;
当前系统日期加1分钟:
select sysdate + 1/1440 from dual;
其中1440=1/(24*60)是一天之一分钟

对varchar类型的“时间”转成时间时(oracle中varchar类型的日期格式转换date类型 )必须写全:to_date(t.packagetime,'yyyy-mm-dd hh24:mi:ss'),要添加时分秒,不能写成to_date(t.packagetime,'yyyy-mm-dd hh24'),然后再进行to_char处理:to_char(to_date(t.packagetime,'yyyy-mm-dd hh24:mi:ss'), 'yyyy-mm-dd hh24')
创建存储过程:
  1. create or replace procedure pro_yk_tb_time is
  2. i number :=0;
  3. begin
  4.   while i <744 loop
  5.     --select to_date('2016-5-1 0:0:1','yyyy-mm-dd hh24:mi:ss')+i/24 into ttime from dual;
  6.     insert into yk_tb_time values(to_date('2016-5-1 0:0:1','yyyy-mm-dd hh24:mi:ss')+i/24,yk_seq.nextval);
  7.     i:=i+1;
  8.   end loop;
  9. --24 * 30 = 720,31day;
  10.     --dbms_output.put_line(to_char(sysdate,'yyyy-mm-dd HH24:mi:ss'));
  11.     commit;
  12. end pro_yk_tb_time

检查:
select to_char(s.mtime,'yyyy-mm-dd hh24') from yk_tb_time s;
       TO_CHAR(S.MTIME,'YYYY-MM-DDHH2
1    2016-05-01 00
2    2016-05-01 01
3    2016-05-01 02
4    2016-05-01 03
5    2016-05-01 04
6    2016-05-01 05
7    2016-05-01 06
8    2016-05-01 07
9    2016-05-01 08

最终版的sql脚本:
我的全量、常量信息表yk_tb_time要放到前面,因为我用的是左连接,如果放后面的话,下面提到的13号那行就出不来了:
  1. select to_char(s.mtime,'yyyy-mm-dd'),count(t.packagetime) from yk_tb_time s left join int_main_acct_login_100 t
  2. on to_char(to_date(t.packagetime,'yyyy-mm-dd hh24:mi:ss'), 'yyyy-mm-dd')=to_char(s.mtime,'yyyy-mm-dd') group by
  3. to_char(s.mtime,'yyyy-mm-dd') order by to_char(s.mtime,'yyyy-mm-dd');
  4.        TO_CHAR(S.MTIME,'YYYY-MM-DD')    COUNT(T.PACKAGETIME)
  5. 1    2016-05-01    197640
  6. 2    2016-05-02    166488
  7. 3    2016-05-03    428592
  8. 4    2016-05-04    306288
  9. 5    2016-05-05    494160
  10. 6    2016-05-06    481416
  11. 7    2016-05-07    216816
生成图表来看5月份登录数量(13号那天没人登录数据,可能其他天某些分钟也没有;如果不这么弄,那么可以12、14号就是连续的,很难看出来中间有一天没人登录,这可能是有问题的):

之前写的以分钟为单位的图表:

根据图表,就可以看出登录频次多的时间了,设置一个阈值,就可以进一步生成分析结构了。

阅读(1231) | 评论(0) | 转发(0) |
0

上一篇:python numpy教程

下一篇:深入理解RCU实现

给主人留下些什么吧!~~