创建分析表,搜集数据 这一步基本是最花时间的,这时候就是考量你的数据平台、数据仓库的时候了,仓库集成的好,平台易用的话时间应该不用太长。
CREATE TABLE xx_user_analyze (
user_id BIGINT (20) DEFAULT NULL,
is_reserve SMALLINT (6) NOT NULL DEFAULT '0',
is_view SMALLINT (6) NOT NULL DEFAULT '0',
view_cnt INT (11) NOT NULL DEFAULT '0',
amt DOUBLE NOT NULL DEFAULT '0',
mb_amt DOUBLE NOT NULL DEFAULT '0',
mb_cnt INT (11) NOT NULL DEFAULT '0',
xx_mb_cnt INT (11) NOT NULL DEFAULT '0',
xx_mb_amt DOUBLE NOT NULL DEFAULT '0',
amt_2016 DOUBLE NOT NULL DEFAULT '0',
mb_amt_2016 DOUBLE NOT NULL DEFAULT '0',
mb_cnt_2016 INT (11) NOT NULL DEFAULT '0',
xx_mb_cnt_2016 INT (11) NOT NULL DEFAULT '0',
xx_mb_amt_2016 DOUBLE NOT NULL DEFAULT '0',
first_pur_time datetime DEFAULT NULL,
last_pur_time datetime DEFAULT NULL,
last_pur_time_seg DECIMAL (10, 2) DEFAULT NULL,
user_level INT (11) NOT NULL DEFAULT '0',
use_model INT (11) NOT NULL DEFAULT '0',
KEY IDX_USER_ID (user_id)
) ENGINE = INNODB DEFAULT CHARSET = utf8;
第四步数据分析:我是把数据导入到superset/caravel进行分析的(这个工具个人有篇文章介绍过,非常不错的一个数据探查、数据分析工具再次推荐下),其实用excel也非常好,只是对excel的有些处理不是很擅长。