2、加载数据 下载数据:wget .grouplens.org/datasets/movielens/ml-100k.zip
解压:unzip ml-100k.zip 加载数据:LOAD DATA LOCAL IN PATH '/home/xxxx/ml-100k/u.data' OVERWRITE INTO TABLE u_data;
3、查询数据是否load进表 select * from u_data limit 10;
4、建立python脚本 此脚本主要清洗数据集中的时间戳,将时间戳转化为字符串日期时间,提取日期时间中的星期值。脚本命名为transform.py