2018年(273)
发布时间:2018-07-05 15:20:00
在OceanBase系统中,用户的读写请求,即读写事务,都发给MergeServer。MergeServer解析这些读写事务的内容,例如词法和语法分析、schcma检查等。对于只读事务,由MergeScrver 发给相应的ChunkServer分别执行后再合并每个ChunkServer的执行结果;对于读写事务,由MergeServer进行预处理后,发送给UpdateServer执行。读.........【阅读全文】
发布时间:2018-07-05 15:19:16
Step1: Exploratory Data Analysis每个feature的意义,feature的类型,比较有用的代码如下df.describe()df['Category'].unique()看是否存在missing valuedf.loc[df.Dates.isnull(),'Dates']每个特征下的数据分布,可以用boxplot或者hist来看%matplotlib inlineimport matplotlib.pyplot as plt.........【阅读全文】
发布时间:2018-07-05 15:18:34
一、作业一:星型模型及缓慢变化维对于问题一中建立星型模型所满足的要求:(1)公司每个员工每月的薪资分别是多少?(2)哪些部门每个月开出的薪资比较高?(3)哪种职称的每月得到的薪资比较高?我们对需求语义进行分析可知:事实表中的度量有:工资,时间;维度有:员工信息、部门信息、职称信息。其中sa.........【阅读全文】
发布时间:2018-07-05 15:17:05
一、读取csv文件为dataframe二、dataframe的数据概况三、取列数据四、取行数据五、取某一单元格数据六、缺失值处理七、归一化处理八、排序九、索引重新编号十、求均值十一、矢量化操作(批量操作)十二、透视表一、读取csv文件为dataframePandas很好的一点是,可以操作表文件。输出为dataframe格.........【阅读全文】