狂甩酷拽吊炸天
发布时间:2019-09-04 18:58:26
Superset 提供了两种分析数据源的方式:2. 一个 SQL 的 IDE 供高级分析师使用 SQL 查询定义所需要分析的数据集,这种方法使用户在一个查询中实现用 Superset 查询数据源的多表,并立即对查询进行可视化分析。kylin是一个OLAP的查询分析引擎,主要思想是预计算,号称可以达到毫秒甚至亚秒级的查询速度,关于这两个.........【阅读全文】
发布时间:2019-08-27 15:34:55
总所周知,spark中有两种算子:转换 和 行动 算子,面试的时候可能会被问到,今天就将他们一一列举:Transform转换算子:map、flagMap、distinctcoalesce、repartitionrandomSplit、glomunion、intersection、subtractmapPartitions、mapPartitionsWithIndexzip、zi.........【阅读全文】
发布时间:2019-08-21 10:42:38
作为一名数据开发工程师,定时任务调度是日常工作中必不可少的,在日常工作中可能会遇到如下问题: run.sh 启动脚本,可能依赖诸多脚本,如下为我的脚本依赖 点击(此处)折叠或打开[xxxxxxxxxxxx]$ more run.sh #!/bin/bashsourc.........【阅读全文】
发布时间:2019-08-16 16:14:32
最近在写java,由于之前一直写python,对java知之甚少,也不用maven,今天用maven打jar包,各种坎坷,有打不进去依赖的,有maven报ERROR的,网上的资料零零碎碎,黏贴进pom文件各种报错,下面总结一下我正确的打依赖jar包方式,pom文件如下:点击(此处)折叠或打开<?xml version="1.0" encod.........【阅读全文】
发布时间:2019-08-14 17:53:12
Spark 2.4Spark 2.4《Apache Spark 2.4 正式发布,重要功能详细介绍》1 针对数组类型的函数1.1 array_distinct1.2 array_intersect1.3 array_union1.4 array_except1.5 array_join.........【阅读全文】