发布时间:2020-12-21 10:07:15
网站上的数据源是我们进行统计分析的重要信息源。当我们浏览网页,看到自己感兴趣数据内容时,希望能够快速抓取网页上的数据,这对于数据分析相关工作来说极其重要,也是必备的技能之一。但是网络数据抓取大多需要复杂的编程知识,操作也比较繁琐。这里介绍如何用集算器 S.........【阅读全文】
发布时间:2020-12-02 19:03:23
一. 字符串 1. 连接(1)两串相连 (2)串与任意类型相连 (3)序列成员相连 (4)序表成员相连 2. 拆分(1)拆分成字符序列.........【阅读全文】
发布时间:2020-12-02 19:02:17
将两个表或者多个表关联在一起是常见的运算,这时通常使用 SQL join 的方式进行关联并进行后续计算。但有时数据并不存储在数据库,而是以文件的形式存储在文件系统,单纯为了计算而把数据存储到数据库有点得不偿失。Python 的 Pandas 提供了丰富的关联运算函数,能更方便的完成文本文件间的关联计算,现在我们.........【阅读全文】
发布时间:2020-12-02 18:58:33
多维分析提供拖拽、旋转、切片、钻取等等人机交互操作,必须有秒级的响应速度。而这些操作对应的明细数据量非常巨大,如果在明细数据的基础上直接计算,速度会很慢,等待时间过长,是用户无法接受的。 图1:基于明细的OLAP响.........【阅读全文】