Chinaunix首页 | 论坛 | 博客

-

  • 博客访问: 4155478
  • 博文数量: 172
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 1923
  • 用 户 组: 普通用户
  • 注册时间: 2018-12-20 14:57
文章分类
文章存档

2021年(19)

2020年(81)

2019年(68)

2018年(4)

我的朋友

发布时间:2020-12-02 19:03:23

一. 字符串 1.    连接(1)两串相连 (2)串与任意类型相连 (3)序列成员相连 (4)序表成员相连 2.    拆分(1)拆分成字符序列.........【阅读全文】

阅读(1432) | 评论(0) | 转发(0)

发布时间:2020-12-02 19:02:17

将两个表或者多个表关联在一起是常见的运算,这时通常使用 SQL join 的方式进行关联并进行后续计算。但有时数据并不存储在数据库,而是以文件的形式存储在文件系统,单纯为了计算而把数据存储到数据库有点得不偿失。Python 的 Pandas 提供了丰富的关联运算函数,能更方便的完成文本文件间的关联计算,现在我们.........【阅读全文】

阅读(1637) | 评论(0) | 转发(0)

发布时间:2020-12-02 18:58:33

         多维分析提供拖拽、旋转、切片、钻取等等人机交互操作,必须有秒级的响应速度。而这些操作对应的明细数据量非常巨大,如果在明细数据的基础上直接计算,速度会很慢,等待时间过长,是用户无法接受的。         图1:基于明细的OLAP响.........【阅读全文】

阅读(1346) | 评论(0) | 转发(0)

发布时间:2020-11-26 10:57:23

在数据分析过程中,经常会处理文本文件中的结构化数据(txt,csv等),有时这些文件还会很大,计算机内存不足以一次性读入。这时,只能将数据分批读入内存,对每批数据计算出临时中间结果,分批处理完以后,再按照计算要求对分批处理结果进行恰当的汇总处理,与一次性装入内存的小文件数据计算有很大的不同。 .........【阅读全文】

阅读(1982) | 评论(0) | 转发(0)

发布时间:2020-11-18 14:48:40

在数据处理业务中,有时需要比较两个文本文件内容有哪些相同或不同的数据,本文将介绍文本文件比对的几种情况,如整行比对、关键列比对,同时又分小文件、大文件比对,并提供用 esProc SPL 编写的代码示例。esProc 是专业的数据计算引擎,SPL 中有一套完善的集合运算领域的函数库,做文件比对很方便,写出的代码非常简.........【阅读全文】

阅读(1588) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册