基于内存的大数据分析工具Spark部署方法

海纳百川fengzhanhai.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

fengzhanhai

博客访问： 5606255
博文数量： 348
博客积分： 2173
博客等级：上尉
技术积分： 7900
用户组：普通用户
注册时间： 2011-08-24 17:26

个人简介

雄关漫道真如铁，而今迈步从头越。

文章分类

全部博文（348）

文章存档

2022年（4）

2020年（6）

2019年（2）

2018年（2）

2017年（34）

2016年（49）

2015年（53）

2014年（47）

2013年（72）

2012年（79）

我的朋友

最近访客

推荐博文

基于内存的大数据分析工具Spark部署方法

发布时间：2015-07-11 21:51:34

虽然Hadoop在分布式数据分析方面备受关注，但是仍有一些开源软件提供了优于Hadoop平台的的优势，比如在实时计算、交互式和流式计算场景下MapReduce并不适合。这时恰恰Spark技术为了解决这样的问题应运而生，其是一种新生的可扩展的数据分析平台，它基于内存计算技术，所以相对于 Hadoop 的存储方法，它在性能方面更具优势。Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。......【阅读全文】

阅读(5386) | 评论(0) | 转发(1)

强大的文本处理工具AWK使用详解

发布时间：2015-06-24 11:50:58

awk是一款非常强大的文本分析工具，掌握awk的一些基本的用法对于我们提高的日常的系统管理和维护工作的效率有着非常大的帮助。那么今天我们就来看一下awk的一些具体用法和示例，希望对Linux和Unix相关的从业人员有所帮助和启发。......【阅读全文】

阅读(4131) | 评论(0) | 转发(1)

LVS应用笔记——基础

发布时间：2015-06-23 16:06:59

......【阅读全文】

阅读(4117) | 评论(0) | 转发(0)

Cassandra分布式NoSQL数据库安装部署指导

发布时间：2015-06-01 22:41:56

Apache Cassandra是一套开源分布式 Key-Value 存储系统。它最初由 Facebook 开发用于储存特别大的数据。Cassandra适合于实时事务处理和提供交互型数据。Cassandra的数据模型是基于列族（Column Family）的四维或五维模型。它借鉴了 Amazon 的 Dynamo 和 Google's BigTable 的数据结构和功能特点，采用 Memtable 和 SSTable 的方式进行存储。在 Cassandra 写入数据之前，需要先记录日志 ( CommitLog )，然后数据开始写入到 Column Family 对应的 Memtable 中，Memtable 是一种按照 key 排序数据的内存结构，在满足一定条件时，再把 Memtable的数据批量的刷新到磁盘上，存储为SSTable。本文主要来介绍一下关于Cassandra的安装配置方法。......【阅读全文】

阅读(6139) | 评论(0) | 转发(2)

DB2和Oracle区别

发布时间：2015-05-27 22:29:08

......【阅读全文】

阅读(5136) | 评论(0) | 转发(0)

给主人留下些什么吧！~~

demaple2015-01-26 20:01

对于DB2 CLI编程来说，能够在父进程活动数据库连接，子进程获取使用后再释放给父进程吗

回复　　| 　举报

mqy198712012-10-26 10:53

大侠，我想在aix系统上装tomcat5.5，你有JDK和TOMCAT的安装包吗，系统现在还不知道是几位的，所以希望您能把32位的也发给我一份，qq：563783983，不胜感激！！！！！
Java5_64.sdk.tar
apache-tomcat-5.5.31.tar

回复　　| 　举报

留言热议

请登录后留言。

登录注册

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6