按类别查询搜索结果
关于关键词 的检测结果,共 1134
644924073 | 2014-12-03 12:31:12 | 阅读(1050) | 评论(0)
本文讨论Apache Hadoop大数据工具及技术,帮助有效管理实时的大数据,并讨论Apache Hadoop大数据分析的优缺点。帮助企业认识Hadoop,在选择Hadoop技术方案上做出抉择。一、什么是大数据分析工具及技术Hadoop是目前的处理和存储海量数据的最佳工具。Hadoop可以利用数百台甚至数千台计算机处理大数据问题,而不是使用...【阅读全文】
【服务器与存储】 【原创】hadoop集群搭建
c8813q | 2014-11-29 13:34:23 | 阅读(510) | 评论(0)
首先确定hdfs分布式文件系统目前很多大公司都在用,例如百度、腾讯、淘宝等。相信网上也有很多关于这方面的文档,我写这篇文章只是为了自己更加深刻的学习和理解,或者帮助一些不会搭建的童鞋们!有问题请加群234086986讨论!以前我搭建的是hadoop-0.20.2、hbase-0.90.4、hbase自带的zookeeper,但是经过与开发测试后,用...【阅读全文】
hiyachen | 2014-11-28 19:59:35 | 阅读(7750) | 评论(1)
二度人脉算法:Hadoop实现【阅读全文】
644924073 | 2014-11-28 13:02:38 | 阅读(720) | 评论(0)
《Hadoop五分钟入门指南》原文见:http://blog.josedacruz.com/2013/12/09/hadoop-in-5-minutes-for-beginners/#.Uqhs3_Q6Cjt如果你有大量的数据(TB级),而且这些数据到处分散,且有些数据是结构化的,有些数据不是。你想查询这些数据,你或许在想,“我需要力量来组织和查询这些数据”。是的,你需要Hadoop。一、...【阅读全文】
Hadoop思数云 | 2014-11-27 11:35:38 | 阅读(580) | 评论(0)
 今天,企业对数据价值的认同已经成为共识,然而如何从海量的数据信息中挖掘其中的价值却并不那么容易,幸运的是,找到了hadoop数据挖掘与分析工具。 Hadoop是一个开源的分布式系统基础架构,由Apache基金会开发,使得用户可以在不了解分布式底层细节的情况下,开发分布式应用程序,充分利用集群的威力实现高速运算...【阅读全文】
9768p1 | 2014-11-26 20:24:04 | 阅读(2620) | 评论(0)
自己用python写了个mapreduce程序,结果运行时候一直报错;运行命令:点击(此处)折叠或打开hadoop jar /usr/lib/hadoop-0.20/contrib/streaming/hadoop-streaming-0.20.2-cdh3u6.jar -mapper /Application/lianshuchengjin/MR/map.py -reducer /Application/lianshuchengjin/MR/reduce.py -...【阅读全文】
dxm2025 | 2014-11-19 17:13:32 | 阅读(1130) | 评论(0)
在线拍卖网站eBay开源了其名为Kylin的数据库技术,该公司表示这套方案能够对保存在Hadoop当中的PB级数据集进行快速查询。与谷歌以 及Facebook等企业相比,eBay并不能算是大数据用户,但该公司确实也在以相当可观的规模运行着Hadoop等技术方案,而Kylin项目似乎正 是其以此为基础实现技术创新的一个绝佳实例。...【阅读全文】
Hadoop思数云 | 2014-11-19 13:38:39 | 阅读(390) | 评论(0)
大数据时代,数据成为决策最为重要的参考之一,数据分析随着大数据概念的普及而日益得到重视,数据分析行业迈入了一个全新的阶段。数据分析的软件如雨后春笋般地涌现,其中R软件的发展备受瞩目。R是一个免费开源软件,它提供了首屈一指的统计计算和绘图功能,尤其是大量的统计分析、数据挖掘方面的算法包,使得...【阅读全文】
zgdong1 | 2014-11-19 10:25:34 | 阅读(960) | 评论(0)
在线拍卖网站eBay开源了其名为Kylin的数据库技术,该公司表示这套方案能够对保存在Hadoop当中的PB级数据集进行快速查询。与谷歌以 及Facebook等企业相比,eBay并不能算是大数据用户,但该公司确实也在以相当可观的规模运行着Hadoop等技术方案,而Kylin项目似乎正 是其以此为基础实现技术创新的一个绝佳实例。eBay...【阅读全文】
圣剑蓝骑士 | 2014-11-02 21:53:49 | 阅读(1700) | 评论(0)
转载自:http://www.cnblogs.com/beanmoon/archive/2013/01/05/2845579.html         由于hadoop主要是部署和应用在linux环境中的,但是目前鄙人自知能力有限,还无法完全把工作环境转移到linux中去(当然还有点小私心啦,windows下那么多好用的程序到linux下用不了还真有点...【阅读全文】
【HADOOP】 hadoop文件操作
hxl | 2014-10-29 14:13:10 | 阅读(0) | 评论(0)
点击(此处)折叠或打开package com.hxl;import java.util.Date;import java.text.SimpleDateFormat;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataOutputStre...【阅读全文】
【HADOOP】 hadoop日常管理
hxl | 2014-10-29 11:29:13 | 阅读(0) | 评论(0)
1.查看目录[hadoop1@node1 ]$ hadoop fs -ls .    //跟目录[hadoop1@node1 ]$ hadoop fs -ls /user/hadoop1/input  //具体某个目录【阅读全文】
dsy851009 | 2014-10-22 18:35:06 | 阅读(9840) | 评论(3)
自己用python写了个mapreduce程序,结果运行时候一直报错;运行命令:点击(此处)折叠或打开hadoop jar /usr/lib/hadoop-0.20/contrib/streaming/hadoop-streaming-0.20.2-cdh3u6.jar -mapper /Application/lianshuchengjin/MR/map.py -reducer /Application/lianshuchengjin/MR/reduce.py -...【阅读全文】
圣剑蓝骑士 | 2014-10-16 22:23:37 | 阅读(2870) | 评论(0)
       hadoop.tmp.dir是hadoop文件系统依赖的基础配置,很多路径都依赖它。它默认的位置是在/tmp/{$user}下面,但是在/tmp路径下的存储是不安全的,因为linux一次重启,文件就可能被删除。           先说说,场景,在开发环境中,...【阅读全文】
liuzan_abc | 2014-10-11 14:31:06 | 阅读(1130) | 评论(0)
     mapreduce的缺陷        (1)只能做简单的统计计算,很多复杂的算法没法表达        (2)mr的过程中做了很多无效的排序,其他的计算模型获取可以省去这些无效的计算        (3)mr启动任务需要花费时间,对于一些小当量的计算,还不如拉回...【阅读全文】
rocky2014 | 2014-10-04 15:06:49 | 阅读(340) | 评论(0)
Spark视频第1期:Spark亚太研究院决胜云计算大数据时代:100期Spark公益大讲堂之革命Hadoop Spark把云计算大数据速度提高100倍以上【阅读全文】
【HADOOP】 hadoop cdh5安装
gagagixi | 2014-09-29 21:06:52 | 阅读(2050) | 评论(0)
为满足公司程序运行环境,hadoop集群由原来的1.0版本升级到CDH5版本,又一次集群安装经历,分享给有需要的人。一、机器准备    Linux版本CentOs 5.8,x86_64,如果你的linux版本是6.x,也可以参照下面步骤安装;本人此次安装共准备了5台机器:192.168.32.70(master),192.168.32.71(slave...【阅读全文】
lorine168 | 2014-09-26 14:35:04 | 阅读(720) | 评论(0)
深入理解Hadoop集群和网络本文将着重于讨论Hadoop集群的体系结构和方法,及它如何与网络和服务器基础设施的关系。最开始我们先学习一下Hadoop集群运作的基础原理。AD:2014WOT全球软件技术峰会北京站 课程视频发布 云计算和Hadoop中网络是讨论得相对比较少的领域。本文原文由Dell企业技术专家Brad He...【阅读全文】
【HADOOP】 hadoop cdh5安装
dsy851009 | 2014-09-25 16:18:28 | 阅读(19220) | 评论(2)
为满足公司程序运行环境,hadoop集群由原来的1.0版本升级到CDH5版本,又一次集群安装经历,分享给有需要的人。一、机器准备    Linux版本CentOs 5.8,x86_64,如果你的linux版本是6.x,也可以参照下面步骤安装;本人此次安装共准备了5台机器:192.168.32.70(master),192.168.32.71(slave...【阅读全文】
zzjlzx | 2014-09-19 16:41:23 | 阅读(2560) | 评论(0)
Hadoop :实践环节–故意造成数据块丢失分类: Hadoop2014-01-21 16:19 311人阅读 评论(0) 收藏 举报目录(?)[+]使用以下步骤连续杀死3个DataNode:使用下列命令重启所有节点: $ start-all.sh...【阅读全文】