按类别查询搜索结果
关于关键词 的检测结果,共 1143
manshukwan | 2015-10-22 21:57:57 | 阅读(1290) | 评论(0)
5次等冪和8階幻方系列甲※※※※※※欣賞導航,5次等冪和8階幻方,是指由「類自然數」構造而成,而且兼具上下部份構成5次等冪和數組的「8階幻方」,現在,這類幻方已知有六款的幻和:幻和=4,幻和=8,幻和=16,幻和=32,幻和=64,幻和=128,這6款不同幻和的幻方,總數量合計起來達至20億個以上。以下展示的,是這6...【阅读全文】
OowarrioroO | 2015-10-12 11:13:28 | 阅读(1620) | 评论(0)
国际学术组织、学术会议与学术论文
国内学术组织、学术会议与学术论文
如何快速了解某个领域研究进展
初学者如何查阅自然语言处理(NLP)领域学术资料【阅读全文】
xiexiexielei | 2015-09-30 10:37:55 | 阅读(140) | 评论(0)
<p>本文转载于: http://www.36dsj.com/archives/8094<br />首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常难的一件事。要不也不会连大数据发源地——美国也不超出10个人(也许就5、6个)能达到这个层次,在中国……算...【阅读全文】
【大数据】 spark
hiyachen | 2015-09-18 19:38:12 | 阅读(2010) | 评论(0)
hiyachen | 2015-09-06 13:45:31 | 阅读(0) | 评论(0)
<p>http://blog.jobbole.com/54308/<br />数据科学是<a href="http://www.dataists.com/2010/09/a-taxonomy-of-data-science/" rel="nofollow">OSEMN</a>(和 awesome 相同发音),它包括获取(Obtaining)、整理(Scrubbing)、探索(Exploring)、建模(Modeling)和翻译(iNterpreting)数据。作为一名数据科学家,我用命令...【阅读全文】
Aquester | 2015-08-16 23:14:36 | 阅读(3480) | 评论(0)

10亿用户,同时在线用户1亿数据服务技术方案.pdf目录目录11. 一般方案1...【阅读全文】
simiaoxiaoseng | 2015-08-13 10:25:20 | 阅读(1380) | 评论(0)
python 机器学习的开发环境搭建(numpy,scipy,matplotlib)【阅读全文】
levy-linux | 2015-08-10 11:40:34 | 阅读(3310) | 评论(0)
有些时候需要尝试优化Hive的Map和Reduce数量,来达到最佳运行状态,根据实际情况进行数量调整,可以更快速的得到结果。<br /><br />1、增加map数量<br />首先调整上一步reducer生成文件数据,下面可以把reduce设置为160,即生成160个文件<br /><br />set mapred.reduce.tasks=160;<br />create table test as<br />s...【阅读全文】
niao5929 | 2015-08-03 21:20:28 | 阅读(610) | 评论(0)
<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">在 CentOS 7.1 上安装分布式存储系统 Ceph</h1></div><table width=...【阅读全文】
【大数据】 Spark 集群模概述
niao5929 | 2015-08-03 08:18:19 | 阅读(650) | 评论(0)
<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">Spark 集群模式概述</h1></div><table width="97%" align="center" s...【阅读全文】
niao5929 | 2015-07-30 00:03:23 | 阅读(1080) | 评论(0)
<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">如何配置一个 Docker Swarm 原生集群</h1></div><table width="97%" ...【阅读全文】
mingfei10 | 2015-07-28 16:31:25 | 阅读(1270) | 评论(0)

mapper.sh
点击(此处)折叠或打开...【阅读全文】
fhadmin24 | 2015-07-27 13:07:51 | 阅读(1180) | 评论(0)
<p>众所周知,java在处理数据量比较大的时候,加载到内存必然会导致内存溢出,而在一些数据处理中我们不得不去处理海量数据,在做数据处理中,我们常见的手段是分解,压缩,并行,临时文件等方法;</p><p>  例如,我们要将数据库(不论是什么数据库)的数据导出到一个文件,一般是Excel或文本格式的CSV;对于Excel来讲...【阅读全文】
mingfei10 | 2015-07-24 17:02:19 | 阅读(1400) | 评论(0)
<div class="summary" style="font-family:Helvetica, Tahoma, Arial, sans-serif;font-size:14px;white-space:normal;color:#333333;margin:0px 0px 1.5em;padding:5px 10px;background-color:#F7F7F7;"><strong>转自:<a href="http://qq85609655.iteye.com/blog/2035717">http://qq85609655.iteye.com/blog/2035717</a...【阅读全文】
mingfei10 | 2015-07-22 14:40:15 | 阅读(1480) | 评论(0)
转自:使用Python实现Hadoop MapReduce程序【阅读全文】
【大数据】 Storm ack的具体
1012191556 | 2015-07-21 12:03:12 | 阅读(3230) | 评论(0)
有关Storm的ack机制,详情大家可以参考&nbsp; <a target="_blank" href="http://blog.csdn.net/xeseo/article/details/17754825">http://blog.csdn.net/xeseo/article/details/17754825<br /><br /><span style="color:#000000;">在这里只说一下ack的具体实现(当然在这里继承的父类(storm API中的类 如IRichSpout)中不...【阅读全文】
zjmwqx | 2015-07-18 11:56:03 | 阅读(5600) | 评论(0)
GPU也可以做大规模的并行计算,但是对于维度很高的数据,如何处理并压缩也并不是很显然的事情,如果不处理压缩,怎么能放进多核GPU共享的显存?如果频繁在物理内存和GPU显存之间进行拷贝,瓶颈就不是计算了,而是CPU对内存的拷贝。所以对于存储密集型的计算,毫无疑问要选择分布式并行框架。随机梯度下降需要保存所有样本点...【阅读全文】
fengzhanhai | 2015-07-15 20:10:31 | 阅读(3860) | 评论(0)
机器学习书籍推荐
Deep Learning
机器学习数学基础【阅读全文】
niao5929 | 2015-07-13 14:43:57 | 阅读(830) | 评论(0)
虽然Hadoop在分布式数据分析方面备受关注,但是仍有一些开源软件提供了优于Hadoop平台的的优势,比如在实时计算、交互式和流式计算场景下MapReduce并不适合。这时恰恰Spark技术为了解决这样的问题应运而生,其是一种新生的可扩展的数据分析平台,它基于内存计算技术,所以相对于 Hadoop 的存储方法,它在性能方面更具优势。Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。【阅读全文】
wuxiaobo_2009 | 2015-07-12 12:29:53 | 阅读(1250) | 评论(0)
<p>本文转载于: http://www.36dsj.com/archives/8094<br />首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常难的一件事。要不也不会连大数据发源地——美国也不超出10个人(也许就5、6个)能达到这个层次,在中国……算...【阅读全文】