搜索博文结果_ChinaUnix博客

博客首页博客专家往日推荐博客文集

热搜： Android Java C++ Mysql MongoDB ubuntu Hyper-V 信息

博客首页〉搜索结果

按类别查询搜索结果

操作系统程序设计数据库热点技术综合架构与运维移动开发与应用 Web前端

虚拟化| 云计算| 大数据| HADOOP| 高性能计算|

关于关键词的检测结果，共 1143 条

【大数据】 5次等冪和8階幻方系列甲

manshukwan | 2015-10-22 21:57:57 | 阅读(1290) | 评论(0)

5次等冪和8階幻方系列甲※※※※※※欣賞導航，5次等冪和8階幻方，是指由「類自然數」構造而成，而且兼具上下部份構成5次等冪和數組的「8階幻方」，現在，這類幻方已知有六款的幻和：幻和=4，幻和=8，幻和=16，幻和=32，幻和=64，幻和=128，這6款不同幻和的幻方，總數量合計起來達至20億個以上。以下展示的，是這6...【阅读全文】

【大数据】初学者如何查阅自然语言处理（NLP）领域学术资料

OowarrioroO | 2015-10-12 11:13:28 | 阅读(1620) | 评论(0)

国际学术组织、学术会议与学术论文
国内学术组织、学术会议与学术论文
如何快速了解某个领域研究进展
初学者如何查阅自然语言处理（NLP）领域学术资料【阅读全文】

【大数据】如何修炼成大数据高手？推荐你看这些书

xiexiexielei | 2015-09-30 10:37:55 | 阅读(140) | 评论(0)

<p>本文转载于： http://www.36dsj.com/archives/8094<br />首先声明一点，千万不要以为看了这篇文章就能成为大数据高手了，不然就不会用“修炼”这个词了，要修炼成大数据高手决不是件容易的事，可以说是非常难的一件事。要不也不会连大数据发源地——美国也不超出10个人（也许就5、6个）能达到这个层次，在中国……算...【阅读全文】

【大数据】 spark学习

hiyachen | 2015-09-18 19:38:12 | 阅读(2010) | 评论(0)

spark学习【阅读全文】

【大数据】七个用于数据科学(data science)的命令行工具

hiyachen | 2015-09-06 13:45:31 | 阅读(0) | 评论(0)

<p>http://blog.jobbole.com/54308/<br />数据科学是<a href="http://www.dataists.com/2010/09/a-taxonomy-of-data-science/" rel="nofollow">OSEMN</a>（和 awesome 相同发音），它包括获取(Obtaining)、整理(Scrubbing)、探索(Exploring)、建模(Modeling)和翻译(iNterpreting)数据。作为一名数据科学家，我用命令...【阅读全文】

【大数据】 10亿用户，同时在线用户1亿数据服务技术方案

Aquester | 2015-08-16 23:14:36 | 阅读(3480) | 评论(0)

10亿用户，同时在线用户1亿数据服务技术方案.pdf目录目录11. 一般方案1...【阅读全文】

【大数据】 python 机器学习的开发环境搭建（numpy，scipy,matplotlib）

simiaoxiaoseng | 2015-08-13 10:25:20 | 阅读(1380) | 评论(0)

python 机器学习的开发环境搭建（numpy，scipy,matplotlib）【阅读全文】

【大数据】设置Hive Map和Reduce的数量增加分析速度

levy-linux | 2015-08-10 11:40:34 | 阅读(3310) | 评论(0)

有些时候需要尝试优化Hive的Map和Reduce数量，来达到最佳运行状态，根据实际情况进行数量调整，可以更快速的得到结果。<br /><br />1、增加map数量<br />首先调整上一步reducer生成文件数据，下面可以把reduce设置为160，即生成160个文件<br /><br />set mapred.reduce.tasks=160;<br />create table test as<br />s...【阅读全文】

【大数据】在 CentOS 7.1 上安装分布式存储系统 Ceph

niao5929 | 2015-08-03 21:20:28 | 阅读(610) | 评论(0)

<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">在 CentOS 7.1 上安装分布式存储系统 Ceph</h1></div><table width=...【阅读全文】

【大数据】 Spark 集群模式概述

niao5929 | 2015-08-03 08:18:19 | 阅读(650) | 评论(0)

<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">Spark 集群模式概述</h1></div><table width="97%" align="center" s...【阅读全文】

【大数据】如何配置一个 Docker Swarm 原生集群

niao5929 | 2015-07-30 00:03:23 | 阅读(1080) | 评论(0)

<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">如何配置一个 Docker Swarm 原生集群</h1></div><table width="97%" ...【阅读全文】

【大数据】 hadoop之map/reduce的bash实例

mingfei10 | 2015-07-28 16:31:25 | 阅读(1270) | 评论(0)

mapper.sh
点击(此处)折叠或打开...【阅读全文】

【大数据】 Java在处理大数据的时候一些小技巧

fhadmin24 | 2015-07-27 13:07:51 | 阅读(1180) | 评论(0)

<p>众所周知，java在处理数据量比较大的时候，加载到内存必然会导致内存溢出，而在一些数据处理中我们不得不去处理海量数据，在做数据处理中，我们常见的手段是分解，压缩，并行，临时文件等方法;</p><p>　　例如，我们要将数据库(不论是什么数据库)的数据导出到一个文件，一般是Excel或文本格式的CSV;对于Excel来讲...【阅读全文】

【大数据】使用Storm实现实时大数据分析

mingfei10 | 2015-07-24 17:02:19 | 阅读(1400) | 评论(0)

<div class="summary" style="font-family:Helvetica, Tahoma, Arial, sans-serif;font-size:14px;white-space:normal;color:#333333;margin:0px 0px 1.5em;padding:5px 10px;background-color:#F7F7F7;"><strong>转自：<a href="http://qq85609655.iteye.com/blog/2035717">http://qq85609655.iteye.com/blog/2035717</a...【阅读全文】

【大数据】使用Python实现Hadoop MapReduce程序

mingfei10 | 2015-07-22 14:40:15 | 阅读(1480) | 评论(0)

转自：使用Python实现Hadoop MapReduce程序【阅读全文】

【大数据】 Storm ack的具体实现

1012191556 | 2015-07-21 12:03:12 | 阅读(3230) | 评论(0)

有关Storm的ack机制，详情大家可以参考  <a target="_blank" href="http://blog.csdn.net/xeseo/article/details/17754825">http://blog.csdn.net/xeseo/article/details/17754825<br /><br /><span style="color:#000000;">在这里只说一下ack的具体实现（当然在这里继承的父类（storm API中的类如IRichSpout）中不...【阅读全文】

【大数据】关于GPU和分布式计算对随机梯度下降的计算区别

zjmwqx | 2015-07-18 11:56:03 | 阅读(5600) | 评论(0)

GPU也可以做大规模的并行计算，但是对于维度很高的数据，如何处理并压缩也并不是很显然的事情，如果不处理压缩，怎么能放进多核GPU共享的显存？如果频繁在物理内存和GPU显存之间进行拷贝，瓶颈就不是计算了，而是CPU对内存的拷贝。所以对于存储密集型的计算，毫无疑问要选择分布式并行框架。随机梯度下降需要保存所有样本点...【阅读全文】

【大数据】机器学习书籍资料推荐

fengzhanhai | 2015-07-15 20:10:31 | 阅读(3860) | 评论(0)

机器学习书籍推荐
Deep Learning
机器学习数学基础【阅读全文】

【大数据】一种快速的大数据分析方案后起之秀Spark

niao5929 | 2015-07-13 14:43:57 | 阅读(830) | 评论(0)

虽然Hadoop在分布式数据分析方面备受关注，但是仍有一些开源软件提供了优于Hadoop平台的的优势，比如在实时计算、交互式和流式计算场景下MapReduce并不适合。这时恰恰Spark技术为了解决这样的问题应运而生，其是一种新生的可扩展的数据分析平台，它基于内存计算技术，所以相对于 Hadoop 的存储方法，它在性能方面更具优势。Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。【阅读全文】

【大数据】如何修炼成大数据高手？推荐你看这些书

wuxiaobo_2009 | 2015-07-12 12:29:53 | 阅读(1250) | 评论(0)

首页
<<
37
38
39
40
41
42
43
44
45
46
>>
末页

网络110 报警服务