ChinaUnix首页
|
论坛
|
博客
博客首页
博客专家
往日推荐
博客文集
博文
博主
热搜:
Android
Java
C++
Mysql
MongoDB
ubuntu
Hyper-V
信息
博客首页 〉
搜索结果
按类别查询搜索结果
操作系统
程序设计
数据库
热点技术
综合
架构与运维
移动开发与应用
Web前端
LINUX
|
BSD
|
WINDOWS
|
其他UNIX
|
AIX
|
SOLARIS
|
C/C++
|
Java
|
Python/Ruby
|
项目管理
|
Web开发
|
嵌入式
|
C#/.net
|
PHP
|
Delphi
|
PERL
|
Erlang
|
Verilog
|
敏捷开发
|
Mysql/postgreSQL
|
Oracle
|
DB2/Informix
|
Sybase
|
数据库开发技术
|
SQLite/嵌入式数据库
|
SQLServer
|
NOSQL
|
虚拟化
|
云计算
|
大数据
|
HADOOP
|
高性能计算
|
IT业界
|
IT职场
|
信息化
|
网络与安全
|
系统运维
|
服务器与存储
|
架构设计与优化
|
Android平台
|
iOS平台
|
Windows平台
|
其他平台
|
Html/Css
|
JavaScript
|
jQuery
|
HTML5
|
关于关键词 的检测结果,共
1143
条
【大数据】
5次等冪和8階幻
方
系
列甲
manshukwan
| 2015-10-22 21:57:57 | 阅读(1290) | 评论(0)
5次等冪和8階幻方系列甲※※※※※※欣賞導航,5次等冪和8階幻方,是指由「類自然數」構造而成,而且兼具上下部份構成5次等冪和數組的「8階幻方」,現在,這類幻方已知有六款的幻和:幻和=4,幻和=8,幻和=16,幻和=32,幻和=64,幻和=128,這6款不同幻和的幻方,總數量合計起來達至20億個以上。以下展示的,是這6...
【阅读全文】
【大数据】
初
学
者如何查阅自然语言处理(NLP)领域
学
术资料
OowarrioroO
| 2015-10-12 11:13:28 | 阅读(1620) | 评论(0)
国际学术组织、学术会议与学术论文
国内学术组织、学术会议与学术论文
如何快速了解某个领域研究进展
初学者如何查阅自然语言处理(NLP)领域学术资料
【阅读全文】
【大数据】
如何修炼成
大
数据高手?推荐你看这些书
xiexiexielei
| 2015-09-30 10:37:55 | 阅读(140) | 评论(0)
<p>本文转载于: http://www.36dsj.com/archives/8094<br />首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常难的一件事。要不也不会连大数据发源地——美国也不超出10个人(也许就5、6个)能达到这个层次,在中国……算...
【阅读全文】
【大数据】
spark
学
习
hiyachen
| 2015-09-18 19:38:12 | 阅读(2010) | 评论(0)
spark学习
【阅读全文】
【大数据】
七个用于数据科
学
(data science)的命令行工具
hiyachen
| 2015-09-06 13:45:31 | 阅读(0) | 评论(0)
<p>http://blog.jobbole.com/54308/<br />数据科学是<a href="http://www.dataists.com/2010/09/a-taxonomy-of-data-science/" rel="nofollow">OSEMN</a>(和 awesome 相同发音),它包括获取(Obtaining)、整理(Scrubbing)、探索(Exploring)、建模(Modeling)和翻译(iNterpreting)数据。作为一名数据科学家,我用命令...
【阅读全文】
【大数据】
10亿用户,同时在线用户1亿数据服务技术
方
案
Aquester
| 2015-08-16 23:14:36 | 阅读(3480) | 评论(0)
10亿用户,同时在线用户1亿数据服务技术方案.pdf目录目录11. 一般方案1...
【阅读全文】
【大数据】
python 机器
学
习的开发环境搭建(numpy,scipy,matplotlib)
simiaoxiaoseng
| 2015-08-13 10:25:20 | 阅读(1380) | 评论(0)
python 机器学习的开发环境搭建(numpy,scipy,matplotlib)
【阅读全文】
【大数据】
设置Hive Map和Reduce的数量增
加
分析速度
levy-linux
| 2015-08-10 11:40:34 | 阅读(3310) | 评论(0)
有些时候需要尝试优化Hive的Map和Reduce数量,来达到最佳运行状态,根据实际情况进行数量调整,可以更快速的得到结果。<br /><br />1、增加map数量<br />首先调整上一步reducer生成文件数据,下面可以把reduce设置为160,即生成160个文件<br /><br />set mapred.reduce.tasks=160;<br />create table test as<br />s...
【阅读全文】
【大数据】
在 CentOS 7.1 上安装分布
式
存储
系
统 Ceph
niao5929
| 2015-08-03 21:20:28 | 阅读(610) | 评论(0)
<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">在 CentOS 7.1 上安装分布式存储系统 Ceph</h1></div><table width=...
【阅读全文】
【大数据】
Spark 集群模
式
概述
niao5929
| 2015-08-03 08:18:19 | 阅读(650) | 评论(0)
<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">Spark 集群模式概述</h1></div><table width="97%" align="center" s...
【阅读全文】
【大数据】
如何配置一个 Docker Swarm 原
生
集群
niao5929
| 2015-07-30 00:03:23 | 阅读(1080) | 评论(0)
<div style="font-size:12px;color:#333333;font-family:tahoma, 宋体;line-height:normal;white-space:normal;text-align:center;background-color:#FAFAFC;"><h1 class="aTitle" style="font-size:16px;position:relative;padding-top:10px;">如何配置一个 Docker Swarm 原生集群</h1></div><table width="97%" ...
【阅读全文】
【大数据】
hadoop之map/reduce的bash
实
例
mingfei10
| 2015-07-28 16:31:25 | 阅读(1270) | 评论(0)
mapper.sh
点击(此处)折叠或打开...
【阅读全文】
【大数据】
Java在处理
大
数据的时候一些小技巧
fhadmin24
| 2015-07-27 13:07:51 | 阅读(1180) | 评论(0)
<p>众所周知,java在处理数据量比较大的时候,加载到内存必然会导致内存溢出,而在一些数据处理中我们不得不去处理海量数据,在做数据处理中,我们常见的手段是分解,压缩,并行,临时文件等方法;</p><p> 例如,我们要将数据库(不论是什么数据库)的数据导出到一个文件,一般是Excel或文本格式的CSV;对于Excel来讲...
【阅读全文】
【大数据】
使用Storm
实
现
实
时
大
数据分析
mingfei10
| 2015-07-24 17:02:19 | 阅读(1400) | 评论(0)
<div class="summary" style="font-family:Helvetica, Tahoma, Arial, sans-serif;font-size:14px;white-space:normal;color:#333333;margin:0px 0px 1.5em;padding:5px 10px;background-color:#F7F7F7;"><strong>转自:<a href="http://qq85609655.iteye.com/blog/2035717">http://qq85609655.iteye.com/blog/2035717</a...
【阅读全文】
【大数据】
使用Python
实
现Hadoop MapReduce程序
mingfei10
| 2015-07-22 14:40:15 | 阅读(1480) | 评论(0)
转自:使用Python实现Hadoop MapReduce程序
【阅读全文】
【大数据】
Storm ack的具体
实
现
1012191556
| 2015-07-21 12:03:12 | 阅读(3230) | 评论(0)
有关Storm的ack机制,详情大家可以参考 <a target="_blank" href="http://blog.csdn.net/xeseo/article/details/17754825">http://blog.csdn.net/xeseo/article/details/17754825<br /><br /><span style="color:#000000;">在这里只说一下ack的具体实现(当然在这里继承的父类(storm API中的类 如IRichSpout)中不...
【阅读全文】
【大数据】
关于GPU和分布
式
计算对随机梯度下降的计算区别
zjmwqx
| 2015-07-18 11:56:03 | 阅读(5600) | 评论(0)
GPU也可以做大规模的并行计算,但是对于维度很高的数据,如何处理并压缩也并不是很显然的事情,如果不处理压缩,怎么能放进多核GPU共享的显存?如果频繁在物理内存和GPU显存之间进行拷贝,瓶颈就不是计算了,而是CPU对内存的拷贝。所以对于存储密集型的计算,毫无疑问要选择分布式并行框架。随机梯度下降需要保存所有样本点...
【阅读全文】
【大数据】
机器
学
习书籍资料推荐
fengzhanhai
| 2015-07-15 20:10:31 | 阅读(3860) | 评论(0)
机器学习书籍推荐
Deep Learning
机器学习数学基础
【阅读全文】
【大数据】
一种快速的
大
数据分析
方
案后起之秀Spark
niao5929
| 2015-07-13 14:43:57 | 阅读(830) | 评论(0)
虽然Hadoop在分布式数据分析方面备受关注,但是仍有一些开源软件提供了优于Hadoop平台的的优势,比如在实时计算、交互式和流式计算场景下MapReduce并不适合。这时恰恰Spark技术为了解决这样的问题应运而生,其是一种新生的可扩展的数据分析平台,它基于内存计算技术,所以相对于 Hadoop 的存储方法,它在性能方面更具优势。Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
【阅读全文】
【大数据】
如何修炼成
大
数据高手?推荐你看这些书
wuxiaobo_2009
| 2015-07-12 12:29:53 | 阅读(1250) | 评论(0)
<p>本文转载于: http://www.36dsj.com/archives/8094<br />首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常难的一件事。要不也不会连大数据发源地——美国也不超出10个人(也许就5、6个)能达到这个层次,在中国……算...
【阅读全文】
首页
<<
37
38
39
40
41
42
43
44
45
46
>>
末页