按类别查询搜索结果
关于关键词 的检测结果,共 96
浅色年华 | 2018-07-05 15:19:16 | 阅读(920) | 评论(0)
Step1: Exploratory Data Analysis每个feature的意义,feature的类型,比较有用的代码如下df.describe()df['Category'].unique()看是否存在missing valuedf.loc[df.Dates.isnull(),'Dates']每个特征下的数据分布,可以用boxplot或者hist来看%matplotlib inlineimport matplotlib.pyplot as plt...【阅读全文】
浅色年华 | 2018-06-29 15:41:43 | 阅读(1250) | 评论(0)
毫无疑问,在系统持续交付的过程中,系统最终运行环境的多样性及复杂性毫无疑问增加了我们在配置管理工作上的负担,有时候,甚至不夸张的说,配置就是因环境而生。如果要问,是什么导致了我们应用的构建物(artifact)在各个环境不能保持一样,有时候Docker无法轻易达成“Build Once, Run Anywhere!"的承诺,其答案往...【阅读全文】
浅色年华 | 2018-06-27 15:53:55 | 阅读(1060) | 评论(0)
其实,赞美中国“水稻奇迹”早就是一种世界级现象。去年中国两米高“巨型水稻”的图文报道掀起一阵火热的“世界波”,而一再刷新单产世界最高纪录的袁隆平“超级稻”更是令世界称奇。【阅读全文】
浅色年华 | 2018-06-25 15:20:01 | 阅读(1040) | 评论(0)
RPCRPC采用客户端(服务调用方)/服务器端(服务提供方)模式, 都运行在自己的JVM中。客户端只需要引入要使用的接口,接口的实现和运行都在服务器端。RPC主要依赖的技术包括序列化、反序列化和数据传输协议,这是一种定义与实现相分离的设计。注意: RPC主要指内部服务之间的调用,RESTful也可以用于...【阅读全文】
浅色年华 | 2018-06-21 15:31:02 | 阅读(710) | 评论(0)
游戏成瘾正式列入精神疾病 全球每3人有1人是玩家【阅读全文】
libinggen | 2018-03-12 00:36:07 | 阅读(1350) | 评论(0)
词义消歧,句子、篇章语义理解基础,必须解决。语言都有大量多种含义词汇。词义消歧,可通过机器学习方法解决。词义消歧有监督机器学习分类算法,判断词义所属分类。词义消歧无监督机器学习聚类算法,把词义聚成多类,每一类一种含义。有监督词义消歧方法。基于互信息词义消歧方法,两种语言对照,基于大量中英文对照语...【阅读全文】
wenaideyu | 2017-12-06 20:01:02 | 阅读(1300) | 评论(0)
写在前面的话Hdfs采用分布式架构,为上层的应用和用户提供可扩展、高吞吐、高可靠的数据存储服务。在整个Hadoop生态系统中,hdfs处于最底层,也是最无可替代的一个基础设施。从2008年hadoop-0.10.1版本开始到现在的hadoop-3.0.0-beta1,hdfs已经走过了近10个年头,其架构和功能特性也发生了巨大的变化。特别是h...【阅读全文】
wenaideyu | 2017-12-06 20:00:28 | 阅读(1090) | 评论(0)
写在前面的话Hdfs采用分布式架构,为上层的应用和用户提供可扩展、高吞吐、高可靠的数据存储服务。在整个Hadoop生态系统中,hdfs处于最底层,也是最无可替代的一个基础设施。从2008年hadoop-0.10.1版本开始到现在的hadoop-3.0.0-beta1,hdfs已经走过了近10个年头,其架构和功能特性也发生了巨大的变化。特别是h...【阅读全文】
laoliulaoliu | 2017-11-23 21:41:04 | 阅读(650) | 评论(0)
一个知乎上的问题:Hbase的Region server和Hadoop的datanode是否可以部署在一台服务器上?如果是的话,二者是否是一对一的关系?部署在同一台服务器上,可以减少数据跨网络传输的流量。 但不是一对一对的关系,首先,数据还hdfs中保存N份,默认是三分,也就是说数据会分布在三个datanode上,即使regionserver上只保存一...【阅读全文】
manshukwan | 2017-10-01 18:33:20 | 阅读(730) | 评论(0)
3階最類質數幻方、3階類質數加法幻方(鐘明、蘇茂挺)※※※※※※稿件採集時間:2017年8月8日上午11:00分。貼博時間:2017年10月1日。※※※※※※※※※完※※※ 作品原創:鐘明(四川),蘇茂挺(福州)後期修飾:萬樹軍(香港)...【阅读全文】
ghan | 2017-06-07 17:43:57 | 阅读(2120) | 评论(0)
Postgres-XL添加datanode_slave节点及故障恢复测试【阅读全文】
ghan | 2017-06-07 17:37:05 | 阅读(3060) | 评论(0)
一、添加一数据节点[pgxl@mdw pgxc_ctl]$ pgxc_ctl /bin/bashInstalling pgxc_ctl_bash script as /home/pgxl/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/pgxl/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/pgxl/pgxc_ctl/pgxc_ctl_bash --home /home/pgxl/pgxc_ctl --co...【阅读全文】
ghan | 2017-03-07 22:25:31 | 阅读(4640) | 评论(0)
一、新建一个tank用户[gpadmin@mdw ~]$ createuser tankShall the new role be a superuser? (y/n) y[gpadmin@mdw ~]$ psql -d tankpsql (8.2.15)Type "help" for help.二、修改tank用户密码tank=# alter role tank with password 'tank'tank-# ;ALTER ROLEtank=# \q三、修改greenplum数据库pg_hba.conf文件...【阅读全文】
OowarrioroO | 2016-03-02 12:20:59 | 阅读(6520) | 评论(0)
1.问题
? 在运行spark app时,屏幕上总会刷屏似的输出大量日志信息,详细介绍程序运行过程,但这样有时也不便我们调试应用。只输出警告和程序输出一般就足够我们参考,再详细的内容课题通过web ui更直观的查看。
?2.解决方法
?进行如下设置:

点击(此处)折叠或打开

cd $SPARK_HOME/conf
cp log4j.properties.template log4j.properties【阅读全文】
呆若 | 2016-02-17 17:13:16 | 阅读(2110) | 评论(0)
redis info命令一共打印8个方面的信息:server,clients,memory,persistence,stats,replication,cpu,keyspaces 八个方面的信息info命令以一种易读的格式,返回关于 Redis 服务器的各种信息和统计数值。[codis@192_168_171_135 ~]$ ./redis-cli -h 192.168.171.140 -p 6382192.168.171.140:6382> info# Server &nbs...【阅读全文】
qhanchen | 2016-01-20 16:00:59 | 阅读(140) | 评论(0)
美国节点服务器租用,E3-1230V3高配性能更佳A2型E3-1230v316 GB1t5个独立 IP 100Mbps/不限800 元/月 节点服务器1、独立的节点服务器增强了数据的安全性2、节点服务器增加了网站的访问速度3、节点服务器减少主服务器的负载,大大提高了网站的稳定性4、节点服务器增加了吐量,在客户投资最少的情况下增加服务器的...【阅读全文】
lll890717 | 2016-01-14 10:19:59 | 阅读(730) | 评论(0)
据开发人员披露,Ubuntu Touch移动操作系统也将提供对用户数据加密的支持。不过需要指出的是,尽管这已经不是一个秘密,但它也不会是即将到来的一个特性。在一条被埋藏的wiki条目中,我们得知了Ubuntu Touch的这一计划。我们很高兴它已经处在考虑之中,即使它并不会很快到来。在说它是一个移动操作系统之前,Ubuntu...【阅读全文】
levy-linux | 2015-08-10 11:40:34 | 阅读(3290) | 评论(0)
有些时候需要尝试优化Hive的Map和Reduce数量,来达到最佳运行状态,根据实际情况进行数量调整,可以更快速的得到结果。<br /><br />1、增加map数量<br />首先调整上一步reducer生成文件数据,下面可以把reduce设置为160,即生成160个文件<br /><br />set mapred.reduce.tasks=160;<br />create table test as<br />s...【阅读全文】
超人学院1 | 2015-05-08 14:20:55 | 阅读(720) | 评论(0)
Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr 包装并扩展了 Lucene...【阅读全文】
蒜末 | 2015-03-16 10:20:31 | 阅读(660) | 评论(0)
  对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业...【阅读全文】