按类别查询搜索结果
关于关键词 的检测结果,共 179
libinggen | 2018-03-12 00:36:07 | 阅读(1360) | 评论(0)
词义消歧,句子、篇章语义理解基础,必须解决。语言都有大量多种含义词汇。词义消歧,可通过机器学习方法解决。词义消歧有监督机器学习分类算法,判断词义所属分类。词义消歧无监督机器学习聚类算法,把词义聚成多类,每一类一种含义。有监督词义消歧方法。基于互信息词义消歧方法,两种语言对照,基于大量中英文对照语...【阅读全文】
梦在哪 | 2017-12-20 17:11:29 | 阅读(310) | 评论(0)
计算机经济机构28年来一直深入研究信息技术的财务和战略管理,根据研究人员对其年度IT支出与人员配备基准报告,对于IT企业而言,在私人数据中心方面的投资已不像数年前那样作为优先考虑的事项了。 在今年的研究中,仅2017年上半年就有200多家IT企业参与了调查。据报道,目前数据中心的新增支出在五大支出类别中占比...【阅读全文】
wenaideyu | 2017-12-06 20:01:02 | 阅读(1300) | 评论(0)
写在前面的话Hdfs采用分布式架构,为上层的应用和用户提供可扩展、高吞吐、高可靠的数据存储服务。在整个Hadoop生态系统中,hdfs处于最底层,也是最无可替代的一个基础设施。从2008年hadoop-0.10.1版本开始到现在的hadoop-3.0.0-beta1,hdfs已经走过了近10个年头,其架构和功能特性也发生了巨大的变化。特别是h...【阅读全文】
wenaideyu | 2017-12-06 20:00:28 | 阅读(1100) | 评论(0)
写在前面的话Hdfs采用分布式架构,为上层的应用和用户提供可扩展、高吞吐、高可靠的数据存储服务。在整个Hadoop生态系统中,hdfs处于最底层,也是最无可替代的一个基础设施。从2008年hadoop-0.10.1版本开始到现在的hadoop-3.0.0-beta1,hdfs已经走过了近10个年头,其架构和功能特性也发生了巨大的变化。特别是h...【阅读全文】
laoliulaoliu | 2017-11-23 21:41:04 | 阅读(660) | 评论(0)
一个知乎上的问题:Hbase的Region server和Hadoop的datanode是否可以部署在一台服务器上?如果是的话,二者是否是一对一的关系?部署在同一台服务器上,可以减少数据跨网络传输的流量。 但不是一对一对的关系,首先,数据还hdfs中保存N份,默认是三分,也就是说数据会分布在三个datanode上,即使regionserver上只保存一...【阅读全文】
manshukwan | 2017-10-01 18:33:20 | 阅读(740) | 评论(0)
3階最類質數幻方、3階類質數加法幻方(鐘明、蘇茂挺)※※※※※※稿件採集時間:2017年8月8日上午11:00分。貼博時間:2017年10月1日。※※※※※※※※※完※※※ 作品原創:鐘明(四川),蘇茂挺(福州)後期修飾:萬樹軍(香港)...【阅读全文】
libo666 | 2017-06-20 17:30:14 | 阅读(3700) | 评论(0)
人力资源管理系统是用集中的数据将几乎所有的人力资源相关的信息(组织、招聘、薪资、绩效、审批等)统一管理起来,是企业运行必不可少的管理软件。国际上知名的有Oracle PeopleSoft、SAP 和Workday HCM,世界500强公司有超过一半都在使用。【阅读全文】
ghan | 2017-06-07 17:43:57 | 阅读(2130) | 评论(0)
Postgres-XL添加datanode_slave节点及故障恢复测试【阅读全文】
ghan | 2017-06-07 17:37:05 | 阅读(3070) | 评论(0)
一、添加一数据节点[pgxl@mdw pgxc_ctl]$ pgxc_ctl /bin/bashInstalling pgxc_ctl_bash script as /home/pgxl/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/pgxl/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/pgxl/pgxc_ctl/pgxc_ctl_bash --home /home/pgxl/pgxc_ctl --co...【阅读全文】
【大数据】 spark 源动态分配
hustfxj | 2017-05-27 20:02:08 | 阅读(1780) | 评论(0)
spark 1.5开始为standalone模式和mesos的粗粒度模式提供了executor的动态管理,具体表现为:如果executor在一段时间内空闲就会移除这个executor。如果有新任务处于等待状态,并且等待时间超过Spark.dynamicAllocation.schedulerBacklogTimeout(默认1s),则会依次启动executor,每次启动1,2,4,8…个executor(如果有的...【阅读全文】
【大数据】 8.scala:特
bigdataer01 | 2017-05-02 15:03:41 | 阅读(160) | 评论(0)
版权申明:转载请注明出处。 文章来源:http://bigdataer.net/?p=317 总体来说,scala中的特质类似于Java中的接口,但是有别于接口的是特质中既可以有实现方法也可以有抽象方法。 1.特质的定义 使用关键字trait来定义一个特质,如: scala    5行 trait Log{ def inf...【阅读全文】
ghan | 2017-03-07 22:25:31 | 阅读(4650) | 评论(0)
一、新建一个tank用户[gpadmin@mdw ~]$ createuser tankShall the new role be a superuser? (y/n) y[gpadmin@mdw ~]$ psql -d tankpsql (8.2.15)Type "help" for help.二、修改tank用户密码tank=# alter role tank with password 'tank'tank-# ;ALTER ROLEtank=# \q三、修改greenplum数据库pg_hba.conf文件...【阅读全文】
libo666 | 2016-12-29 15:50:38 | 阅读(1450) | 评论(0)
最重要的是采用阿里云数加,东润环能将所有精力都放在业务上,节省了自建机房在学习成本、开发成本、管理成本、投入机房资源和运维成本的总成本,“相比自建Hadoop物理集群,使用阿里云数加MaxCompute的总成本有较大降低,应用开发效率有很大提高。”东润环能技术研发部总监王云如是说。【阅读全文】
libo666 | 2016-12-29 15:41:10 | 阅读(1400) | 评论(0)
最重要的是采用阿里云数加,东润环能将所有精力都放在业务上,节省了自建机房在学习成本、开发成本、管理成本、投入机房资源和运维成本的总成本,“相比自建Hadoop物理集群,使用阿里云数加MaxCompute的总成本有较大降低,应用开发效率有很大提高。”东润环能技术研发部总监王云如是说。【阅读全文】
【大数据】 K-折交叉验
清无 | 2016-12-16 00:47:51 | 阅读(530) | 评论(0)
k-折交叉验证(k-fold crossValidation):在机器学习中,将数据集A分为训练集(training set)B和测试集(test set)C,在样本量不充足的情况下,为了充分利用数据集对算法效果进行测试,将数据集A随机分为k个包,每次将其中一个包作为测试集,剩下k-1个包作为训练集进行训练。...【阅读全文】
jiangwen127 | 2016-09-09 16:08:03 | 阅读(1180) | 评论(0)
笔记中的公式全部采用LATEXLATEX语法手工输入,某些笔记由于公式数量太多,可能造成浏览器显示不正常,通常刷新下页面即可重新加载。若出现公式错误,麻烦您提醒我修正。笔记之前发布在我的博客当中beader.me,使用markdown撰写,因此几乎不加修改就转移到gitbook当中,可能会出现一些排版错误,也麻烦您提醒我修正。...【阅读全文】
jiangwen127 | 2016-08-31 14:51:47 | 阅读(910) | 评论(0)
https://gym.openai.com/docs/rl【阅读全文】
嘀嘀嘎嘎唔 | 2016-03-07 10:35:26 | 阅读(180) | 评论(0)
机器学习书籍推荐
Deep Learning
机器学习数学基础【阅读全文】
OowarrioroO | 2016-03-02 12:20:59 | 阅读(6610) | 评论(0)
1.问题
? 在运行spark app时,屏幕上总会刷屏似的输出大量日志信息,详细介绍程序运行过程,但这样有时也不便我们调试应用。只输出警告和程序输出一般就足够我们参考,再详细的内容课题通过web ui更直观的查看。
?2.解决方法
?进行如下设置:

点击(此处)折叠或打开

cd $SPARK_HOME/conf
cp log4j.properties.template log4j.properties【阅读全文】
呆若 | 2016-02-17 17:13:16 | 阅读(2120) | 评论(0)
redis info命令一共打印8个方面的信息:server,clients,memory,persistence,stats,replication,cpu,keyspaces 八个方面的信息info命令以一种易读的格式,返回关于 Redis 服务器的各种信息和统计数值。[codis@192_168_171_135 ~]$ ./redis-cli -h 192.168.171.140 -p 6382192.168.171.140:6382> info# Server &nbs...【阅读全文】