按类别查询搜索结果
关于关键词 的检测结果,共 159
StartDT | 2019-08-19 10:13:05 | 阅读(1190) | 评论(0)
在数据资产价值被高度认可和开发利用的今天,数据治理不仅仅需要作为一项管理职能在企业内贯彻执行,也应该成为一种企业文化。【阅读全文】
shenyanxxxy | 2019-08-15 20:44:04 | 阅读(3940) | 评论(0)
找时间学习了一下论文:Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba该论文根据用户的行为在 item与item之间建立图。再根据Graph,使用random walk 算法生成sequence。总共分为三个步骤:1. 根据用户的行为在 item与item之间建立图,(需要提出一些over active user...【阅读全文】
StartDT | 2019-08-01 13:37:09 | 阅读(1090) | 评论(0)
中台是“让听得见炮火的人召唤炮火”,面对如火如荼的中台建设潮,只有先解释了“数据该怎么用”的问题,才有必要进一步解答“数据怎么来”、“数据怎么存”的问题。【阅读全文】
【大数据】 阿里CDN使用
开发者学习指南 | 2019-07-11 16:03:04 | 阅读(1190) | 评论(0)
什么是阿里云CDN?阿里云内容分发网络(Alibaba Cloud Content Delivery Network,简称CDN)将您源站资源缓存至阿里云遍布全球的加速节点上。当终端用户请求访问和获取这些资源时,无需回源,系统将就近调用CDN节点上已经缓存的资源。在不同区域、不同场景下使用CDN加速您网站内容的分发,将有效分担源站压力,...【阅读全文】
StartDT | 2019-06-26 09:37:57 | 阅读(1220) | 评论(0)
数据的爆炸式增长以及价值的扩大化,将对企业未来的发展产生深远的影响,数据将成为企业的核心资产。如何处理大数据,挖掘大数据的价值,让大数据为企业的发展保驾护航,将是未来信息技术发展道路上关注的重点。

【阅读全文】
lsj0922al | 2019-05-29 16:10:06 | 阅读(1090) | 评论(0)
数据集成(Data Integration)是阿里集团对外提供的可跨异构数据存储系统的、可靠、安全、低成本、可弹性扩展的数据同步平台,为20+种数据源提供不同网络环境下的离线(全量/增量)数据进出通道,是阿里集团对外提供的稳定高效、弹性伸缩的数据同步平台。致力于提供复杂网络环境下、丰富的异构数据源之间数据高速稳定的数据...【阅读全文】
StartDT | 2019-05-25 11:52:20 | 阅读(1200) | 评论(0)
因为中台它不仅仅是一个技术,其实更多的是一个业务,如果中台只讲技术,不讲业务,都是大忽悠。【阅读全文】
StartDT | 2019-05-17 22:24:10 | 阅读(1150) | 评论(0)
智慧政务已有了一条水到渠成式的实现路径。【阅读全文】
StartDT | 2019-05-10 20:53:34 | 阅读(1160) | 评论(0)
奇点云自研的一站式大数据智能服务平台——DataSimba,旨在提供数据采集、数据加工、数据治理、数据规范、数据资产、数据服务等全链路的产品+技术+方法论服务,构建面向业务应用的大数据智能平台。【阅读全文】
lsj0922al | 2019-04-29 16:34:08 | 阅读(1070) | 评论(0)
数据集成(Data Integration)是阿里集团对外提供的可跨异构数据存储系统的、可靠、安全、低成本、可弹性扩展的数据同步平台,为20+种数据源提供不同网络环境下的离线(全量/增量)数据进出通道,是阿里集团对外提供的稳定高效、弹性伸缩的数据同步平台。致力于提供复杂网络环境下、丰富的异构数据源之间数据高速稳定的数据移动及同步能力。【阅读全文】
支付宝技术团队 | 2019-03-14 14:26:23 | 阅读(3720) | 评论(0)
演讲嘉宾简介:本次直播视频精彩回顾,戳这里!https://tech.antfin.com/activities/41/review/54https://tech.antfin.com/activities/41/review 一、双11带来的挑战三、极致运维技术点剖析一、双11带来的挑战 首先看系统高可用,简单来说,高可用就是能够时时刻刻提供一个持...【阅读全文】
zds05 | 2018-12-06 15:20:54 | 阅读(1080) | 评论(0)
贝叶斯算法相关公式【阅读全文】
fageh | 2018-11-07 18:19:31 | 阅读(570) | 评论(0)
  上海宝付解析hanlp源码中文分词算法。词图指的是句子中所有词可能构成的图。如果一个词 A的下一个词可能是B的话,那么A和B之间具有一条路径E(A,B)。一个词可能有多个后续,同时也可能有多个前驱,它们构成的图我称作词图。  需要稀疏 2维矩阵模型,以一个词的起始位置作为行,终止位置作为列,可以得到一个二维...【阅读全文】
zpf1218 | 2018-11-04 17:08:46 | 阅读(2410) | 评论(0)
Spark有两种类型的共享变量:  累加器(accumulator):累加器用来对信息进行聚合,累加器的一个常见用途是在调试时对作业执行过程中的事件进行计数  广播变量(broadcast variable):广播变量用来高效分发较大的对象,让程序高效地向所有工作节点发送一个较大的只读值,以供一个或多个Spark 操作使用。...【阅读全文】
zpf1218 | 2018-11-04 15:20:42 | 阅读(1590) | 评论(0)
点击(此处)折叠或打开import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.api.java.function.Function2;import j...【阅读全文】
浅色年华 | 2018-08-09 13:32:48 | 阅读(1170) | 评论(0)
Mybatis至少遇到了以下的设计模式的使用:工厂模式,例如SqlSessionFactory、ObjectFactory、MapperProxyFactory;代理模式,Mybatis实现的核心,比如MapperProxy、ConnectionLogger,用的jdk的动态代理;还有executor.loader包使用了cglib或者javassist达到延迟加载的效果;模板方法模式,例如BaseExecutor...【阅读全文】
【大数据】 storm数实现
zpf1218 | 2018-07-09 19:01:15 | 阅读(1460) | 评论(0)
点击(此处)折叠或打开import backtype.storm.spout.SpoutOutputCollector; import backtype.storm.task.TopologyContext;import backtype.storm.topology.OutputFieldsDeclarer;import backtype.storm.topology.base.BaseRichSpout;imp...【阅读全文】
浅色年华 | 2018-07-09 15:10:20 | 阅读(660) | 评论(0)
阿里云宣布开源MongoShake 支持跨机房容灾【阅读全文】
zpf1218 | 2018-07-07 15:48:07 | 阅读(1170) | 评论(0)
假设有如下数据:100,200,300,400,500,600200,100,300,400300,100,200,400,500400,100,200,300500,100,300600,100其中第一列表示用户ID,其余列表示用户的好友ID,我们需要统计出这些用户的共同好友其结果如下:[100,200] [300, 400]  //表示用户100和200的共同好友是 300,400[100,300] [200, 400, 500]...【阅读全文】
zpf1218 | 2018-07-06 17:17:27 | 阅读(1190) | 评论(0)
点击(此处)折叠或打开import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;i...【阅读全文】