【大数据】SparkSql连接查询中的谓词下推处理(一)

vivo互联网技术

首页　| 　博文目录　| 　关于我

vivo互联网技术

博客访问： 976640
博文数量： 253
博客积分： 0
博客等级：民兵
技术积分： 2609
用户组：普通用户
注册时间： 2019-03-08 17:29

个人简介

分享 vivo 互联网技术干货与沙龙活动，推荐最新行业动态与热门会议。

文章分类

全部博文（253）

技术文章（251）
未分配的博文（2）

文章存档

2022年（60）

2021年（81）

2020年（83）

2019年（29）

我的朋友

最近访客

推荐博文

【大数据】SparkSql连接查询中的谓词下推处理(一)

发布时间：2019-05-23 11:22:04

SparkSql 是架构在 Spark 计算框架之上的分布式 Sql 引擎，使用 DataFrame 和 DataSet 承载结构化和半结构化数据来实现数据复杂查询处理，提供的 DSL可以直接使用 scala 语言完成 Sql 查询，同时也使用 thriftserver 提供服务化的 Sql 查询功能。......【阅读全文】

阅读(1979) | 评论(0) | 转发(0)

搜索和其他机器学习问题有什么不同？

发布时间：2019-05-14 18:11:47

机器学习排序(Learning to rank)将搜索转化为机器学习问题，在本文中，我想找出搜索与其他机器学习问题不同的原因，如何将搜索排名作为机器学习或者是分类和回归问题？我们将通过两种方法，对机器学习排序方法的评估有个直观的认识。......【阅读全文】

阅读(2204) | 评论(0) | 转发(0)

The Principles of OOD 面向对象设计原则

发布时间：2019-04-25 15:40:50

本篇概括性的介绍了OOD的设计原则，后续还有更多文章会详细剖析、吃透面向对象业务设计的原则。......【阅读全文】

阅读(2144) | 评论(0) | 转发(0)

Searching with Deep Learning 深度学习的搜索应用

发布时间：2019-04-25 15:09:55

一个文档嵌入本质上其实是一个（长的）数值数组，查找相似文档就相当于查找其他与其较相近的（长的）数值数组；可以采用诸如欧氏距离等来衡量相似性。可以借此来查找相似文档，但是因为不是直接基于关键词而是基于“嵌入”，所以可以自动获得与同义词扩展相媲美的效果。它会查找相关文档，即使它们使用不同的关键词，因此能比关键词检索表现更好。......【阅读全文】

阅读(2132) | 评论(0) | 转发(0)

400+节点的 Elasticsearch 集群运维

发布时间：2019-04-25 14:59:52

本文来自 Meltwater的工程师通过官方技术博客分享了他们如何运行和维护400+节点的 Elasticsearch 集群的翻译。......【阅读全文】

阅读(2436) | 评论(0) | 转发(0)

给主人留下些什么吧！~~

留言热议

请登录后留言。

登录注册

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6