Chinaunix首页 | 论坛 | 博客
  • 博客访问: 921768
  • 博文数量: 253
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 2609
  • 用 户 组: 普通用户
  • 注册时间: 2019-03-08 17:29
个人简介

分享 vivo 互联网技术干货与沙龙活动,推荐最新行业动态与热门会议。

文章分类

全部博文(253)

文章存档

2022年(60)

2021年(81)

2020年(83)

2019年(29)

我的朋友

发布时间:2019-05-23 11:22:04

SparkSql 是架构在 Spark 计算框架之上的分布式 Sql 引擎,使用 DataFrame 和 DataSet 承载结构化和半结构化数据来实现数据复杂查询处理,提供的 DSL可以直接使用 scala 语言完成 Sql 查询,同时也使用 thriftserver 提供服务化的 Sql 查询功能。......【阅读全文】

阅读(1917) | 评论(0) | 转发(0)

发布时间:2019-05-14 18:11:47

机器学习排序(Learning to rank)将搜索转化为机器学习问题,在本文中,我想找出搜索与其他机器学习问题不同的原因,如何将搜索排名作为机器学习或者是分类和回归问题?我们将通过两种方法,对机器学习排序方法的评估有个直观的认识。......【阅读全文】

阅读(2149) | 评论(0) | 转发(0)

发布时间:2019-04-25 15:40:50

本篇概括性的介绍了OOD的设计原则,后续还有更多文章会详细剖析、吃透面向对象业务设计的原则。......【阅读全文】

阅读(2047) | 评论(0) | 转发(0)

发布时间:2019-04-25 15:09:55

一个文档嵌入本质上其实是一个(长的)数值数组,查找相似文档就相当于查找其他与其较相近的(长的)数值数组;可以采用诸如欧氏距离等来衡量相似性。可以借此来查找相似文档,但是因为不是直接基于关键词而是基于“嵌入”,所以可以自动获得与同义词扩展相媲美的效果。它会查找相关文档,即使它们使用不同的关键词,因此能比关键词检索表现更好。......【阅读全文】

阅读(2077) | 评论(0) | 转发(0)

发布时间:2019-04-25 14:59:52

本文来自 Meltwater的工程师通过官方技术博客分享了他们如何运行和维护400+节点的 Elasticsearch 集群的翻译。......【阅读全文】

阅读(2360) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册