分享 vivo 互联网技术干货与沙龙活动,推荐最新行业动态与热门会议。
发布时间:2019-05-23 11:22:04
SparkSql 是架构在 Spark 计算框架之上的分布式 Sql 引擎,使用 DataFrame 和 DataSet 承载结构化和半结构化数据来实现数据复杂查询处理,提供的 DSL可以直接使用 scala 语言完成 Sql 查询,同时也使用 thriftserver 提供服务化的 Sql 查询功能。......【阅读全文】
发布时间:2019-05-14 18:11:47
机器学习排序(Learning to rank)将搜索转化为机器学习问题,在本文中,我想找出搜索与其他机器学习问题不同的原因,如何将搜索排名作为机器学习或者是分类和回归问题?我们将通过两种方法,对机器学习排序方法的评估有个直观的认识。......【阅读全文】
发布时间:2019-04-25 15:40:50
本篇概括性的介绍了OOD的设计原则,后续还有更多文章会详细剖析、吃透面向对象业务设计的原则。......【阅读全文】
发布时间:2019-04-25 15:09:55
一个文档嵌入本质上其实是一个(长的)数值数组,查找相似文档就相当于查找其他与其较相近的(长的)数值数组;可以采用诸如欧氏距离等来衡量相似性。可以借此来查找相似文档,但是因为不是直接基于关键词而是基于“嵌入”,所以可以自动获得与同义词扩展相媲美的效果。它会查找相关文档,即使它们使用不同的关键词,因此能比关键词检索表现更好。......【阅读全文】
发布时间:2019-04-25 14:59:52
本文来自 Meltwater的工程师通过官方技术博客分享了他们如何运行和维护400+节点的 Elasticsearch 集群的翻译。......【阅读全文】