Python Data Science Handbook本书介绍了在Python中处理数据所必需的核心库,特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Lean和相关的软件包。在此之前您需要掌握Python这种语言,如果您想快速掌握这门语言,可以参阅这个针对研究人员和科学家的Python语言快速入门的“Python的旋风之旅(A Whirlwin...【阅读全文】
分布式缓存一般被定义为一个数据集合,它将数据分布(或分区)于任意数目的集群节点上。集群中的一个具体节点负责缓存中的一部分数据,整体对外提供统一的访问接口[1]。分布式缓存一般基于冗余备份机制实现数据高可用,又被称为内存数据网格(IMDG, in-memory data grid)。在云平台飞速发展的今天,作为提升应用性能...【阅读全文】
1. 香农熵(Shannon entropy)信息熵(又叫香农熵)反映了一个系统的无序化(有序化)程度,一个系统越有序,信息熵就越低,反之就越高。如果一个随机变量 X 的可能取值为 X={x1,x2,…,xn},对应的概率为 p(X=xi),则随机变量 X 的信息熵为:H(X)=?∑i=1np(xi)logp(xi)...【阅读全文】