分类: 信息化
2014-12-04 23:38:19
5. 对于因变量y=0或1这样的二分类问题:,
,整合后,可以写成
6. 由最大似然估计原理,我们可以通过m个训练样本值,来估计出值,使得似然函数值最大
这里,为m个
训练样本同时发生的概率。对
求log,得:
7. 求最大似然函数参数的立足点是求出每个参数方向上的偏导数,并让偏导数为0,最后求解此方程组。由于中参数数量的不确定,考虑到可能参数数量很大,此时直接求解方程组的解变的很困难。于是,我们用随机梯度上升法,求解方程组的值,就是使
最大化时的
值,迭代函数为:
由于y 只能等于0或1,所以可以将逻辑回归中的Cost function的两个公式合并,具体推导如下:
故逻辑回归的Cost function可简化为: