发布时间:2013-02-05 14:06:59
这是一次概念的纠结过程,对写代码没有太大意义。过程是这样的:首先,我的概念里往往只有同步和异步,没有太多去区别同异步IO和同异步通知两种。另外还记得apu(2rd)中有一句“select和poll可以实现异步形式的通知”。接着,听到了epoll是同步IO这个概念,比较意外。坚持.........【阅读全文】
发布时间:2013-01-13 15:20:15
1.协同过滤的主要部分是相似度的计算,直接抽象成物品间距离的计算比较方便理解和计算。 方法有很多,比如我们都学过的欧几里得,相关性系数,具体公式就不细讲了。真实的推荐系统的计算方式就复杂了,做系统的时候再深入了解好了。 ps:相关性系数可以修正用户标准不一致问题。比如有人打分苛刻,有人打分偏高导致推荐不一致的问题。2.存储方式:这里是一个全矩阵。用双层dict保存。稀疏矩阵:基于物品的存储空间要远基于用户密集矩阵:存储空间差不多如下图是个用户和物品的分数表,中间是分值。 比如user3对item3的打分是3. item1item2item3item4item5......【阅读全文】
发布时间:2013-01-13 13:41:20
好久前的笔记,翻出来整理了下,顺便mark之。一,史前时代之基于人口统计的推荐 顾名思义,就是针对用户的年龄,性别,地域等基本属性来推荐物品,会对这些基本属性属于一个分类的用户推荐一类物品。 它的优点是可以解决冷启动的问题,缺点是比较粗造。 例子: 第一次进入亚马逊,当当,推荐你本年度中国最受欢迎的热门书籍。 一点自己的看法: 1,推荐本质上是从数据中获取信息,信息就是用来消除不确定性的,这里可以避免冷启动不是由于他不需要数据,而是选择了直接利用了现实生活中信息,这......【阅读全文】