总的来说,信息爆炸,产生了信息过载。解决的方法主要有两类:检索和推荐。检索是主动的有目的的、意图明确,推荐是非主动的、意图不明确。 推荐方面最经典的,就是协同过滤推荐了。我博客这里有两篇,一篇偏理论,一篇讲ALS实战。 《协同过滤 CF & ALS 及在Spark上的实现》 《协同过滤 & Spar ...
分类:
编程语言 时间:
2017-01-07 01:27:34
阅读次数:
154
(上接第二章) 4.3.1 KMeans 算法流程 算法的过程如下: (1)从N个数据文档随机选取K个文档作为质心 (2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类 (3)重新计算已经得到的各个类的质心 (4)迭代(2)~(3)步直至新的质心与原质心相等或者小于指定阀值,算法结 ...
分类:
编程语言 时间:
2017-01-05 17:54:31
阅读次数:
311
奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域。是很多机器学习算法的基石。本文就对SVD的原理做一个总结,并讨论在在PCA降维算法中是如何运用运用SV ...
分类:
其他好文 时间:
2017-01-05 16:54:17
阅读次数:
208
以前我开过一些帖子,我们内部也做过一些讨论,我们从张小龙的碎屏图中 ,发现了重要讯息: 1:微信支付将成为重要场景; 2:这些应用与春节关系不小,很多应用在春节时,有重要的场景开启可能性; 3:春节是一个重要的推广时机,非常适合推广,微信应该不会错过这个时机; 4:春节前需要做好准备,那么预留一定的 ...
分类:
微信 时间:
2016-12-29 23:23:16
阅读次数:
335
高并发IM系统架构优化实践http://click.aliyun.com/m/8768/老司机推荐:云端建站10分钟快速上手教程http://click.aliyun.com/m/8769/万亿user_tags级实时推荐系统数据库设计http://click.aliyun.com/m/8770/新 ...
分类:
其他好文 时间:
2016-12-28 17:19:22
阅读次数:
189
机器学习(十三)——机器学习中的矩阵方法(3)病态矩阵、协同过滤的ALS算法(1)
分类:
编程语言 时间:
2016-12-12 09:56:46
阅读次数:
425
理论原理部分可以看这一篇:http://www.cnblogs.com/charlesblc/p/6109551.html 这里是实战部分。参考了 http://www.cnblogs.com/shishanyuan/p/4747778.html 采用了三个案例,分别对应聚类、回归和协同过滤的算法。 ...
分类:
其他好文 时间:
2016-12-11 12:13:35
阅读次数:
170
搜索推荐,主要有以下几种形式:一、根据人口统计学推荐:此推荐方式需要建立用户模型,并且需要获取用户的具体信息,然后根据矩阵运算,计算相似度,此方式最大缺陷是获取用户的隐私,应用不多; 二、基于内容的推荐:根据特定用户的历史数据,推荐出相似的产品。缺点是需要建立item model,比较费时。 三、基 ...
分类:
其他好文 时间:
2016-11-28 23:46:45
阅读次数:
790
在之前的随笔《非对称SVD电影推荐系统》中应用SVD,得到还不错的结果。 此次尝试将BP神经网络应用于预测用户评分,由于同类用户不同电影评分差异巨大,神经网络输出神经元不易设置。 仅取movie id=0 的用户作为测试数据(350 条记录),这样只需要5个输出神经元。考虑到movie id 共有三 ...
分类:
其他好文 时间:
2016-11-26 23:38:27
阅读次数:
225
作者:刑无刀链接:https://zhuanlan.zhihu.com/p/23847246来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 一年一度的ACM Recsys会议在9月份已经胜利闭幕,留下一堆slides和tutorials等着我们去学习。 翻看今年的各种 ...
分类:
其他好文 时间:
2016-11-25 20:49:15
阅读次数:
252