在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题 1 什么是协同过滤 协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如 ...
分类:
其他好文 时间:
2016-10-15 17:06:16
阅读次数:
197
Hadoop适合应用于大数据存储和大数据分析的应用,适合于服务器几千台到几万台的集群运行,支持PB级的存储容量。Hadoop典型应用有:搜索、日志处理、推荐系统、数据分析、视频图像分析、数据保存等。但是Hadoop的使用范围远小于SQL或Python之类的脚本语言,所以不要盲目使用Hadoop。不过 ...
分类:
其他好文 时间:
2016-10-12 17:07:44
阅读次数:
156
1. 我们为什么需要推荐系统?“推荐”可是个当红话题。Netflix愿意用百万美金召求最佳的电影推荐算法,Facebook也为了登陆时的推荐服务开发了上百个项目,遑论现在市场上各式各样的应用都需要个性化服务。“从互联网中提取信息犹如用消防栓饮水”(Mitchell Kapor)。如今的信息量早已过载 ...
分类:
其他好文 时间:
2016-10-12 06:42:26
阅读次数:
302
“推荐”可是个当红话题。Netflix愿意用百万美金召求最佳的电影推荐算法,Facebook也为了登陆时的推荐服务开发了上百个项目,遑论现在市场上各式各样的应用都需要个性化服务。“从互联网中提取信息犹...
分类:
其他好文 时间:
2016-10-10 21:10:48
阅读次数:
198
大概用了一个月,Andrew Ng老师的机器学习视频断断续续看完了,以下是个人学习笔记,入门级别,权当总结。笔记难免有遗漏和误解,欢迎讨论。 鸣谢:中国海洋大学黄海广博士提供课程视频和个人笔记,在此深表感谢! ...
分类:
其他好文 时间:
2016-10-07 13:32:54
阅读次数:
287
Anomaly Detection and Recommender Systems 本周编程作业分为两部分:异常检测和推荐系统。 异常检测:本质就是使用样本的到特种值的gaussian分布,来预估正确的特征值的范围。对于一些特殊情况可以使用,多元高斯分布。 要注意该方法与监督学习的不同的适用性特征。 ...
分类:
系统相关 时间:
2016-10-06 22:32:35
阅读次数:
216
链接:http://www.zhihu.com/question/20326697/answer/58148605 推荐算法大致可以分为三类:基于内容的推荐算法、协同过滤推荐算法和基于知识的推荐算法。 基于内容的推荐算法,原理是用户喜欢和自己关注过的Item在内容上类似的Item,比如你看了哈利波特 ...
分类:
编程语言 时间:
2016-09-30 02:12:43
阅读次数:
176
介绍奇异值分解+python代码实践,SVD在图片压缩以及推荐系统中有广泛的应用场景 ...
分类:
编程语言 时间:
2016-09-21 21:33:59
阅读次数:
198
一个开源的,高可靠,可扩展的分布式计算框架 解决的问题 1 海量数据的存储(HDFS) 2海量数据的分析(Mapreduce) 3 分布式资源调度 (Yarn) 应用场景 日志分析,基于海量数据的在线应用,推荐系统,计算广告,复杂算法,网盘,搜素引擎,,,, 一 HDFS 动态增加,自动备份 二 m ...
分类:
其他好文 时间:
2016-09-17 23:32:08
阅读次数:
194
代码基本来自项亮的<推荐系统实践>,把书上的伪代码具体实现,还参考了https://www.douban.com/note/336280497/ 还可以加入对用户相似性的归一化操作,效果会更好。 数据集为MovieLens的10万条数据. 链接:MoiveLens ...
分类:
编程语言 时间:
2016-09-07 22:41:18
阅读次数:
301