本项目是基于Spark MLLib的大数据电商推荐系统项目,使用了scala语言和java语言。基于python语言的推荐系统项目会另外写一篇博客。在阅读本博客以前,需要有以下基础:1.linux的基本命令2.至少有高中及以上的数学基础。3.至少有java se基础,会scala语言和Java
EE更佳(Jave EE非必需,但是可以帮助你更快理解项目的架构)。4.有github账户,并且至少知道git clone,fork,branch的概念。5。有网络基础,至少知道服务器端和客户端的区别。6.有大数据基础,最好会Hadoop,HDFS,MapReduce,Sqoop,HBase,Hive,Spark,Storm。7.有mysql数据库基础,至少会最基本的增删改查。
分类:
其他好文 时间:
2018-12-03 20:00:55
阅读次数:
697
一、基本介绍 1. 推荐系统任务 推荐系统的任务就是联系用户和信息一方面帮助用户发现对自己有价值的信息,而另一方面让信息能够展现在对它感兴趣的用户面前从而实现信息消费者和信息生产者的双赢。 2. 与搜索引擎比较 相同点:帮助用户快速发现有用信息的工具 不同点:和搜索引擎不同的是推荐系统不需要用户提供... ...
分类:
其他好文 时间:
2018-12-02 14:21:01
阅读次数:
318
一、 基于内容推荐 概念:根据物品的相关信息发现不同物品的相关程度,根据用户以往的喜好记录,推荐给用户相似的物品。 例如,在电影推荐中,基于内容的系统首先分析用户已经看过的打分比较高的电影的共性(演员、导演、风格等),再推荐与这些用户感兴趣的电影内容相似度高的其他电影。 优缺点: 优点: 1) 具有 ...
分类:
编程语言 时间:
2018-12-01 21:50:22
阅读次数:
355
【学途无忧网】大数据推荐系统算法代码全接触(企业内训,现场实录,机器学习算法+Spark实现)课程下载:https://pan.baidu.com/s/1piCNIxC2Sv0zMY0yWxY9Ug提取码:b10v一、课程简介:推荐系统是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户
分类:
编程语言 时间:
2018-11-27 16:55:18
阅读次数:
214
【学途无忧网】大数据推荐系统算法代码全接触(企业内训,现场实录,机器学习算法+Spark实现)课程下载:https://pan.baidu.com/s/1piCNIxC2Sv0zMY0yWxY9Ug提取码:b10v一、课程简介:推荐系统是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户
分类:
编程语言 时间:
2018-11-27 16:42:18
阅读次数:
154
Web上数据的增长使得在完整的数据集上使用许多机器学习算法变得更加困难。特别是对于个性化推荐问题,数据采样通常不是一种选择,需要对分布式算法设计进行创新,以便我们能够扩展到这些不断增长的数据集。 协同过滤(CF)是其中一个重要的应用领域。CF是一种推荐系统技术,能够帮助人们发现感兴趣的东西。在Fac ...
分类:
其他好文 时间:
2018-11-25 01:20:14
阅读次数:
310
1 问题公式化 假如我们是一个电影供应商,有5不影片和4个用户,我们要求用户为电影打分: 2 基于内容的推荐算法 假设每部电影有两个特征,x1代表电影的浪漫程度,x2代表电影的动作程度。 给予这些特征来构建一个推荐算法,假设采用回归模型,我们针对每一个用户都训练一个回归模型,如θ(1)为第一个用户A ...
分类:
其他好文 时间:
2018-11-23 12:33:18
阅读次数:
225
协同过滤推荐的主要思想:利用已有用户群过去的行为或意见预测当前用户最可能喜欢哪些东西或对哪些东西感兴趣。 纯粹的协同过滤方法的输入数据只有给定的用户—物品评分矩阵,输出数据一般有以下几种类型: 2.1 基于用户的最近邻推荐 它的主要思想:首先,给定一个评分数据集和当前用户的id作为输入,找出与当前用 ...
分类:
其他好文 时间:
2018-11-16 13:20:20
阅读次数:
294
你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好?1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的?3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则?4、什么是:协同过滤、n-grams,mapreduce、余弦距
分类:
其他好文 时间:
2018-11-16 10:57:52
阅读次数:
380
一、冷启动问题介绍 如何在没有大量用户数据的情况下设计个性化推荐系统并让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。 用户冷启动:如何给新用户做个性化推荐 物品冷启动:如何将新物品推荐给可能对其感兴趣的用户。在新闻网站等时效性很强的网站中非常重要。 系统冷启动:如何在一个新开发的网站上设 ...
分类:
其他好文 时间:
2018-11-10 12:40:02
阅读次数:
247