如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。 冷启动问题主要分为三类: (1) 用户冷启动:如何给新用户做个性化推荐的问题,新用户刚使用网站的时候,系统并没有他的行为数据; (2) 物品冷启动:解决如何将新的物品推荐给可能对它感兴趣的 ...
分类:
其他好文 时间:
2017-10-13 10:11:57
阅读次数:
146
1.怎么做推荐系统: 推荐系统架构:在一个公司,要做一个推荐系统,要分三层:a:第一层,offline层,线下层,对海量数据进行离线加工的,例如:mapreduce。b:第二层,nearline层,线下和在线夹着的,允许你的数据有延迟的,但是不要延迟太大,利用流式处理技术,对实时产生的数据做加工,如 ...
分类:
其他好文 时间:
2017-10-01 17:34:58
阅读次数:
182
LDA 1 概述 LDA(Latent Dirichlet allocation)潜在狄立克雷分配模型,它是将文档集中每篇文档的主题按照概率分布的形式给出,是一种典型的概率生成性模型,能够发现语料库中潜在的主题信息,因此也称为LDA主题模型。它是一种无监督学习,可以应用于推荐系统之中,其优点在于无需... ...
分类:
其他好文 时间:
2017-09-30 13:24:22
阅读次数:
161
1,日志的采集从flumeagent上的数据一般分到两条线上一条是kafka集群,后期可以用流式处理(sparkstreaming或storm等等)一条是到hdfs,后期可以用hive处理,业界叫lambda架构architecture(一般公司的推荐系统,就是用这种架构)flume-ngagent采集收集日志后,聚合在一个节点上..
分类:
其他好文 时间:
2017-09-20 23:26:56
阅读次数:
216
均值归一化可以让算法运行得更好。 现在考虑这样一个情况:一个用户对所有的电影都没有评分,即上图所示 的Eve用户。现在我们要学习特征向量(假设n=2) 以及用户5的向量θ(5),因为用户Eve没有对任何电影打分,所以前面的一项为0,只有后面正则化的项,所以影响θ取值的只有后面的θ的正则化的项。所以要 ...
分类:
其他好文 时间:
2017-09-19 22:52:27
阅读次数:
225
@Matthew?【[抱拳]】推荐系统中,传统的两大算法,无论是基于人的过滤,还是基于物品的过滤,在前期历史数据的量和质都不充足的情况下,这两种传统的算法都无法冷启动。 【基于ANN的一种解决办法】 张三第一次点击了汽车广告,通过ANN训练,使得输出层的汽车的概率最大,次之的就为接下来要投出的广告类 ...
分类:
其他好文 时间:
2017-09-19 21:21:18
阅读次数:
168
如上图中的predicted ratings矩阵可以分解成X与ΘT的乘积,这个叫做低秩矩阵分解。 我们先学习出product的特征参数向量,在实际应用中这些学习出来的参数向量可能比较难以理解,也很难可视化出来,但是它们是做为区分不同电影的特征 怎么来区分电影i与电影j是否相似呢?就是判断X(i)与X ...
分类:
其他好文 时间:
2017-09-19 21:14:35
阅读次数:
257
协同过滤(collaborative filtering )能自行学习所要使用的特征 如我们有某一个数据集,我们并不知道特征的值是多少,我们有一些用户对电影的评分,但是我们并不知道每部电影的特征(即每部电影到底有多少浪漫成份,有多少动作成份) 假设我们通过采访用户得到每个用户的喜好,如上图中的Ali ...
分类:
其他好文 时间:
2017-09-18 22:35:57
阅读次数:
326
本文介绍如何接入腾讯云智能推荐, 快速获得上百人专业算法团队、二十亿+用户画像、几乎覆盖全部网民的推荐系统能力。 ...
分类:
其他好文 时间:
2017-09-15 16:50:44
阅读次数:
250
课程定位: 注重基础、故事性 机器学习定义: data - Algo - improve 机器学习使用条件 1、有优化的目标,可量化的。 2、规则不容易写下来,需要学习。 3、要有数据 一个可能的推荐系统: skill: 预测用户给电影的打分 用户的各个特征 * 电影的各个特征。。。 机器学习明确定 ...
分类:
其他好文 时间:
2017-09-07 00:51:55
阅读次数:
194