可能最近做二分和DFS做傻了? 小明刚刚入职淘宝,老大给他交代了一个简单的任务,实现一个简易的商品推荐系统。 这个商品推荐系统的需求如下: 一共有 nn 件商品可以被推荐,他们的编号分别为 11 到 nn。每件商品都有一个价格,编号为 ii 的商品价格为 p_ipi? 元。现在需要给用户推荐尽可能多 ...
分类:
其他好文 时间:
2018-05-13 23:14:38
阅读次数:
264
词频处理 tf/idf. 协同过滤 1.Co-occurence matrix. Normalize co-occurrence Similarity matrix. 1.1 Jaccard similarity: normalizes by popularity Who purchased i a ...
分类:
其他好文 时间:
2018-05-13 12:02:01
阅读次数:
129
import org.apache.spark.ml.feature._ import org.apache.spark.ml.param.ParamMap import org.apache.spark.ml.classification.LogisticRegression import org ...
分类:
其他好文 时间:
2018-05-11 23:19:02
阅读次数:
216
推荐系统测评 实验方法 离线实验:准备训练数据测试数据并评估; 用户调查:问卷方式、和用户满意度调查 在线实验:AB测试:AB测试是一种很常用的在线评测算法的实验方法。它通过一定的规则将用户随机分成几组, 并对不同组的用户采用不同的算法,然后通过统计不同组用户的各种不同的评测指标比较不同算 法,比如 ...
分类:
其他好文 时间:
2018-05-06 17:27:54
阅读次数:
301
讲师: 徐雪岩 讲师简介: 猎聘网大数据研究院高级数据分析师,独立负责推荐系统相关数据分析工作。 主要从事:监控指标系统设计与开发,业务问题与优化洞察,数据建模,业务优化方案设计、试验测试与效果评估等。 分享大纲: 猎聘在推荐系统的实践应用中发现,在比较不同的推荐排序算法孰优孰劣上,交叉试验与企业常 ...
分类:
编程语言 时间:
2018-05-04 13:55:13
阅读次数:
242
中文论文:三种常用的缺失值填充方法 https://wenku.baidu.com/view/94cb418f4693daef5ef73dd8.html 聊聊奇异值分解在缺失值填补中的应用 https://ask.hellobi.com/blog/mlanddlanddm/6744 PCA和SVD降 ...
分类:
其他好文 时间:
2018-05-02 16:12:10
阅读次数:
898
Factorization Machines 1. 论文提出了 Factorization Machine (因子分解机模型)来解决稀疏数据问题。并与支持向量机和矩阵分解算法(如SVD++)进行对比。 FM模型在稀疏数据下可以同时训练一次项参数和二次项参数。设输入向量 $\mathbf{x} = ( ...
分类:
其他好文 时间:
2018-05-01 20:40:32
阅读次数:
179
准确率。推荐给用户的商品中,属于测试集的比例,数学公式$P(L_{u})=\frac{L_{u}\bigcap B_{u}}{L_{u}}$ 。整个测试集的准确率为 $P_{L}=\frac{1}{n}\sum_{u\epsilon U}P(L_{u})$ 召回率。测试集中有多少在用户的推荐列表中。 ...
分类:
其他好文 时间:
2018-05-01 15:13:48
阅读次数:
179
K近邻算法(KNN)是指一个样本如果在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。即每个样本都可以用它最接近的k个邻居来代表。KNN算法适合分类,也适合回归。KNN算法广泛应用在推荐系统、语义搜索、异常检测。 KNN算法分类原理图: 图中 ...
分类:
编程语言 时间:
2018-04-30 23:33:16
阅读次数:
479
作者:个推大数据工程师李树桓在当下,人工智能的浪潮席卷而来。从AlphaGo、无人驾驶技术、人脸识别、语音对话,到商城推荐系统,金融业的风控,量化运营、用户洞察、企业征信、智能投顾等,人工智能的应用广泛渗透到各行各业,也让数据科学家们供不应求。Python和R作为机器学习的主流语言,受到了越来越多的关注。数据学习领域的新兵们经常不清楚如何在二者之间做出抉择,本文就语言特性与使用场景为大家对比剖析。
分类:
编程语言 时间:
2018-04-26 12:15:43
阅读次数:
169