你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好?1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的?3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则?4、什么是:协同过滤、n-grams,mapreduce、余弦距
分类:
其他好文 时间:
2018-11-16 10:57:52
阅读次数:
380
一、基本介绍 1. 推荐系统任务 推荐系统的任务就是联系用户和信息一方面帮助用户发现对自己有价值的信息,而另一方面让信息能够展现在对它感兴趣的用户面前从而实现信息消费者和信息生产者的双赢。 2. 与搜索引擎比较 相同点:帮助用户快速发现有用信息的工具 不同点:和搜索引擎不同的是推荐系统不需要用户提供 ...
分类:
其他好文 时间:
2018-11-03 14:39:22
阅读次数:
329
一、概念 关联(Association) 关联就是把两个或两个以上在意义上有密切联系的项组合在一起。 关联规则(AR,Assocaition Rules) 用于从大量数据中挖掘出有价值的数据项之间的相关关系。(购物篮分析) 协同过滤(CF,Collaborative Filtering) 协同过滤常 ...
分类:
编程语言 时间:
2018-11-03 02:08:55
阅读次数:
239
协同过滤算法概述 基于模型的协同过滤应用 电影推荐 实时推荐架构分析 协同过滤算法概述 基于模型的协同过滤应用 电影推荐 实时推荐架构分析 一、协同过滤算法概述 本人对算法的研究,目前还不是很深入,这里简单的介绍下其工作原理。 通常,协同过滤算法按照数据使用,可以分为: 1)基于用户(UserCF) ...
分类:
编程语言 时间:
2018-10-23 18:05:38
阅读次数:
193
两步走: 一、计算物品间的相似度 1、相似度算法 喜欢物品i的用户中有多少比例的用户也喜欢j;问题:j存在热门商品问题,因为j很流行,喜欢 j 的用户可能包含喜欢 i 的用户,则相似度基本是1,导致任何物品和热门物品的相似度都近似为1,这对于挖掘长尾的系统不好 惩罚 热门 j 的权重 惩罚活跃用户 ...
分类:
编程语言 时间:
2018-10-20 19:48:37
阅读次数:
179
仅仅基于用户行为数据设计的推荐算法一般称为协同过滤算法,方法有: 隐语义模型 基于图的随机游走算法 基于邻域的方法:应用最广泛 基于用户的协同过滤算法:给用户推荐和他兴趣相似的其他用户喜欢的物品 基于物品的协同过滤算法:给用户推荐和他之前喜欢的物品相似的物品 基于用户的协同过滤算法:给用户推荐和他兴 ...
分类:
编程语言 时间:
2018-10-20 16:24:21
阅读次数:
195
协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filterin ...
分类:
编程语言 时间:
2018-10-06 16:39:42
阅读次数:
239
推荐系统 通常分析过去的事务以建立用户和产品之间的联系,这种方法叫做 协同过滤 。 协同过滤有两种形式:隐语义模型(LFM),基于邻域的模型(Neighborhood models)。 本篇文章大部分内容为大神Koren的 "Factorization Meets the Neighborhood: ...
分类:
其他好文 时间:
2018-09-04 20:19:23
阅读次数:
170
1. CF协同过滤推荐算法原理及应用 1.1 概述 什么是协同过滤(Collaborative Filtering,简称CF)? 首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做? 大部分的人会问问周围id朋友,看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类 ...
分类:
编程语言 时间:
2018-08-27 21:27:48
阅读次数:
176
template <class T1, class T2>double Pearson(std::vector<T1> &inst1, std::vector<T2> &inst2) { if(inst1.size() != inst2.size()) { std::cout<<"the size ...
分类:
编程语言 时间:
2018-08-26 11:55:09
阅读次数:
507