好早的时候就打算写这篇文章,但是还是参加阿里大数据竞赛的第一季三月份的时候实验就完成了,硬生生是拖到了十一假期,自己也是醉了。。。找工作不是很顺利,希望写点东西回顾一下知识,然后再攒点人品吧,只能如此了。
一、问题背景
二、基于用户的协同过滤算法介绍
三、数据结构和实验过程设计
四、代码...
分类:
编程语言 时间:
2014-10-03 21:50:45
阅读次数:
281
需求
在推荐系统场景中,如果基础行为数据太少,或者过于稀疏,通过推荐算法计算得出的推荐结果很可能达不到要求的数量。
比如,希望针对每个item或user推荐20个item,但是通过计算只得到8个,剩下的12个就需要补全。
欢迎转载,请注明出处:
策略
数据补全的具体策略是:
补全时机:在挖掘计算结束后,挖掘结果导入HBase(最终web系...
分类:
数据库 时间:
2014-09-29 21:15:51
阅读次数:
295
1.背景 最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。2.数据集一共五个字段,以tab隔开。分别是user编号,news编号,时间编号,新闻标题,对应当前月份的日...
分类:
编程语言 时间:
2014-09-25 10:43:58
阅读次数:
947
Overview of the Evaluated Algorithms for the Personal Recommendation Systems 顾名思义,这篇中文论文讲述的是推荐系统的评价方法,也就是,如何去评价一个推荐系统的好与不好。引言 1.个性化推荐系统通过建立用户与产品之间的二元....
分类:
其他好文 时间:
2014-09-24 21:44:47
阅读次数:
288
3.1冷启动问题简介: 冷启动问题(cold start)主要分三类: ? 用户冷启动 ? 物品冷启动 ? 系统冷启动 参考解决方案: ? 推热门 ? 利用用户的信息。(如:性别、年龄、地域等) ? 利用登录帐号的社交网络信息 ? 要求新用户登录时做一些反馈 3.2利用用户注册信息 ...
分类:
其他好文 时间:
2014-09-18 20:31:04
阅读次数:
123
基本上可以通过3种方式联系用户兴趣和物品: 用户喜欢过的物品(item-cf) 用户的好友或者有相似兴趣的好友喜欢过的物品(user-cf) 用户具有哪些feature, 哪些物品保护 之前用了user-cf,item-cf, 现在考虑使用标签进行推荐。 标签是一种无层次化结构的、用来描述信息的关键...
分类:
其他好文 时间:
2014-09-18 13:06:43
阅读次数:
362
在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门关键词的问题。 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些区别。 正好最近正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计。结论是: 没有某种算法能够完全解决问题, 多重算法+交互设计, 才能解决特定场景的需求。下文也对之前的一些博文进行梳理,构成一个完整工业界推荐系统所具有的方方面面(主要以百度关键词搜索推荐系统为例)...
分类:
其他好文 时间:
2014-09-17 21:57:22
阅读次数:
424
首先,要实现协同过滤,需要一下几个步骤:1.收集用户偏好;2.找到相似的用户或物品;3.计算推荐
分类:
其他好文 时间:
2014-09-14 23:26:37
阅读次数:
493
基于协同过滤的推荐 ,根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或者是发现用户的相关性,然后再基于这些关联性进行推荐。
分类:
其他好文 时间:
2014-09-14 21:56:47
阅读次数:
446