搜索,广告与推荐的比较搜索搜索广告显示广告推荐首要准则相关性投资回报率(ROI)用户兴趣其他需求各垂直领域独立定义质量,安全性(Safety)多样性(diversity),新鲜度(freshness)索引规模~十亿级~百万级--千万级~百万级~百万级--亿级个性化较少的个性化需求~亿级用户规模上的个...
分类:
其他好文 时间:
2015-06-29 20:00:07
阅读次数:
273
在广告推荐系统中,利用用户和广告之间的信息作为预测的特征
预测的过程其实就是一个二分类的问题,主要就是判定一个用户对这个广告点击或者是不点击的概率是多少
而这个过程是一个伯努利函数,整个过程是一个伯努利分布
而在逻辑回归中主要是在线性回归的基础上利用了一个逻辑函数sigmod,而为什么要用这个函数,逻辑回归与线性回归之间的关系:
1 广义线性模型:
指数家...
分类:
其他好文 时间:
2015-04-26 18:25:38
阅读次数:
149
笔试: 主要考察智力和数据挖掘题目表示对数据挖掘的算法基本不了解。。1)智力题目1. 小白鼠,饮料,检测有毒饮料问题?http://www.cnblogs.com/purejade/2. 立方体空间问题?3. 饮料瓶换饮料问题?最少需要多少瓶饮料? 逆向思维。4. 无监督学习算法和监督学习算法区别,...
分类:
其他好文 时间:
2015-01-30 19:27:16
阅读次数:
139
我们的Hadoop生产环境有两个版本,其中一个是1.0.3,为了支持日志压缩和split,我们添加了hadoop-1.2中关于Bzip2压缩的feature. 一切运行良好。
为了满足公司对迭代计算的需求(复杂HiveSQL,广告推荐算法,机器学习 etc), 我们构建了自己的Spark集群,最初是Standalone Mode,版本spark-0.9.1,支持Shark。
上线后,问题接踵而...
分类:
编程语言 时间:
2015-01-14 11:10:35
阅读次数:
403
一、中文分词:分词就是利用计算机识别出文本中词汇的过程。
1.典型应用:汉字处理:拼音输入法、手写识别、简繁转换 ;信息检索:Google 、Baidu ;内容分析:机器翻译、广告推荐、内容监控
;语音处理:语音识别、语音合成 。 2.分词难点:歧义、新词等。 3.分词技术:机械分词(查词典FMM/...
分类:
其他好文 时间:
2014-06-07 06:04:35
阅读次数:
511
接到阿里电话说实习和竞赛智能二选一, 真伤心, 在实习前发挥余热吧.
总结一下在ODPS下 编写map / reduce 和进行购买预测的过程.
首先这里的hadoop输入输出都是表的形式, 我们需要一张输入表和一张输出表.
输入表为 提供的 t_alibaba_bigdata_user_brand_total_1 输出表为自定义的wc_out
w...
分类:
其他好文 时间:
2014-05-09 02:33:28
阅读次数:
418