码迷,mamicode.com
首页 >  
搜索关键字:mahout taste cf    ( 3181个结果
协同过滤User-based算法与Item-based算法对比
CF算法分为两大类,一类为基于memory的(Memory-based),也叫基于用户的(User-based),另一类为基于Model的(Model-based),也叫基于物品的(Item-based)。 User-based的基本思想是如果用户A喜欢物品a,用户B喜欢物品a、b...
分类:其他好文   时间:2014-05-08 19:15:35    阅读次数:280
Mahout 中基于SVD 的协同过滤原理
SVD原理: http://blog.csdn.net/wuyanyi/article/details/7964883
分类:其他好文   时间:2014-05-08 14:43:13    阅读次数:317
【GCD PROBLEM】CF 16.C——Monitor
SD五一赛中也出了这个问题。 来源:点击打开链接 改成了多组样例。 思路还是很简单的。给出一个最大长和宽,还有推荐比例,求解符合比例的图形中面积最大的情况。这样的话,先对比例进行约分。然后根据比例式的性质,交叉相乘比一下大小,在思维不混乱的情况下,可以看出比例长度大于实际长度的时候,合法结果不存在。y:比例y>x:比例x的时候,保留X部分为最大值,反之保留Y的宽度为最大值。 思维不要乱。 ...
分类:其他好文   时间:2014-05-07 04:17:57    阅读次数:294
体验游戏编程网站
最近学习python,想要找点练习,在看《python核心编程》(真是一本好书,非常详细,觉得看这一本书就够了,余下可以翻翻文档)。觉得cf之类的虽然能用python提交但是重点不是在学习python上 。终于找到了两个不错的网站checkio和pythonchallenge。今天先看看了看chec...
分类:Web程序   时间:2014-05-06 13:06:04    阅读次数:517
Mahout安装
在Hadoop集群环境下安装Mahout。环境:OS:Centos 6.5 x64 & Soft:Hadoop 1.2.1 & Mahout 0.91、简介mahout项目主页:https://mahout.apache.org/下载二进制包,上传到服务器。2、安装用集群环境用户安装,解压二进制包。...
分类:其他好文   时间:2014-05-05 21:35:23    阅读次数:429
当数据达到千万时,索引键上有多列索引会失效。
一客户计件系统越用越慢(表内才1000W多条数据),当时做系统为了赶时间,在设计索引时,一个索引名添加了多个索引列。当数据量在百万内是看不出什么问题,数据一但上千万时,索引列会直接失效,此时服务器CPU猛飚。之前做索引为了省几分钟,导致今天折腾了N个小时,,,,,,晚上CF虐小学生的计划泡汤了
分类:其他好文   时间:2014-05-05 12:51:15    阅读次数:286
Mahout学习
Mahout小案例学习,实现k-means算法。环境:OS:Centos 6.5 x64 & Soft:Hadoop 1.2.1 & Mahout 0.91、下载测试数据[huser@master hadoop]$ wget http://archive.ics.uci.edu/ml/databas...
分类:其他好文   时间:2014-05-04 12:34:58    阅读次数:340
CF(427D-Match & Catch)后缀数组应用
题意:给两个字符串,求一个最短的子串。使得这个子串在两个字符串中出现的次数都等于1.出现的定义为:可以重叠的出现。 解法:后缀数组的应用。从小枚举长度。如果一个长度len合法的话:则一定存在这个样的sa[i]排名。sa[i]与s[i+1]的公共前缀长度大于等于len,且sa[i]与[i-1]的公共前缀长度小于len,同时sa[i+1]与[i+2]的公共前缀长度小于len,同时保证sa[i...
分类:其他好文   时间:2014-05-04 09:42:00    阅读次数:275
CF 427D Match & Catch 求最短唯一连续LCS
题目来源:CF 427D Match & Catch 题意:给出2个字符串 求最短的连续的公共字符串 并且该字符串在原串中只出现一次 思路:把2个字符串合并起来求height 后缀数组height的应用 #include #include #include using namespace std; const int maxn = 100010; char s[maxn]; int s...
分类:其他好文   时间:2014-05-04 09:32:45    阅读次数:315
CF:Problem 427C - Checkposts强连通Tarjan算法
这题昨晚做了,刚开始看题的时候没想出好法子,然后就看D题了,一看D题发现是后缀数组,然后就把模板改了点就交了上去……不幸的是……WA了,然后重新看题,果然题目看漏了……不仅要用后缀数组和前缀数组求出公共子缀,还要是求最小的,而且在每个串里都不能重复的,这下就想了会不会了,然后看见大帝C过了,然后就重新回来看C了,看了会终于明天怎么做了。 C题意:给个图,然后每个点都有权值,求最小的花费及方案数;...
分类:其他好文   时间:2014-05-03 21:44:35    阅读次数:260
3181条   上一页 1 ... 315 316 317 318 319 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!