国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N ...
分类:
编程语言 时间:
2016-04-17 19:16:08
阅读次数:
241
PageRank诞生于2000年,以特定算法为页面排序,得分规模0-10(越高越好),能让用户直观地了解页面的价值等级,但也催生了巨大的SEO(查找引擎优化)地下产业,让许多毫无价值的页面也能得到高分。 这些年,Google现已逐步淡化PageRank的概念,比如说其Chrome浏览器就从未展现过, ...
分类:
其他好文 时间:
2016-04-13 20:43:04
阅读次数:
145
Hadoop是2013年最热门的技术之一,通过北风网robby老师<深入浅出Hadoop实战开发>、<Hadoop应用开发实战>两套课程的学习,普通Java开发人员可以在最快的时间内提升工资超过15000.成为一位完全精通Hadoop应用开发的高端人才。 Hadoop是什么,为什么要学习Hadoop ...
分类:
编程语言 时间:
2016-04-12 07:04:40
阅读次数:
214
算法的数学分析部分:可参考网络,或者Google PageRank 论文。此处不做讨论,或以后我彻底搞明白再论述。 代码实现: val sc = new SparkContext(...) val links = sc.parallelize(Array(('A',Array('D')),('B',
分类:
其他好文 时间:
2016-02-28 16:34:29
阅读次数:
144
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 早前评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive B
分类:
编程语言 时间:
2016-02-06 10:22:48
阅读次数:
256
PageRank,网页排名,又称网页级别,传说中是PageRank算法拯救了谷歌,它是根据页面之间的超链接计算的技术,作为网页排名的要素之一。它通过网络浩瀚的超链接关系来确定一个页面的等级。Google把从A页面到B页面的链接解释为A页面给B页面投票,根据投票的来源(甚至来源的来源,即链接到A页面的
分类:
编程语言 时间:
2016-01-30 18:16:18
阅读次数:
211
EdgeRank 是今年 Facebook 在 F8 开发者大会上提出的对 fb 新鲜事 (Feeds) 排序的新算法, 用于区别默认的按时间逆序的 timeline. 不像 PageRank 还有很多论文或学术界的资料,目前没有什么官方资料讨论 EdgeRank, 搜到的资料大部分来自在线广告代理...
分类:
其他好文 时间:
2015-12-07 22:40:49
阅读次数:
192
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N...
分类:
编程语言 时间:
2015-11-28 10:23:04
阅读次数:
139
译者:July二零一一年一月十五日-----------------------------------------参考文献:国际权威的学术组织ICDM,于06年12月年评选出的数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaB...
分类:
编程语言 时间:
2015-11-22 23:18:20
阅读次数:
223
PageRank的两种问题 spidertraps(蛛网陷阱) 在几个网页的节点之间跳转,经过一段很长的时间之后,只能在节点n来回跳转(也就是说不嫩访问到其他的网页,只能点击访问节点n这个网页)。 解决方法: 在访问节点n的几率接近于1的时候,让他随机的跳转到任意一个网页(唉网页...
分类:
其他好文 时间:
2015-11-12 23:18:11
阅读次数:
280