国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N...
分类:
编程语言 时间:
2015-01-13 01:22:53
阅读次数:
246
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N...
分类:
编程语言 时间:
2015-01-12 20:41:20
阅读次数:
207
如图为谷歌矩阵的模型:
首先这是一个四乘以四的矩阵,行从1 2 3 4
列1 2 3 4
0表示没有指向自己的连接,非零表示有指向自己的连接。
那么其中的 1/3 和 1/2是什么意思?
是这样的,表示第一列代表的是1, 第二列代表的是2
那么第一个一共有三个指向外面的箭头,那么每一个就是1/3.
这就是很经典的核心算法PageRank....
分类:
编程语言 时间:
2015-01-11 01:03:11
阅读次数:
367
辨别 “百度权重”作弊的手法 程序员在做PHP项目的同时,也要有辨别百度权重的作弊手法,所谓的“百度权重”,指的是爱站、站长工具等网站推出的针对网站关键词排名预计给网站带来流量而划分的评估数据。“百度权重”并不是像谷歌的PageRank那样的对网站的综合评级的算法,而只是针对关键词排名方面给网站带....
分类:
其他好文 时间:
2015-01-06 11:35:15
阅读次数:
256
简介:spark是一个内存计算框架,解决了mapreduce在迭代与交互方面的不足迭代:多轮算法计算形式,pagerank,逻辑回归等交互:实时数据,数据仓库查询等spark重要概念:RDD: 弹性分布式数据集,弹性(数据多节点分片)分布式(集群节点)数据集(默认加载至内存)操作:转换(transformation)rdd..
分类:
其他好文 时间:
2014-12-26 14:47:34
阅读次数:
186
PageRank算法的MapReduce实现...
分类:
编程语言 时间:
2014-12-22 16:18:48
阅读次数:
212
博主虽然学计算机出身,惭愧的是对计算机的许多方向都不了解。决定从现在开始,多读书,对各个方向都看一看。刚看完数学之美这本书,介绍了许多数学原理在计算机行业的应用。博主想简单总结一下,本篇主要围绕搜索引擎技术来介绍。
当我们在Google搜索框里面打一个词时,Google可以立即返回全网的搜索结果。这看似简单的背后,其实有着很复杂的处理过程。能够这么快的返回查询结果,依赖于搜索引擎对全网知识所做的...
分类:
其他好文 时间:
2014-12-21 00:44:05
阅读次数:
199
原文引自:原文引自:http://blog.csdn.net/hguisu/article/details/7996185 感谢1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早...
分类:
编程语言 时间:
2014-12-18 18:36:53
阅读次数:
199
原文引自:http://blog.csdn.net/hguisu/article/details/8005192,感谢前面的讨论提到。PageRank忽略了主题相关性,导致结果的相关性和主题性降低,对于不同的用户,甚至有很大的差别。例如,当搜索“苹果”时,一个数码爱好者可能是想要看 iphone 的...
分类:
编程语言 时间:
2014-12-18 18:13:17
阅读次数:
181
本文引自http://blog.jobbole.com/23286/很早就对Google的PageRank算法很感兴趣,但一直没有深究,只有个轮廓性的概念。前几天趁团队outing的机会,在动车上看了一些相关的资料(PS:在动车上看看书真是一种享受),趁热打铁,将所看的东西整理成此文。本文首先会讨论...
分类:
编程语言 时间:
2014-12-18 10:09:45
阅读次数:
392