视乎已经听到或看到无数遍数据挖掘了,那么,你知道那是什么吗?关于什么是数据挖掘,很多学者和专家给出了不同的定义,以下我们列出几种常见的说法:...
分类:
其他好文 时间:
2014-11-28 01:07:05
阅读次数:
240
前言现今Spark正是风头正劲时,Spark本是UCBerkeley的AMPLab诞生的项目,后来捐赠给了Apache来管理源码和后续发展。今年从Apache孵化器终于孵化出了1.0版本。其对大数据的支持从内存计算和流处理,到交互式查询,一直到图计算和机器学习,可谓摆开了架势、拉长了战线,一方面挑战老前辈Hadoop和MapReduce,另一方面又随时准备迎接同样的后起之秀的挑战。大数据的今天今天...
分类:
其他好文 时间:
2014-11-27 20:30:03
阅读次数:
251
做图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最牛的几个超级大拿(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文...
分类:
其他好文 时间:
2014-11-27 20:20:29
阅读次数:
335
在机器学习范畴,根据反馈的不同,学习技术可以分为监督学习(Supervised learning)、非监督学习(Unsupervised learning)和强化学习(Reinforcement learning)三大类。其中强化学习是一种以环境反馈作为输入的、特殊的、适应环境的机器学习方法。所谓强...
分类:
其他好文 时间:
2014-11-27 18:06:35
阅读次数:
168
上周写完了该代码,但是由于没有注意到softmax相关的实现故结果不对,更正后可以得到正确结果,用200幅图片训练200次可以得到90%以上的正确率,参数设置还有待于优化,另外可以考虑用多线程加速,此处目前还有问题(有待于修改,慎用)。推导请参考之前的文章http://blog.csdn.net/xuanyuansen/article/details/41214115。...
分类:
编程语言 时间:
2014-11-27 12:42:24
阅读次数:
323
目前机器学习最热门的领域有以下七个,后面给出相应的资料链接:1. 迁移学习Transfer learning 。 http://www.cse.ust.hk/TL/index.html2. 半监督学习Semi-Supervised learning 。 http://pages.cs.wisc.ed...
分类:
其他好文 时间:
2014-11-27 12:40:01
阅读次数:
138
机器学习问题方法总结大类名称关键词有监督分类决策树信息增益分类回归树Gini指数,Χ2统计量,剪枝朴素贝叶斯非参数估计,贝叶斯估计线性判别分析Fishre判别,特征向量求解K最邻近相似度度量:欧氏距离、街区距离、编辑距离、向量夹角、Pearson相关系数逻辑斯谛回归(二值分类)参数估计(极大似然估计...
分类:
其他好文 时间:
2014-11-27 12:34:58
阅读次数:
369
L-BFGS算法由于其高效的性能而被广泛运用在实际工程中,本文首先介绍L-BFGS算法和其它算法的比较,然后详细介绍该算法的主要思想以及每一步迭代时近似矩阵的更新细节。...
分类:
编程语言 时间:
2014-11-27 10:48:46
阅读次数:
214
之前对于推荐,一直都仅限于理论书籍,浅一点像《集体智慧编程》《推荐系统实践》,复杂的像《数据挖掘》《机器学习》,当然也没看太深入。当时对推荐系统的看法是,这是一个以算法为核心的系统,一切价值体现都在算法模型上了。不过这段时间有幸参与到真实系统,稍有改观。下最近的一些想法吧,当然作为一个系统开发人员,...
分类:
其他好文 时间:
2014-11-26 20:55:26
阅读次数:
255
下载本文PDF格式(Academia.edu)本文给出了机器学习中AdaBoost算法的一个简单初等证明,需要使用的数学工具为微积分-1.Adaboost is a powerful algorithm for predicting models. However, a major disadvan...
分类:
编程语言 时间:
2014-11-26 06:38:25
阅读次数:
200