一、先弄清楚机器学习的几个概念:训练集:训练样本,每个样本都由表示要学习的特征集(输入变量)和目标(输出变量) 设训练样本数为m 输入特征\变量input : x 其中每个样本用 表示(第i个样本),样本中每个特征/输入用表示(第i个样本中的第j个特征) 输出特征/变量output : y 其中.....
分类:
其他好文 时间:
2014-11-29 22:52:46
阅读次数:
262
由于图像分割中经常用到MRF,条件随机场,主要介绍一下Probabilistic Graph Models 概率图模型和MRF的一些基础知识...
分类:
其他好文 时间:
2014-11-29 21:43:33
阅读次数:
260
主要介绍如何通过验证来评估模型的性能及如何通过验证选取模型的问题。介绍的方法有:模型选择、交叉验证。...
分类:
其他好文 时间:
2014-11-29 00:17:19
阅读次数:
202
package com.jumei.robot.mapreduce.tfidf;import java.io.IOException;import java.util.Collection;import java.util.Comparator;import java.util.Map.Entry;...
分类:
其他好文 时间:
2014-11-28 21:15:21
阅读次数:
475
转载自http://leftnoteasy.cnblogs.com机器学习中的数学系列:1)回归(regression)、梯度下降(gradient descent)2)线性回归,偏差、方差权衡3)模型组合(Model Combining)之Boosting与Gradient Boosting4)线...
分类:
其他好文 时间:
2014-11-28 18:13:25
阅读次数:
181
我们知道利用JSON模块可方便的将Python基本类型(dict、list等)数据永久的存储成文件,同时也可以通过自定义转换函数和继承JSON encode&decode的方法实现自定义类的存储。本文就在前文“ Python JSON模块”的基础上,实现python支持JSON存储的对象。
对象能够采取JSON存储和解析是有很大意义的。例如机器学习中所有分类算法的训练过程中都存在大量的数据计算,如果每次启动分类都需要重新训练分类算法浪费资源且没有效率,如果能够将训练产生的分类算法对象保存起来,那么除非需要...
分类:
编程语言 时间:
2014-11-28 14:27:15
阅读次数:
276
作者:咕唧咕唧liukun321来自:http://blog.csdn.net/liukun321先来看一下什么是SVM(支持向量机) SVM是一种训练机器学习的算法,可以用于解决分类和回归问题,同时还使用了一种称之为kernel trick(支持向量机的核函数)的技术进行数据的转换,然后再根据这些转换信息,在可能的输出之中找到一个最优的边界(超平面)。简单来说,就是做一些非常复杂的数据转换工作,...
分类:
其他好文 时间:
2014-11-28 08:46:50
阅读次数:
505
视乎已经听到或看到无数遍数据挖掘了,那么,你知道那是什么吗?关于什么是数据挖掘,很多学者和专家给出了不同的定义,以下我们列出几种常见的说法:...
分类:
其他好文 时间:
2014-11-28 01:07:05
阅读次数:
240
前言现今Spark正是风头正劲时,Spark本是UCBerkeley的AMPLab诞生的项目,后来捐赠给了Apache来管理源码和后续发展。今年从Apache孵化器终于孵化出了1.0版本。其对大数据的支持从内存计算和流处理,到交互式查询,一直到图计算和机器学习,可谓摆开了架势、拉长了战线,一方面挑战老前辈Hadoop和MapReduce,另一方面又随时准备迎接同样的后起之秀的挑战。大数据的今天今天...
分类:
其他好文 时间:
2014-11-27 20:30:03
阅读次数:
251
做图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最牛的几个超级大拿(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文...
分类:
其他好文 时间:
2014-11-27 20:20:29
阅读次数:
335