码迷,mamicode.com
首页 >  
搜索关键字:样本    ( 4292个结果
初识分类算法(2)------决策树ID3算法
例子:分类:play or not ?(是/否) 目的:根据训练样本集S构建出一个决策树,然后未知分类样本通过决策树就得出分类。问题:怎么构建决策树,从哪个节点开始(选择划分属性的问题)方法:ID3(信息增益),C4.5(信息增益率),它们都是用来衡量给定属性区分训练样例的能力。1. 为了理解信息....
分类:编程语言   时间:2014-10-11 16:33:06    阅读次数:256
初识分类算法(1)------knn近邻算法
例子:某人想要由以下1000行训练样本数据构建一个分类器,将数据分成3类(喜欢,一般,不喜欢)。样本数据的特征有主要有3个,A:每年获得的飞行常客里程数B:玩视频游戏所耗时间百分比C:每周消费冰淇淋公升数1. 数据的读取 1 filename='D://machine_learn//Ch02//da...
分类:编程语言   时间:2014-10-11 15:32:15    阅读次数:398
稀疏自动编码之神经网络
考虑一个监督学习问题,现在有一些带标签的训练样本(x(i),y(i)).神经网络就是定义一个复杂且非线性的假设hW,b(x),其中W,b是需要拟合的参数.下面是一个最简单的神经网络结构,只含有一个神经元,后面就用下图的形式代表一个神经元:把神经元看作是一个计算单元,左边的x1,x2,x3(和 截距+...
分类:其他好文   时间:2014-10-11 13:43:55    阅读次数:559
Android perf tools
文档,也可以直接在你的SDK的源代码找。 http://lxr.free-electrons.com/source/tools/perf/Documentation/ 更加深入(深奥)的文档 https://perf.wiki.kernel.org/index.php/Tutorial 如何采集一个小程序的样本?...
分类:移动开发   时间:2014-10-11 12:37:55    阅读次数:196
算法---大数据相加
开通博客开始第一次写发表算法博客。深知一半算法考试都是用C,C++,由于大四开始到今年毕业工作到现在一直从事C#开发,C++用得很少了。链表,指针也只知道一个概念了。用得没以前熟练了。所以后续更新的算法题我都是基于C#语法的。算法主要体现的是解题思路。跟题目一样,本次算法主要实现大数据相加。 解.....
分类:编程语言   时间:2014-10-10 22:27:04    阅读次数:291
对大脑的认识
昨晚做了个梦, 一直没时间写下来, 终于放松了.我经常梦到一些我不认识的人, 也就是不存在, 就像陌生人一样. 好了, 在梦中, 我们会经常和这些 "陌生人" 说话. 但是他们说什么, 好像是我们大脑控制的一样 (本来就是我们大脑产生的吗 :D). 这时候, 如果我们被一个闹钟或者其他事情打扰了, ...
分类:其他好文   时间:2014-10-10 02:10:53    阅读次数:182
机器学习中的相似性度量
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼....
分类:其他好文   时间:2014-10-09 15:04:14    阅读次数:191
SVM(未完待续)
1.间隔(Margins)考虑逻辑回归,概率值是由模型预测出来的,给定,如果,则,预测最终类别就为1.对于一个正类样本,越大,也就越大,我们也就更大程度上确定该样本属于类别1.也就是说如果,那么预测就非常可信,类似地,如果,我们就能很自信是正确的预测.换种角度,对于给定的训练集,如果我们拟合出合适的...
分类:其他好文   时间:2014-10-09 02:00:07    阅读次数:264
最小二乘法完成曲线拟合公式
设(x1, y1), (x2,y2), ...(xk,yk)为输入样本,注意这里的xi本身是一个向量。 假设拟合多项式为: 则通过使用下面的最小平方差拟合方法: 可得: 拟合过程变成求上式的最小值,相信学过高数的童鞋应该都知道怎么求,对的以此对系数a0,a1....求偏导数,使其为零,最后可得K+1组方程: ....................... ...
分类:其他好文   时间:2014-10-08 18:22:55    阅读次数:180
SVM-支持向量机算法概述
(一)SVM的背景简单介绍支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出很多特有的优势,并可以推广应用到函数拟合等其它机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维理论和...
分类:其他好文   时间:2014-10-07 15:20:53    阅读次数:367
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!