logistic回归与python实现,理论与实际结合。...
分类:
编程语言 时间:
2014-10-14 17:29:58
阅读次数:
290
当今这个大数据时代,数据就等于金钱。随着向一个基于应用的领域过渡,数据则呈现出了指数级增长。然而,百分之八十的数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换为可理解、可用的结构化形式。在数据挖掘过程中,有大量的工具可供使用,比如采用人工智能、机器学习,以及其他技术等来.....
分类:
其他好文 时间:
2014-10-14 13:00:28
阅读次数:
205
众所周知,反向传播算法很难调试和得到正确结果,特别是在执行过程中存在许多细小难以察觉的错误。这里介绍一种方法来确定代码中导数的计算是否正确。使用这里所述求导检验方法,可以帮助提升写正确代码的信心。假设我们想最小化关于的函数 . 对于这个例子,假设,所以. 在一维空间,梯度下降的一次迭代公式如下:假设...
分类:
其他好文 时间:
2014-10-13 12:46:39
阅读次数:
304
假设给定m个训练样本的训练集,用梯度下降法训练一个神经网络,对于单个训练样本(x,y),定义该样本的损失函数:那么整个训练集的损失函数定义如下:第一项是所有样本的方差的均值。第二项是一个归一化项(也叫权重衰减项),该项是为了减少权连接权重的更新速度,防止过拟合。我们的目标是最小化关于W和 b 的函数...
分类:
编程语言 时间:
2014-10-13 02:27:02
阅读次数:
310
Weka算法Clusterers-DBSCAN源码分析...
分类:
数据库 时间:
2014-10-12 23:50:58
阅读次数:
371
1、k-近邻算法算法原理:存在一个样本数据集(训练样本集),并且我们知道样本集中的每个数据与其所属分类的对应关系。输入未知类别的数据后将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最近邻)的k组数据。然后将k组数据中出现次数最多的分类,来作为新数据的分类。算法步...
分类:
其他好文 时间:
2014-10-12 20:39:28
阅读次数:
199
1. 模型表达(Model Representation) 我们的第一个学习算法是线性回归算法,让我们通过一个例子来开始。这个例子用来预测住房价格,我们使用一个数据集,该数据集包含俄勒冈州波特兰市的住房价格。在这里,我要根据不同房屋尺寸所售出的价格,画出我的数据集: 我们来看这个数据集,如果你有一个...
分类:
其他好文 时间:
2014-10-12 07:16:57
阅读次数:
337
引言 在现实生活中,我们每天都可能在不知不觉中使用了各种各样的机器学习算法。 例如,当你每一次使用 Google 时,它之所以可以运行良好,其中一个重要原因便是由 Google 实现的一种学习算法可以“学会”如何对网页进行排名。每当你使用 Facebook 或者 Apple 的照片处理应用时,它们都...
分类:
系统相关 时间:
2014-10-12 02:28:17
阅读次数:
442