码迷,mamicode.com
首页 >  
搜索关键字:梯度下降 机器学习    ( 9962个结果
Feature extraction - sklearn文本特征提取
文本特征提取 词袋(Bag of Words)表征 文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长度的数值特征向量而不是不同长度的文本文件。为了解决这个问题,scikit-learn提供了一些实用工具可以用最常见的方式从文本内容中抽取数值特征,比如说: 标记(tokenizing)文本以及为每一...
分类:其他好文   时间:2014-12-16 11:46:54    阅读次数:203
KNN分类算法--python实现
一、kNN算法分析 K最近邻(k-Nearest Neighbor,KNN)分类算法可以说是最简单的机器学习算法了。它采用测量不同特征值之间的距离方法进行分类。它的思想很简单:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 ...
分类:编程语言   时间:2014-12-15 23:30:03    阅读次数:605
机器学习入门的书单(数据挖掘、模式识别等一样)
(写在前面)昨天说写个机器学习书单,那今天就写一个吧。这个书单主要是入门用的,很基础,适合大二、大三的孩子们看看;当然你要是大四或者大四以上没看过机器学习也适用。无论是研究智能还是做其他事情,机器学习都是必须的。你看GFW都用机器学习了,咱是不是也得科普一下。(全文结构)其实,我想了想,学一门学科,...
分类:其他好文   时间:2014-12-15 23:18:49    阅读次数:360
Python之扩展包安装(scikit learn)
scikit learn 是Python下开源的机器学习包。(安装环境:win7.0 32bit和Python2.7)Python安装第三方扩展包较为方便的方法:easy_install + packages name在官网 https://pypi.python.org/pypi/setuptoo...
分类:编程语言   时间:2014-12-15 18:35:44    阅读次数:160
理解矩阵及谱聚类小记
最近看了一些矩阵和谱聚类的知识,特在此简单记录一下。详细可以先看下参考文献。 首先看到的是孟岩写的三篇. 一:理解矩阵(一) 1:传统书籍空间的定义:存在一个集合,在这个集合上定义某某概念,然后满足某些性质”,就可以被称为空间。孟的空间包含四点:(1). 由很多(实际上是无穷多个)位置点组成;(2). 这些点之间存在相对的关系;(3). 可以在空间中定义长度、角度;4. 这个空间可以容纳运...
分类:其他好文   时间:2014-12-15 17:17:39    阅读次数:176
机器学习 常见算法分类
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其...
分类:编程语言   时间:2014-12-15 17:02:01    阅读次数:202
北大深度学习讲座(14-12-14)
周日在北大理教听了余凯和漆远关于深度学习的讲座,这个讲座是北大机器学习研究会办的,不是学术性质,是有点科普性质的一个对话,雷鸣做现场主持。 刚开始余凯说了一下什么是大数据,他提到除了数据源、数据仓库,还有分层的概念,是分层学习的意思吗?存疑;漆远提到一本大数据的入门书,introduction...
分类:其他好文   时间:2014-12-15 13:27:07    阅读次数:159
R语言与数据分析之五:主成分分析
主成份分析历史: Pearson于1901年提出,再由Hotelling(1933)加以发展的一种多变量统计方法。通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目,可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析。 通过对原始变量进行线性组合,得到优化的指标:把原先多个指标的计算降维为少量几个经过优化指标的计算(占去绝大部分份额) 基本思想:设法将原先众多具有...
分类:编程语言   时间:2014-12-15 10:29:54    阅读次数:290
机器学习方法概述
KNN k临近算法遍历所有训练样本,求距离最近的点的结论,作为最后的预测结果MR版:map求样本距离(key:样本,value:距离),combine求的最小值,是过滤功能,reduce就有一个求得距离最小值贝叶斯:贝叶斯定理公式:P(A|B)=P(B|A)*P(A)/P(B)贝叶斯将在属性条件下的...
分类:其他好文   时间:2014-12-15 10:21:20    阅读次数:121
大数据竞赛平台——Kaggle 入门
大数据竞赛平台——Kaggle 入门篇 这篇文章适合那些刚接触Kaggle、想尽快熟悉Kaggle并且独立完成一个竞赛项目的网友,对于已经在Kaggle上参赛过的网友来说,大可不必耗费时间阅读本文。本文分为两部分介绍Kaggle,第一部分简单介绍Kaggle,第二部分将展示解决一个竞赛项目的全过程。如有错误,请指正! 1、Kaggle简介 Kaggle是一个数据分析的竞赛平台,网址:ht...
分类:其他好文   时间:2014-12-15 09:06:09    阅读次数:642
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!