码迷,mamicode.com
首页 >  
搜索关键字:梯度下降 机器学习    ( 9962个结果
JGibbLDA、GibbsLDA++问题解决
LDA(Latent Dirichlet Allocation)主题模型是一种用统计进行文本挖掘的方法,它是pLSA(概率潜在语义分析)主题模型基础上加上贝叶斯框架而得到的模型。目前已应用于自然语言处理、计算机视觉、机器学习、信息检索等领域,得到了广泛关注。 LDA模型网上有多个开源代码,...
分类:其他好文   时间:2015-01-14 15:31:05    阅读次数:308
线上Spark处理Bzip2引出Hadoop Bzip2线程安全问题
我们的Hadoop生产环境有两个版本,其中一个是1.0.3,为了支持日志压缩和split,我们添加了hadoop-1.2中关于Bzip2压缩的feature. 一切运行良好。 为了满足公司对迭代计算的需求(复杂HiveSQL,广告推荐算法,机器学习 etc), 我们构建了自己的Spark集群,最初是Standalone Mode,版本spark-0.9.1,支持Shark。 上线后,问题接踵而...
分类:编程语言   时间:2015-01-14 11:10:35    阅读次数:403
【机器学习基础】将回归模型用于分类问题
线性模型回顾 我们回顾一下之前的三种线性模型,它们的共同点是都要对输入的数据x做一个加权的分数s。 下图表示了这三种不同的线性模型的表示方式、误差函数和求解最小的Ein的方法。 这里可以看出,PLA算法这种线性分类模型,在求解Ein的时候是很困难的,相对而言,线性回归和logistic回归都有各自求解Ein的方法,那么我们能不能用这两种回归的计算方法来帮助...
分类:其他好文   时间:2015-01-13 21:34:53    阅读次数:852
读懂机器学习(转)
在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。在进入正题前,我想...
分类:其他好文   时间:2015-01-13 12:16:28    阅读次数:309
hadoop(十三) - mahout安装与使用
一. mahout简介: Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。 以下为在mahout实现的机器学习算法: 算法类...
分类:其他好文   时间:2015-01-13 00:09:27    阅读次数:251
概率论学习小结(road map)
在最近学习模式识别和机器学习时经常会用到概率论的知识,索性重新复习一遍概率论的知识。学习概率论最重要的一点不是公式的记忆,而是对公式背后的含义的理解。(其实学习任何一门知识都是如此,但是相比高数等的抽象性来说,概率可能显得更“接地气”)        曾经在大学时代数学中学的最差的一门课便是概率论,然而最近的学习中,在几经挣扎之后却渐渐找到了这门课的乐趣,在本科时候学习的那个小小的课本将概率论的...
分类:其他好文   时间:2015-01-12 22:36:39    阅读次数:241
关于机器学习的十个实例
机器学习是什么? 机器学习是什么?这个问题的答案可以参考权威的机器学习定义,但是实际上,机器学习是由它所解决的问题定义的。因此,理解机器学习最好的方式是观察一些实例。 首先来看一些现实生活中众所周知和理解的机器学习问题的实例,然后讨论标准的机器学习问题的分类(命名系统),学习如何辨别一个问题是属.....
分类:其他好文   时间:2015-01-12 19:01:18    阅读次数:163
机器学习笔记(三)- from Andrew Ng的教学视频
week four:Non-linear hypotheses:Neural Networks-->x1 and x2x1 XNOR x2 ->a1->x1 and x2;a2->(not x1) and (not x2);->h(x),a1 OR a2the method is a new app...
分类:其他好文   时间:2015-01-12 17:14:53    阅读次数:135
GraphLab Create使深度学习更easy
最近深度学习如日中天,虽然很强大,但其训练起来却是昂贵的,费时费力。最新发布的GraphLab Create 1.1 及1.2使深度学习变得超级简单。它不需要你自己在选择模型和调参上成为专家,就可以玩转神经网络。基于输入数据,neuralnet_classifier.create()函数会自动选择一个网络架构并设置合理的参数值。其实并非所有问题都得从头开始去训练一个深度模型,通过简单移除已训练好的DNN的输出层,将传播到输出层的信号作为特征喂给任何一种分类器便可完成我们的一些分类任务。...
分类:其他好文   时间:2015-01-12 11:04:23    阅读次数:267
【机器学习基础】Logistic回归基础
soft binary classification Logistics回归模型要解决的是分类问题,在之前的二元分类问题中,我们将数据分成正例和负例,但是像PLA算法一样,用单位阶跃函数来处理的这种瞬间跳跃的过程有时很难处理。于是,我们希望能得到正例的概率值是多少。 logistic regression的假设 我们在PLA和线性回归算法中都用数据的加权来计算一个分数...
分类:其他好文   时间:2015-01-11 17:50:58    阅读次数:6277
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!