在机器学习中,模型的训练是一个很重要的过程,它通常是对一个目标函数进行优化,从而获取模型的参数,比较常见的优化算法包括梯度下降法、牛顿法与拟牛顿法等。但在大数据的背景下,尤其对于并行实现来说,优化算法通常是越简单越好,如坐标下降法(CD)和随机梯度下降法(SCG)就比较受欢迎。本文是阅读完论文 Distributed Coordinate Descent Method for Learning with Big Data 的一则笔记,主要介绍算法 Hydra (一种分布式坐标下降法)的算法框架、收敛性理论、...
分类:
其他好文 时间:
2014-06-29 07:38:26
阅读次数:
350
(转载请注明出处:http://blog.csdn.net/buptgshengod)1.北京...
分类:
其他好文 时间:
2014-06-20 13:04:02
阅读次数:
193
网易公开课,第9课
notes,http://cs229.stanford.edu/notes/cs229-notes4.pdf 这章要讨论的问题是,如何去评价和选择学习算法
Bias/variance tradeoff 还是用这组图,学习算法追求的是generalization error(对未知...
分类:
其他好文 时间:
2014-06-11 12:21:15
阅读次数:
445
摘要:近日,Robert
Seaton整理了100多个最有趣的数据集,其中包括Jeopardy真题,死囚的最后一句话,20万个Eclipse
Bug,足球比赛相关,柏拉图式的爱情,太阳系以外的行星,11.3万个恐怖事件等。【编者按】在数据爆发式增长的逼迫下,当下数据分析能力已得到长足的发展,机器学习...
分类:
系统相关 时间:
2014-06-11 09:25:52
阅读次数:
717
“小冰”倒了之后,一款基于自然语言处理技术的人工智能聊天机器人“小灵”诞生了。小灵目前只在qq群上线,以个人账号发布,登录qq添加qq群后,即可以与小灵进行交流。比如你问它“你是男的女的”,它会回答“小灵是腐女啦,你说小灵是男的还是女的!”,让你笑到爆!
小灵集合了中国网民近10年来积累的公开聊天记录,依靠图灵机器人平台在大数据、自然语义分析、机器学习和深度神经网络方面的技术积累,集合了近1...
分类:
其他好文 时间:
2014-06-07 15:19:51
阅读次数:
307
最近一段时间做了不少文本挖掘的项目和研究,正好总结一下文本挖掘预处理的流程,希望是干货。...
分类:
其他好文 时间:
2014-06-07 12:11:52
阅读次数:
238
最近的一些有趣链接的分享,包括科学,设计,机器学习等多个方面的。例如:1.在另一个星球上打印人类2.偷听到外星人的星际通信3.Yann
LeCun在reddit上的问答4.卖萌的水果...
分类:
其他好文 时间:
2014-06-07 10:37:04
阅读次数:
210
参考《机器学习实战》 朴素(naive)贝叶斯遵循以下原则: 设特征为x,y;类别为c。
在已知x、y特征的情况下,判断其类为ci的概率为: 自然, 我们选取概率较大的为对应的分类结果:
朴素贝叶斯就是根据这一原则进行分类器设计的。书中以垃圾邮件分类为例做了详述。 垃圾邮件分类的基本过程: 数据集:...
分类:
其他好文 时间:
2014-06-06 23:35:03
阅读次数:
526
本篇博客将会介绍R中的一个神经网络算法包:Neuralnet,通过模拟一组数据,展现其在R中是如何使用,以及如何训练和预测。在介绍Neuranet之前,我们先简单介绍一下神经网络算法。人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神...
分类:
Web程序 时间:
2014-06-06 10:04:32
阅读次数:
474
原文:javascript实现数据结构:广义表广义表是线性表的推广。广泛用于人工智能的表处理语言Lisp,把广义表作为基本的数据结构。广义表一般记作: LS =
(a1, a2, ..., an)LS是广义表的名称,n是它的长度,ai可以是单个元素,也可以是广义表,分别称为广义表LS的原子和子表。习...
分类:
编程语言 时间:
2014-06-05 14:59:05
阅读次数:
464