自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同,比如数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入后台工程师的范畴,视岗位具体要求而定。机器学习、大数据相关岗位的职责自己...
分类:
其他好文 时间:
2015-12-30 10:25:08
阅读次数:
192
概率图模型(PGM)是一种对现实情况进行描述的模型。其核心是条件概率,本质上是利用先验知识,确立一个随机变量之间的关联约束关系,最终达成方便求取条件概率的目的。1.从现象出发---这个世界都是随机变量 这个世界都是随机变量。 第一,世界是未知的,是有多种可能性的。 第二,世界上一切都是相互...
分类:
其他好文 时间:
2015-12-29 22:31:12
阅读次数:
233
一、监督学习简介 监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差。最小化误差是为了让我们的模型拟合我们的训练数据,而规则化参数是防止我们的模型过分拟合我们的训练数据。多么简约....
分类:
其他好文 时间:
2015-12-29 16:12:30
阅读次数:
207
互联网的第三次革命,大数据!以Hadoop+Spark为框架,机器学习,数据挖掘,模式识别等算法为核心的大数据正在悄然改变着互联网世界,或许你已经体验到淘宝等电商网站的个性化推荐,百度等浏览器的个性化广告与标签,然而这些都只是大数据的应用雏形。加入新的浪潮,需要不断学习新的知识,完善自己的知识体系。...
分类:
其他好文 时间:
2015-12-29 09:55:32
阅读次数:
160
交叉验证(Cross validation),有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证是一种评估统计分析、机器学习算法对独...
分类:
其他好文 时间:
2015-12-28 11:58:18
阅读次数:
362
作者张天雷发布于 2014年12月18日|讨论分享到:微博微信FacebookTwitter有道云笔记邮件分享稍后阅读我的阅读清单机器学习是目前数据分析领域的一个热点内容,在平时的学习和生活中经常会用到各种各样的机器学习算法。实际上,基于Python、Java等的很多机器学习算法基本都被前人实现过很...
分类:
其他好文 时间:
2015-12-28 10:19:38
阅读次数:
135
这一章可能是Andrew Ng讲得最不清楚的一章,为什么这么说呢?这一章主要讲后向传播(Backpropagration, BP)算法,Ng花了一大半的时间在讲如何计算误差项$\delta$,如何计算$\Delta$的矩阵,以及如何用Matlab去实现后向传播,然而最关键的问题——为什么要这么计算?...
分类:
Web程序 时间:
2015-12-27 23:13:30
阅读次数:
296
在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。最大期望经常用在机器学习和计算机视觉的数据集聚(Data Clusteri...
分类:
编程语言 时间:
2015-12-27 20:28:36
阅读次数:
225
背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中大量地应用到了机器学习和数据挖掘技术,例如个性化推荐、筛选排序、搜索排序...
分类:
其他好文 时间:
2015-12-27 06:19:37
阅读次数:
243
【机器学习】K-Means 聚类是特殊的矩阵分解问题。
本博客是该论文《k-Means Clustering Is Matrix Factorization》的阅读笔记。论文证明了传统的K-Means算法的目标函数可以被表达成数据矩阵与其低阶数据矩阵之间差异的Frobenius范数。简单地说,K-Means 聚类是特殊的矩阵分解问题。...
分类:
其他好文 时间:
2015-12-26 19:43:15
阅读次数:
367