机器学习算法简单入门。 由于团队(大数据团队)技术发展需要,借对交通业务数据进行需求拓展,实现数据挖掘和数据分析技术的掌握,绕不开机器学习算法,可以说,大数据的核心价值在于算法。 如下图,当前机器学习按照任务类型可以分为有监督学习和无监督学习,这两者的区别在于你是否告诉程序一个标签,或者叫答案,一个 ...
分类:
编程语言 时间:
2018-03-07 23:59:41
阅读次数:
306
一、神经网络 二、激活函数 三、评价神经网络的效果 四、梯度下降算法 五、参数与超参数区别 六、习题 一、神经网络 neural network w11 a1+w12 a2+w13 a3 + bias1=b1 w21 a1+w22 a2+w23 a3 + bias2=b2 从网络层1到网络层2,可能 ...
分类:
其他好文 时间:
2018-03-01 21:55:07
阅读次数:
155
有监督学习类似于学习数学,先做题 对答案,然后老师出卷子进行月考 无监督学习 挖掘数据 需要与环境交互 回归问题数学用语比较多,但是对大学高数部分熟悉的话,应该不是问题。 线性回归 损失函数(loss function,优化方向,评估方式)/代价函数/目标函数 找到最好的权重/参数 如何衡量最好? ...
分类:
其他好文 时间:
2018-02-19 11:34:36
阅读次数:
141
特征决定了最优效果的上限,算法与模型只是让效果更逼近这个上限,所以特征工程与选择什么样的特征很重要! 以下是一些特征筛选与降维技巧 # -*- coding:utf-8 -*- import scipy as sc import libsvm_file_process as data_process ...
分类:
其他好文 时间:
2018-02-12 20:13:37
阅读次数:
196
啤酒尿布 沃尔玛根据它每天记录的大量的客户消费数据进行分析,发现了,购买了啤酒的顾客更可能同时购买尿布。所以他们把尿布和啤酒放到一块,结果大幅度的提高了这两者的销售额。 购买尿布和购买啤酒看上去毫无关系,但是通过用户购物数据作为样本发现了其中的关联和规律,对于沃尔玛而言无需知道规律背后的本质,只需要 ...
分类:
其他好文 时间:
2018-02-07 15:01:44
阅读次数:
166
2018.1.16 给定训练集$T={(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)}$,一共有N个样本点。 一、线性可分的支持向量机 假定训练集是线性可分的。学习的目标是在特征空间找到一个分离超平面$wx+b=0$,能够将所有的样本正确划分为两类。学习的策略是间隔最大化。 ...
分类:
其他好文 时间:
2018-01-30 22:49:54
阅读次数:
233
一、前述 逻辑回归是一种分类算法,对多元线性回归的结果做一定的缩放。是一种线性(x是一次的)有监督(有x,y)分类(要么是正列,要么是负例)算法。 二、具体 如果最后预测的结果大于0.5 是正例 小于0.5是负例 做分类的误差来源于两种情况: 假设Y是正列 1-p^ 假如本来是1这个类别:预测出来的 ...
分类:
其他好文 时间:
2018-01-23 22:07:39
阅读次数:
156
算法分类一: 有监督学习 无监督学习 半监督学习 算法分类二 分类与回归 聚类 标注 算法分类三 生成模型 (属于某类的概率) 识别模型 (直接告诉属于某类) ...
分类:
编程语言 时间:
2018-01-06 11:59:02
阅读次数:
153
写在前面:这一个多月都在学习python,从python3基础、python爬虫、python数据挖掘与数据分析都有接触,最近看到一本机器学习的书(主要是学习相关算法) 于是就打算来做这份机器学习的笔记,笔记主要来源是《机器学习实战》以及网上一些博客资料和自己的理解,主要做我个人学习所用,初学者水平 ...
分类:
编程语言 时间:
2017-11-27 20:04:09
阅读次数:
177
04_机器学习算法 机器学习的算法目的是找到一种数学模型符合描述的对象。 常见的有三种机器学习的方法: 主要取决于数据的类型 A. 有监督的学习 学习的数据是有人类标识的数据,比如说看X光片,识别猫。 已有的数据结果是知道的,目标是找特征与标签(结果)的关系。 像AlphaGo学习以前的棋局也是这样 ...
分类:
编程语言 时间:
2017-11-03 00:15:37
阅读次数:
130