机器学习算法及代码实现–支持向量机 1、支持向量机 SVM希望通过N-1维的分隔超平面线性分开N维的数据,距离分隔超平面最近的点被叫做支持向量,我们利用SMO(SVM实现方法之一)最大化支持向量到分隔面的距离,这样当新样本点进来时,其被分类正确的概率也就更大。我们计算样本点到分隔超平面的函数间隔,如 ...
分类:
编程语言 时间:
2020-05-18 18:51:25
阅读次数:
59
随着大数据时代的到来和人工智能的崛起,机器学习所能处理的场景更加广泛和多样。构建的模型需要对批量数据进行处理,为了达到实时性的要求还需要直接对流式数据进行实时预测,还要具备将模型应用在企业应用和微服务上能力。为了取得更好的业务效果,算法工程师们需要尝试更多更复杂的模型,需要处理更大的数据集,使用分布式集群已经成为常态;为了及时对市场的变化进行反应,越来越多的业务选用在线学习方式直接处理流式数据、实时更新模型,提高业务效果。
分类:
编程语言 时间:
2020-05-18 18:40:02
阅读次数:
129
机器学习算法及代码实现–神经网络 1、神经网络 神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。 ...
分类:
编程语言 时间:
2020-05-18 18:39:28
阅读次数:
86
主要内容: 线性回归 定义与问题引入 损失函数 梯度下降 过拟合与正则化 逻辑回归 定义与问题引入 损失函数 梯度下降与正则化 线性回归 有监督学习= 学习样本为D={(x~i~,y~i~)}^N^~i=1~ 多变量情形: 损失函数 loss function: 梯度下降: 其中α为步长,很大 震荡 ...
分类:
其他好文 时间:
2020-05-17 17:27:48
阅读次数:
73
TensorFlow作为著名机器学习相关的框架,很多小伙伴们都可能要安装它。WIN+R,输入cmd运行后,通常可能就会pip install tensorflow直接安装了,但是由于这个库比较大,接近500M,加上这个是国外链,特别慢,所以需要镜像网站来帮忙。 1.利用镜像安装: 国内知名的镜像网站 ...
分类:
其他好文 时间:
2020-05-17 16:15:00
阅读次数:
353
我在公司里做了一段时间Python数据分析和机器学习的工作后,就尝试着写一本Python数据分析方面的书。正好去年有段时间股票题材比较火,就在清华出版社夏老师指导下构思了这本书。在这段特殊时期内,夏老师和出版社的其它老师为这本书到处奔走,终于在近期上市。 《基于股票大数据分析的Python入门实战 ...
分类:
编程语言 时间:
2020-05-17 13:35:35
阅读次数:
190
==> 有钱,无脑瞎烧 GPU。 https://blog.csdn.net/u014157632/article/details/101721343 自动化机器学习(AutoML)最近变得越来越火,是机器学习下个发展方向之一。其中的神经网络结构搜索(NAS)是其中重要的技术之一。人工设计网络需要丰 ...
分类:
其他好文 时间:
2020-05-17 09:19:48
阅读次数:
78
到目前为止,你已经见过一系列不同的学习算法。在监督学习中,许多监督学习算法的性能都非常类似。因此,重要的不是你该选择使用学习算法A还是学习算法B,而更重要的是,应用这些算法时,所使用的数据量。这就体现了你应用这些算法时的技巧。比如:你为学习算法所设计的特征量的选择,以及如何选择正则化参数,诸如此类的 ...
分类:
其他好文 时间:
2020-05-17 01:17:28
阅读次数:
119
同步进行一波网上代码搬砖, 先来个入门的线性回归模型训练, 基于梯度下降法来, 优化用 MSE 来做. 理论部分就不讲了, 网上一大堆, 我自己也是理解好多年了, 什么 偏导数, 梯度(多远函数一阶偏导数组成的向量) , 方向导数, 反方向(梯度下降) 这些基本的高数知识, 假设大家是非常清楚原理的 ...
分类:
其他好文 时间:
2020-05-17 01:06:00
阅读次数:
75
本文始发于个人公众号: TechFlow ,原创不易,求个关注 今天是 概率统计专题 的第六篇,我们来看看方差相关的概念。 方差的定义 方差在我们的日常生活当中非常常见,它主要是为了 提供样本离群程度的描述 。举个简单的例子,我们去买一包薯片,一般来说一袋薯片当中的数量是固定的。我们假设平均每袋当中 ...
分类:
其他好文 时间:
2020-05-16 10:59:29
阅读次数:
82