入行机器学习有一年多了,做过大大小小的机器学习项目,参加数据竞赛等实践活动,从最初的懵懵懂懂到现在逐步的深入,也渐渐的有了很多的体会和理解,本篇文章主要来阐述机器学习的知识体系,以让更多人明白机器学习应该怎样学习、需要学习什么?这些问题就是本篇文章的主要讨论的内容,下面开始进行详细介绍。 先对本篇文 ...
分类:
编程语言 时间:
2020-02-10 12:10:22
阅读次数:
88
如何通过Python读取文本,分割符号为逗号、空格,怎么操作?with open("housing.csv") as f: f.read().split(", ")如何通过pandas读取数据read_csv(filename, name=name, sep=" ")读取数据后,如何查看数据前几行d ...
分类:
其他好文 时间:
2020-02-10 11:26:18
阅读次数:
74
弹性分布式数据集(RDD,Resilient Distributed Datasets),它具备像MapReduce等数据流模型的容错特性,并且允许开发人员在大型集群上执行基于内存的计算。现有的数据流系统对两种应用的处理并不高效:一是迭代式算法,这在图应用和机器学习领域很常见;二是交互式数据挖掘工具 ...
分类:
其他好文 时间:
2020-02-09 23:55:54
阅读次数:
139
概述 自然语言是非常复杂多变的,计算机也不认识咱们的语言,那么咱们如何让咱们的计算机学习咱们的语言呢?首先肯定得对咱们的所有文字进行编码吧,那咱们很多小伙伴肯定立马就想出了这还不简单嘛,咱们的计算机不都是ASCII编码的嘛,咱直接拿来用不就好啦?我只能说too young too simple。咱们 ...
分类:
其他好文 时间:
2020-02-09 20:47:29
阅读次数:
70
@ "TOC" 第二章 2.3章末小结 1 机器学习模型按照使用的数据类型,可分为监督学习和无监督学习两大类。 1. 监督学习主要包括分类和回归的模型。 + 分类:线性分类,支持向量机(SVM),朴素贝叶斯,k近邻,决策树,集成模型(随机森林(多个决策树)等)。 + 回归:线性回归,支持向量机(SV ...
分类:
编程语言 时间:
2020-02-09 16:37:56
阅读次数:
94
前言 我们在开发机器学习模型 (Python) 时,常会遇到需要把模型发布成API或Web App来供其它客户端或用户调用模型 (Model as a Service)。 今天介绍两种我常用的方法,可在几分钟内简单实现从本地到Azure的模型部署。 方法1 - 利用Azure App Service ...
分类:
编程语言 时间:
2020-02-09 14:45:17
阅读次数:
150
梯度下降法用处:寻找目标函数最小化的方法。 也就是求函数的局部最小值。 梯度的数学解释:梯度:https://baike.baidu.com/item/%E6%A2%AF%E5%BA%A6/13014729?fr=aladdin 梯度下降法的简单解释: 梯度下降法就好比一个蒙着眼睛的人下山,每次在负 ...
分类:
其他好文 时间:
2020-02-09 12:07:03
阅读次数:
99
K 近邻算法 作用:分类算法 优点:最简单、不需要训练、容易理解 缺点:计算复杂度高、空间复杂度高 原理:计算新数据与样本集中所有数据的欧式距离,提取距离最近的 K 个样本的标签,取 K 个样本里出现次数最多的标签,作为新数据的分类标签 决策树 ID3 作用:分类算法 优点:计算复杂度不高、容易理解 ...
分类:
编程语言 时间:
2020-02-09 09:54:44
阅读次数:
61
关于LDA主题模型,一度是NLP领域一个非常火的模型,后来深度学习大放异彩,它的热度才慢慢降了下来。由于数学基础很差,一直没有理解LDA的整个核心。到目前为止,也只是理解了皮毛。记录一下关于LDA主题模型相关的学习资料。LDA主题模型属于编码简单,但是数学功底要求较高的一个机器学习模型,在搜索引擎和广告领域有用到。按照《LDA数学八卦》作者靳志辉老师的说法,是一个比较简单的模型,前提是需要数学功底
分类:
其他好文 时间:
2020-02-08 23:15:33
阅读次数:
178
今天是2020年2月7日,开始二刷david silver ulc课程. david silver课件汇总:(共10节课) http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html 一些小总结: 1.强化学习不同于其他机器学习算法,它们的基础 ...
分类:
其他好文 时间:
2020-02-08 00:37:15
阅读次数:
88