一、概述 1.概念:K近邻(k-Nearest Neighbor, 简称KNN)算法是一种非常简单的机器学习监督算法。 2.主要思想:即时给定一个训练数据集,对于新的数据样本,在训练集中找到与该样本最邻近的k个样本,统计这k个样本的多数所属类,就把这个样本归结到这个所属类中。 3.根据维基百科的图解 ...
分类:
编程语言 时间:
2020-02-23 14:42:46
阅读次数:
66
【梯度下降法】一:快速教程、Python简易实现以及对学习率的探讨 【梯度下降法】二:冲量(momentum)的原理与Python实现 【梯度下降法】三:学习率衰减因子(decay)的原理与Python实现 ...
分类:
其他好文 时间:
2020-02-23 11:50:12
阅读次数:
79
【机器学习】算法原理详细推导与实现(六):k means算法 之前几个章节都是介绍有监督学习,这个章节介绍无监督学习,这是一个被称为 的聚类算法,也叫做 k均值聚类算法 。 聚类算法 在讲监督学习的时候,通常会画这样一张图: 这时候需要用 回归或者 将这些数据分成正负两类,这个过程称之为 监督学习 ...
分类:
编程语言 时间:
2020-02-23 11:14:20
阅读次数:
85
2020.2.22.从本篇开始,所有文章使用markdown编辑 为什么使用FM? ...
分类:
其他好文 时间:
2020-02-22 22:16:18
阅读次数:
85
十年前,MSRA的夏天,刚开始尝试机器学习研究的我面对科研巨大的不确定性,感到最多的是困惑和迷茫。十年之后,即将跨出下一步的时候,未来依然是如此不确定,但是期待又更多了一些。这其中的变化也带着这十年经历的影子。 起始: 科研是什么 我从大三开始进入交大APEX实验室,有幸随着戴文渊学长做机器学习,当 ...
分类:
其他好文 时间:
2020-02-22 14:05:01
阅读次数:
57
既然今天闲来无事,索性就来写写半年来的学习总结吧,顺便也写写所遇到的一些悲惨经历,真的是一把型辛酸泪。 一、初入新学校 从2018年10月确定推免资格,选了老板,定了方向之后,感觉到了人生另一个低谷。也只能怪自己,方向每选好。在这里奉劝一下各位,方向以及老板的RP非常重要,不要过去看重学校的名声和老 ...
分类:
其他好文 时间:
2020-02-22 13:58:57
阅读次数:
68
https://www.infoq.cn/article/dgKDBiPl7KID0dyaE7Wl 在机器学习开发领域,如果我们纵观全局,撇除所有微小的细节,那么就可以提炼出机器学习开发中的两大不变步骤:模型训练和预测(或推断)。如今,机器学习的首选语言是Python(除非你的工作环境有一些不寻常的 ...
分类:
编程语言 时间:
2020-02-22 12:16:59
阅读次数:
152
R语言在人工智能,统计学,机器学习,量化投资,以及生物信息学方面有着十分广泛的运用。也是我大学的必修课,因此这里梳理一些有关R语言的知识点,做做记录。 首先我们需要知道R语言的工作区域,R语言默认的工作区域是在“C:/Users/lenovo/Documents”目录下,然而一般这样就会导致电脑的运 ...
分类:
编程语言 时间:
2020-02-22 10:07:32
阅读次数:
132
SVM-支持向量机 SVM(Support Vector Machine)-支持向量机,是一个功能非常强大的机器学习模型,可以处理线性与非线性的分类、回归,甚至是异常检测。它也是机器学习中非常热门的算法之一,特别适用于复杂的分类问题,并且数据集为小型、或中型的数据集。 这章我们会解释SVM里的核心概 ...
分类:
其他好文 时间:
2020-02-21 20:40:26
阅读次数:
72
这篇记录的内容来自于Andrew Ng教授在coursera网站上的授课。 1.不要浪费大量的时间在获得样本上。实际上,太多的样本数并不会使学习算法更加的优秀。要尝试调整你的系数: 1.使用更少的特征。 2.增加多项式。 3.调整$\lambda$。 2.诊断学习算法: 1.将样本打乱,并将其中一部 ...
分类:
其他好文 时间:
2020-02-21 20:27:18
阅读次数:
63