在机器学习中,我们通过一些已标记的数据(已知的数据,带有标签,确定了其种类和一些属性数值的数据记录)记录成图表等,比如在进行分类问题的训练过程中, 如果特性只有两个,那么可以列平面图表来表示对应的labeled data, 即类似 的图像(来自百度图片), 其中的曲线既是决策边界,如果我们用一个表格 ...
分类:
其他好文 时间:
2020-07-22 15:38:58
阅读次数:
68
一、基本术语 1.18泛化:学得模型是否适用于新样本的能力 注:假设样本空间的全体样本服从于一个未知的分布D,我们得到的样本都是独立从D上采样得到的,即“独立同分布”。训练样本越多,地道道关于D的信息越多,也就也可能通过学习得到强泛化能力的模型 1.19归纳:从特殊到一般的“泛化”过程 1.20演绎 ...
分类:
其他好文 时间:
2020-07-21 01:21:58
阅读次数:
82
sklearn的数据集 数据集划分 数据集接口介绍 数据集划分 前提:机器学习就是从数据中自动分析获得规律,并利用规律对未知数据进行预测。换句话说,我们的模型一定是要经过样本数据对其进行训练,才可以对未知数据进行预测的。 问题:我们得到数据后,是否将数据全部用来训练模型呢? 当然不是!因为我们如果模 ...
分类:
其他好文 时间:
2020-07-21 01:08:37
阅读次数:
86
以Python撰写AI模型框架by高焕堂前言:在AI(人工智慧)方面,由于当今的机器学习本质是一种<大数据相关性支撑的>归纳性推理。软体框架的复用(Reuse)性愈高,对于应用开发的帮助愈大。因此,在AI领域里,软体框架魅力将会大放异彩。在本文里,是基于最简单的Perceptron模型来阐述如何分析、设计及实作一个框架和API。在本节里,将优化这个AI模型,让它从线性分类,提升到非线性
分类:
编程语言 时间:
2020-07-19 11:27:56
阅读次数:
62
做机器学习的时候经常用到XGB,简单记录一下 K折交叉验证也是模型常用的优化方法。一起记录。。。 K折交叉验证:类似三个臭皮匠,顶个诸葛亮。我的理解是,就是用民主投票的方式,选取票数最高的那个当结果。K折就是分成K份数据来进行。K= 5就是5折交叉验证,K= 7就是7折交叉验证,K=10就是10折。 ...
分类:
其他好文 时间:
2020-07-18 22:48:42
阅读次数:
81
Keras之队鸢尾花识别 任务目标 对鸢尾花数据集分析 建立鸢尾花的模型 利用模型预测鸢尾花的类别 环境搭建 pycharm编辑器搭建python3.* 第三方库 numpy pandas sklearn keras 处理鸢尾花数据集 了解数据集 鸢尾花数据集是一个经典的机器学习数据集,非常适合用来 ...
分类:
其他好文 时间:
2020-07-18 16:10:24
阅读次数:
128
机器学习是比较非常不错的发展领域,而python和R语言在机器学习中都可以应用,因此很多人都会疑惑python和R语言哪个更适合机器学习呢?我们来看看吧。
分类:
编程语言 时间:
2020-07-17 22:32:56
阅读次数:
128
#多变量线性回归(Linear Regression with Multiple Variables) ##4.1多维特征 多维特征就是有多个特征,比如房价模型中增加房子的楼层数等等,模型的特征为$\left( {x_{1}},{x_{2}},...,{x_} \right)$ \(n\) 代表特征 ...
分类:
其他好文 时间:
2020-07-17 22:17:36
阅读次数:
80
#1 基本概念 ##1.1机器学习(Machine Learning) 什么机器学习?第一个机器学习的定义来自于 Arthur Samuel。他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。Samuel 的定义可以回溯到 50 年代,他编写了一个西洋棋程序。这程序神奇之处在于,编 ...
分类:
其他好文 时间:
2020-07-17 22:17:16
阅读次数:
71
把自己工作中接触到的和非接触的到的知识罗列一下。开发能力:JAVA(集合,泛型,基础知识,调试,代码阅读),JavaScript/CSS/HTML(基础知识,能结合知识实现项目),Python(基础知识);框架:SpringBoot,SpringMVC;Vuejs;开发成果:可以单独开发JAVAWEB后台系统,前端项目;管理系统;兴趣爱好:机器学习(理解常用的机器学习知识与算法原理,以及简单机器学
分类:
其他好文 时间:
2020-07-17 16:29:16
阅读次数:
94