算法的简要概述 在机器学习问题中,高维度数据进行回归和分类是一个很困难的问题。例如在许多Microarray生物数据上,数据的维度通常是千和万级别,但是由于收集数据需要昂贵的实验,因此可用的训练数据却相当少,通常只有50 300左右,这样的现象通常称为“small samples, large pr ...
分类:
其他好文 时间:
2020-02-29 14:54:03
阅读次数:
115
1。 一般的机器学习方法不会在train好的模型上检查training data的结果,因为NN在training data上都没有办法获得很好的正确率, 所以要先回头看一下要对模型做什么修改,才能使得在training set上取得比较好的正确率。 2。 在training set获得好的结果,但 ...
分类:
其他好文 时间:
2020-02-28 13:54:11
阅读次数:
52
Java机器学习软件介绍 编写程序是最好的学习机器学习的方法。你可以从头开始编写算法,但是如果你要取得更多的进展,建议你采用现有的开源库。在这篇文章中你会发现有关Java中机器学习的主要平台和开放源码库包。 环境 本节描述可用于机器学习的java环境或工作台。他们被称为环境,因为他们为执行机器学习任 ...
分类:
编程语言 时间:
2020-02-28 12:04:45
阅读次数:
86
依据机器学习算法如何学习数据可分为3类: 有监督学习:从有标签的数据学习,得到模型参数,对测试数据正确分类; 无监督学习:没有标签,计算机自己寻找输入数据可能的模型; 强化学习(reinforcement learning):计算机与动态环境交互,学习错误反馈达到更优的目的。 依据机器学习期望结果来 ...
分类:
其他好文 时间:
2020-02-28 11:57:59
阅读次数:
60
一、Perceptron Hypothesis Set例子:银行要决定是否给使用者发信用卡。可以将每一个使用者的各种信息作为一个向量,每一个维度使用$x_i$来表示,给每个不同特征给予不同的权重,将加权值的和作为输出,设置一个阈值,如果超过阈值,那么就输出1,如果小于阈值,就输出-1.我们输入的x是... ...
分类:
其他好文 时间:
2020-02-27 20:53:22
阅读次数:
114
1 简介 scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。 SKlearn官网:http://scikit-lear ...
分类:
其他好文 时间:
2020-02-27 12:52:19
阅读次数:
78
1、问题简述 假设有一名植物学爱好者对她发现的鸢尾花的品种很感兴趣。她收集了每朵鸢尾花的一些测量数据: 花瓣的长度和宽度以及花萼的长度和宽度,所有测量结果的单位都是厘米。 她还有一些鸢尾花的测量数据,这些花之前已经被植物学专家鉴定为属于 setosa、versicolor 或 virginica 三 ...
分类:
编程语言 时间:
2020-02-27 01:16:47
阅读次数:
343
单变量线性回归 单变量线性回归指的是只有一个自变量; 线性回归是一种有监督学习,解决的是自变量和因变量之间的关系; 回归指的是因变量是连续性的,而如果因变量是离散型的,则是分类问题。 监督学习算法的工作方式可以用如下这张图表示: 将训练集喂给机器学习算法,输出一个假设函数 h,然后新输入一个自变 x ...
分类:
其他好文 时间:
2020-02-26 16:54:55
阅读次数:
80
概念: 一种常用于解决分类问题的机器学习方法,通俗地说就是推测一件事情发生的概率有多大。 例如判断某病人身上的肿瘤是良性还是恶性,结合肿瘤大小,厚度,位置等变量来预测,如果Y=0代表良性,Y=1代表恶性,这里的因变量Y只会是0或者1,就是最常见的二分类问题,逻辑回归也可用于多分类问题。 从之前的学习 ...
分类:
其他好文 时间:
2020-02-26 12:49:22
阅读次数:
60
大一上学了线代,脑子里面还没有对线代的具体应用有过认识,听说以后机器学习什么的会用上,但好像学到的时候线代知识也容易忘了…… 那么今天就说说在oi里面,我用到线代的知识的题目吧。 矩阵快速幂。 这类题目主要是用来推导公式的,比如经典的斐波那契数列就可以用上这个。 F【n】=F【n-1】+F【n-2】 ...
分类:
其他好文 时间:
2020-02-26 01:30:10
阅读次数:
58