本文主要内容摘自 易悠 博主的 Pima印第安人数据集上的机器学习 分类算法(根据诊断措施预测糖尿病的发病) https://blog.csdn.net/yizheyouye/article/details/79791473 数据集简介 该数据集最初来自国家糖尿病/消化/肾脏疾病研究所。 数据集的目 ...
分类:
编程语言 时间:
2020-03-01 23:20:25
阅读次数:
659
无监督预训练网络 卷积神经网络 循环神经网络 递归神经网络 机器学习,深度学习代做 图像处理 代做机器学习深度学习算法 knn kmeans 聚类分析 图像识别 图像分割 超分辨率图像算法分析 常见深度学习算法LeNet AlexNet SPPNet等等 vx:wxid910000 扣扣:27738 ...
分类:
其他好文 时间:
2020-03-01 14:47:53
阅读次数:
74
不同的分类算法各有优缺点,可以将不同的分类器组合起来 这种组合被称为集成方法(ensemble method)或者元算法(meta algorithm) 使用集成方法有多种形式 ○?可以是不同算法的集成 ○?可以是同一算法在不同设置下的集成 ○?可以是数据集不同部分分配给不同 ...
分类:
编程语言 时间:
2020-02-29 20:45:23
阅读次数:
100
本文主要讲解的聚类算法有:k均值算法、均值漂移算法、凝聚层次算法、DBSCAN密度聚类算法,还介绍了聚类算法性能指标——轮廓系数。 聚类(cluster)与分类(class)不同,分类是有监督学习模型,聚类属于无监督学习模型。聚类讲究使用一些算法把样本划分为n个群落。一般情况下,这种算法都需要计算欧 ...
分类:
编程语言 时间:
2020-02-29 17:29:23
阅读次数:
112
Spark 是基于内存的计算, 低延迟. Apache 基金会3大分布式系统开源项目 Hadoop, Spark, Storm (数据流) Spark 特点: 处理快, 容易使用(Java,Python,Scala,R). 通用性(包括SQL,机器学习, 流失计算), 运行模式多样 Spark生态系 ...
分类:
其他好文 时间:
2020-02-29 17:28:30
阅读次数:
94
机器学习是什么 给予计算机学习能力,应用场景主要有:垃圾邮件识别,下棋,房价预测等等。 监督学习 监督学习的数据集由正确答案组成, 有回归问题(推测出连续值,如房价),分类问题(推测出离散的输出,如鉴别肿瘤的种类) 无监督学习 数据集没有标签,应用领域如:谷歌同类新闻推送,多DNA的特定相同基因鉴别 ...
分类:
其他好文 时间:
2020-02-29 16:18:12
阅读次数:
77
在各类比赛中经常出现预测回归问题,一般使用scikit learn的模型,本文就对这些类库的使用做一个总结,总结时注重自己做比赛中的使用经验。 1. Ordinary Least Squares(最小二乘法) 最简单的线性模型,损失函数是平方差损失,常用梯度下降法求解参数。 使用要点:这个模型不像其 ...
分类:
其他好文 时间:
2020-02-29 15:05:01
阅读次数:
105
算法的简要概述 在机器学习问题中,高维度数据进行回归和分类是一个很困难的问题。例如在许多Microarray生物数据上,数据的维度通常是千和万级别,但是由于收集数据需要昂贵的实验,因此可用的训练数据却相当少,通常只有50 300左右,这样的现象通常称为“small samples, large pr ...
分类:
其他好文 时间:
2020-02-29 14:54:03
阅读次数:
115
1。 一般的机器学习方法不会在train好的模型上检查training data的结果,因为NN在training data上都没有办法获得很好的正确率, 所以要先回头看一下要对模型做什么修改,才能使得在training set上取得比较好的正确率。 2。 在training set获得好的结果,但 ...
分类:
其他好文 时间:
2020-02-28 13:54:11
阅读次数:
52
Java机器学习软件介绍 编写程序是最好的学习机器学习的方法。你可以从头开始编写算法,但是如果你要取得更多的进展,建议你采用现有的开源库。在这篇文章中你会发现有关Java中机器学习的主要平台和开放源码库包。 环境 本节描述可用于机器学习的java环境或工作台。他们被称为环境,因为他们为执行机器学习任 ...
分类:
编程语言 时间:
2020-02-28 12:04:45
阅读次数:
86