1 机器学习概览 1.1 机器学习定义 计算机程序利用经验E学习任务T,他的性能P会随着经验E不断增长。例如垃圾邮件过滤器,传统的编程技术只是针对指定的关键词(credit card,sale house)进行过滤。如果出现新的关键词保险,则需要更新标记。基于机器学习的垃圾邮件过滤器会自动检测保险关 ...
分类:
其他好文 时间:
2020-03-12 17:14:02
阅读次数:
61
学习了pytesseract+Tesseract-OCR 链接:https://www.cnblogs.com/liujinxin123/p/12434679.html Python+OpenCV https://www.cnblogs.com/liujinxin123/p/12443494.htm ...
分类:
其他好文 时间:
2020-03-12 09:16:32
阅读次数:
50
Boosting&kmeans&特征工程 [TOC] 1 Boosting 1.1 Boosting的由来 古语云:三个臭皮匠,顶一个诸葛亮。而在机器学习领域,集成算法Boosting就是一个活生生的实例。Boosting和之前介绍过的Bagging相似,都是集成算法之一。Boosting通过整合多 ...
分类:
其他好文 时间:
2020-03-11 18:12:53
阅读次数:
48
Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库,又有第三方库和工具。读者福利,想要了解python人工智能可直接点击链接即可领取相关学习福利包:石墨文档是安全网站放心,继续访问就可以领取了哦这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度
分类:
编程语言 时间:
2020-03-11 09:11:36
阅读次数:
83
BlogAddress:https://blog.51cto.com/14669127微软于2月13日发布了Azure共享磁盘的预览版本,这是业界第一个共享云块存储。Azure共享磁盘支持块存储工作负载迁移到云上,包括要求最高的企业应用程序,他们目前在存储区域网络(san)上运行,其中包括集群数据库,并行文件系统,持久容器和机器学习应用程序,这种独特的功能使客户能够运行对延迟敏感的工作负载,而不会
分类:
其他好文 时间:
2020-03-10 23:29:23
阅读次数:
92
转自: 对于训练集,验证集,测试集的概念,很多人都搞不清楚。网上的文章也是鱼龙混杂,因此,现在来把这方面的知识梳理一遍。让我们先来看一下模型验证(评估)的几种方式。 在机器学习中,当我们把模型训练出来以后,该怎么对模型进行验证呢?(也就是说怎样知道训练出来的模型好不好?)有以下几种验证方式: 第一种 ...
分类:
其他好文 时间:
2020-03-10 14:07:58
阅读次数:
64
学习机器学习算法,最难的不是算法及公式推导的学习,因为这些很多都是成熟的现成的,有代码例子可以直接使用。最难的是将算法应用到实际的项目当中。 1. 算法概念 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在 ...
分类:
编程语言 时间:
2020-03-10 12:16:06
阅读次数:
60
K Mean(K 均值聚类)算法用于将数据集分成 K 个簇,K 值是由用户给定的 优点:容易实现 缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢 算法 随机初始化 k 个簇中心点 每个样本分到距离最近的簇 取分到该簇的所有样本的均值做为该簇的新的中心点 重新分配每个样本到距离最近的簇 不断迭代 ...
分类:
其他好文 时间:
2020-03-10 09:13:39
阅读次数:
56
Python代码实现 一·分类模型 1.sklearn.metrics中包含常用的评价指标: #准确率 accuracy_score(y_true, y_pred, normalize=True, sample_weight=None) 参数: y_true :验证集 y_pred :分类器的返回值 ...
分类:
其他好文 时间:
2020-03-09 20:59:43
阅读次数:
85