TensorFlow 是一个端到端开源机器学习平台 安装 pip3 install tensorflow 使用时报错如下 2020-06-03 09:42:51.737502: W tensorflow/stream_executor/platform/default/dso_loader.cc:5 ...
分类:
其他好文 时间:
2020-08-05 10:33:08
阅读次数:
111
随着机器学习(ML)在过去几年的快速发展,开始ML实验变得非常容易。多亏了像scikit-learn和Keras这样的库,用几行代码就可以创建模型。作者:cleverlzc来源:Dockone.io|2020-08-0312:47收藏分享【编者的话】本文是使用持续集成(通过GitHubActions)构建自动模型训练系统的哲学和实践指南。随着机器学习(ML)在过去几年的快速发展,开始ML实验变得非
分类:
其他好文 时间:
2020-08-04 09:58:48
阅读次数:
70
文章来自:微信公众号【机器学习炼丹术】 1 什么是非均衡 分类(classification)问题是数据挖掘领域中非常重要的一类问题,目前有琳琅满目的方法来完成分类。然而在真实的应用环境中,分类器(classifier)扮演的角色通常是识别数据中的“少数派”,比如: 银行识别信用卡异常交易记录 垃圾 ...
分类:
其他好文 时间:
2020-08-03 00:52:13
阅读次数:
123
基于K-means聚类算法的图像分割:https://www.jianshu.com/p/11d7cde4944d 直线检测。。 ...
分类:
编程语言 时间:
2020-08-03 00:51:15
阅读次数:
111
1、常见的降维的方法有:主成分分析,线性判别分析,等距映射,局部线性插入,拉不拉斯特征映射,局部保留投影。 一、PCA: 2、:主成分分析法,最经典的降维的方法,是一种线性,非监督,全局的降维方法。 最大方差理论: 3、PCA旨在找到数据中的主成分,用这些主成分表征原始数据,达到降维的目的。信号具有 ...
分类:
其他好文 时间:
2020-07-30 22:04:18
阅读次数:
75
作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 随着深度学习模型在各种应用中的成功实施,现在是时候获得不仅准确而且速度更快的结果。 为了得到更准确的结果,数据的大小是非常重要的,但是当这个大小影响到机器学习模型的训练时间时,这一直是一个值得关注的问 ...
分类:
其他好文 时间:
2020-07-30 14:42:34
阅读次数:
69
模型性能的度量 在监督学习中,已知样本 ,要求拟合出一个模型(函数),其预测值与样本实际值的误差最小。 考虑到样本数据其实是采样,并不是真实值本身,假设真实模型(函数)是,则采样值,其中代表噪音,其均值为0,方差为。 拟合函数的主要目的是希望它能对新的样本进行预测,所以,拟合出函数后,需要在测试集( ...
分类:
其他好文 时间:
2020-07-29 15:11:56
阅读次数:
68
1.数据处理时缺失指怎么处理 2.L1和L2的区别 3.高维数据如何降维 4.特征处理,连续型和非连续性,给了个例子,年龄和user_id两个特征如何处理 5.LR了解吗,如何解决过拟合问题 6.如何评估模型结果,我把分类和回归分别解释,介绍各种评估方式的不足,还问了ROC曲线横纵坐标 7.Rand ...
分类:
其他好文 时间:
2020-07-28 22:38:27
阅读次数:
115
总结 样本类别分布不均衡处理(处理过拟合和欠拟合问题) 过抽样(上采样):通过增加分类中少数类样本的数量来实现样本均衡 from imblearn.over_sampling import SMOTE 欠抽样(下采样):通过减少分类中多数类样本的数量来实现样本均衡 (可能造成样本数据大量丢失) fr ...
分类:
其他好文 时间:
2020-07-28 00:04:11
阅读次数:
85
在解决问题中,θ可能不是一个值,可能是一个向量,所以在求导的时候可以写成求梯度的形式,求函数在每个方向上的偏导数。 其实和上一节处理的问题也相似,只不过这个处理的不是一个数,是一个向量。 这是一个三元函数的曲线图。图中的红色圈圈就是函数曲线。假如起始点从左上角那个点出发,一直到数值最低的点,其实这个 ...
分类:
其他好文 时间:
2020-07-27 23:56:02
阅读次数:
90