作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 随着深度学习模型在各种应用中的成功实施,现在是时候获得不仅准确而且速度更快的结果。 为了得到更准确的结果,数据的大小是非常重要的,但是当这个大小影响到机器学习模型的训练时间时,这一直是一个值得关注的问 ...
分类:
其他好文 时间:
2020-07-30 14:42:34
阅读次数:
69
模型性能的度量 在监督学习中,已知样本 ,要求拟合出一个模型(函数),其预测值与样本实际值的误差最小。 考虑到样本数据其实是采样,并不是真实值本身,假设真实模型(函数)是,则采样值,其中代表噪音,其均值为0,方差为。 拟合函数的主要目的是希望它能对新的样本进行预测,所以,拟合出函数后,需要在测试集( ...
分类:
其他好文 时间:
2020-07-29 15:11:56
阅读次数:
68
1.数据处理时缺失指怎么处理 2.L1和L2的区别 3.高维数据如何降维 4.特征处理,连续型和非连续性,给了个例子,年龄和user_id两个特征如何处理 5.LR了解吗,如何解决过拟合问题 6.如何评估模型结果,我把分类和回归分别解释,介绍各种评估方式的不足,还问了ROC曲线横纵坐标 7.Rand ...
分类:
其他好文 时间:
2020-07-28 22:38:27
阅读次数:
115
总结 样本类别分布不均衡处理(处理过拟合和欠拟合问题) 过抽样(上采样):通过增加分类中少数类样本的数量来实现样本均衡 from imblearn.over_sampling import SMOTE 欠抽样(下采样):通过减少分类中多数类样本的数量来实现样本均衡 (可能造成样本数据大量丢失) fr ...
分类:
其他好文 时间:
2020-07-28 00:04:11
阅读次数:
85
在解决问题中,θ可能不是一个值,可能是一个向量,所以在求导的时候可以写成求梯度的形式,求函数在每个方向上的偏导数。 其实和上一节处理的问题也相似,只不过这个处理的不是一个数,是一个向量。 这是一个三元函数的曲线图。图中的红色圈圈就是函数曲线。假如起始点从左上角那个点出发,一直到数值最低的点,其实这个 ...
分类:
其他好文 时间:
2020-07-27 23:56:02
阅读次数:
90
作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 文本分类是自然语言处理的重要应用之一。在机器学习中有多种方法可以对文本进行分类。但是这些分类技术大多需要大量的预处理和大量的计算资源。在这篇文章中,我们使用PyTorch来进行多类文本分类,因为它有如 ...
分类:
其他好文 时间:
2020-07-27 15:47:34
阅读次数:
72
作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 自然语言处理(NLP)有很多有趣的应用,文本生成就是其中一个有趣的应用。 当一个机器学习模型工作在诸如循环神经网络、LSTM-RNN、GRU等序列模型上时,它们可以生成输入文本的下一个序列。 PyTo ...
分类:
其他好文 时间:
2020-07-26 19:20:18
阅读次数:
68
一.什么是机器学习? 什么是机器学习?Herbert Sinmon给“学习”做出了这样的定义:“如果一个系统能够通过执行某个过程而改进性能,这就是学习。”更通俗的理解是:机器学习能够自动地从数据中学习“程序”,而这个程序不是人来编写的。 平面上有两类点,黄色代表类别a,蓝色代表类别b。这时我们希望能 ...
分类:
其他好文 时间:
2020-07-26 15:43:33
阅读次数:
56
作者|GUEST 编译|VK 来源|Analytics Vidhya 介绍 时间序列预测是机器学习的一个非常重要的领域,因为它让你能够提前“预见”并据此制定业务计划。 在本博客中,我们将了解什么是时间序列预测,Power BI如何制作时间序列预测图和Power BI用于预测的模块。 什么是时间序列预 ...
分类:
其他好文 时间:
2020-07-26 01:51:41
阅读次数:
87
关于如何使用机器学习来做异常检测的7个问题 导读 异常检测的一些入门问题。 关于如何使用机器学习来做异常检测的7个问题 问问题是学习的好方法之一。但有时你不知道从哪里开始,或者该问什么 —— 尤其是在你还比较熟悉的异常检测之类的话题上。在这种情况下,最好倾听别人的问题,让他们的思路来指导你的学习。以 ...
分类:
其他好文 时间:
2020-07-26 00:37:36
阅读次数:
63