作者|SHIPRA SAXENA 编译|Flin 来源|analyticsvidhya 总览 了解什么是分类数据编码 了解不同的编码技术以及何时使用它们 介绍 机器学习模型的性能不仅取决于模型和超参数,还取决于我们如何处理并将不同类型的变量输入模型。由于大多数机器学习模型仅接受数值变量,因此对分类变 ...
分类:
编程语言 时间:
2020-10-18 17:09:15
阅读次数:
40
作者|Saurabh Mhatre 编译|Flin 来源|analyticsvidhya 介绍 互联网上有很多资源可以找到关于机器学习数据集的见解和训练模型,但是关于如何使用这些模型构建实际应用程序的文章很少。 因此,今天我们将通过首先使用hackathon中的数据集来训练视频游戏销售预测模型,然后 ...
分类:
Web程序 时间:
2020-10-18 09:42:12
阅读次数:
26
云上不仅能提供机器学习所需的资源,还有各种环境以及配套工具,能让做机器学习的人只用专注于机器学习本身。
分类:
其他好文 时间:
2020-10-18 09:23:54
阅读次数:
19
误差来源 bias variance 比喻:打靶 真实的Function$\widehat$ 通过训练集得到的最优解$f^*$ $f^*\(是\)\widehat$的一个估计 $\widehat$就是靶心,我们打靶的目标 $f^*$是打靶的结果,与靶心的距离即为误差 假设要估计变量$x$的均值$\m ...
分类:
其他好文 时间:
2020-10-13 17:51:44
阅读次数:
42
关于边缘计算与区块链结合系统研究的综述 (老早之前翻译的一篇文章,论文名我忘了,大家将就看吧,如果作者认为侵权了,请留言,马上删除。) 摘要:区块链作为加密货币的底层技术,受到了广泛的关注。它被广泛应用于智能电网、物联网等领域。然而,区块链存在一个显著的可伸缩性障碍,这限制了它支持频繁事务的服务能力 ...
分类:
其他好文 时间:
2020-10-13 17:30:49
阅读次数:
25
分析训练完成的机器学习模型的性能是任何机器学习工作流程中必不可少的步骤。 在PyCaret中分析模型性能就像编写plot_model一样简单。 该函数将受训的模型对象和图的类型作为plot_model函数中的字符串。 分类: Name Plot Area Under the Curve ‘auc’ ...
分类:
其他好文 时间:
2020-10-13 17:03:38
阅读次数:
22
机器学习--线性单元回归--单变量梯度下降的实现 【线性回归】 如果要用一句话来解释线性回归是什么的话,那么我的理解是这样子的: **线性回归,是从大量的数据中找出最优的线性(y=ax+b)拟合函数,通过数据确定函数中的未知参数,进而进行后续操作(预测) **回归的概念是从统计学的角度得出的,用抽样 ...
分类:
其他好文 时间:
2020-10-08 19:45:53
阅读次数:
36
Decision Tree 决策树 决策树的定义和直观解释 决策树定义 决策树是一类常见的机器学习方法。本质就是一棵树,这棵树表示的含义如下: 每个非叶子结点对应一个判定问题 每个叶子结点对应一个决策结果 每一条从根到叶的路径对应一个完整的决策过程 决策树模型的特点 优点 可解释性极强,常用于医疗诊 ...
分类:
其他好文 时间:
2020-10-05 22:31:25
阅读次数:
37
1.原理 K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。 2、api 3、性能评估 越接近1越好,一般不超过0.7 4、优缺点 优点 1)原理比较简单,实现也是很容易,收敛速度快。 2)聚类效果较 ...
分类:
编程语言 时间:
2020-10-05 22:22:47
阅读次数:
31
使用graph来表示对象之间的复杂关系和依赖关系,然而graph数据的复杂已有的机器学习算法很难处理,所以使用深度学习方法来处理。AComprehensiveSurveyonGraphNeuralNetworks论文回顾图神经网络(GNN)在文本挖掘和机器学习领域的发展,将GNN划分为递归图神经网络、卷积图神经网络、图自编码和时空图神经网络四类。此外还讨论图神经网络跨各种领域的应用、总结开源代码、
分类:
其他好文 时间:
2020-09-23 23:34:52
阅读次数:
45