本文作者用python代码示例解释了3种处理不平衡数据集的可选方法,包括数据层面上的2种重采样数据集方法和算法层面上的1个集成分类器方法。 分类是机器学习最常见的问题之一,处理它的最佳方法是从分析和探索数据集开始,即从探索式数据分析(Exploratory Data Analysis, EDA)开始 ...
分类:
其他好文 时间:
2020-03-31 12:14:57
阅读次数:
173
random_state是一个随机种子,是在任意带有随机性的类或函数里作为参数来控制随机模式。当random_state取某一个值时,也就确定了一种规则。 random_state可以用于很多函数,我比较熟悉的是用于以下三个地方:1、训练集测试集的划分 2、构建决策树 3、构建随机森林 1、划分训练 ...
分类:
其他好文 时间:
2020-03-31 01:25:49
阅读次数:
523
在所有后量子密码体制中,格是研究最活跃和最灵活的。它们具有很强的安全性,能够进行密钥交换、数字签名,以及构造出像全同态加密这样复杂的算法。尽管格密码体制的优化和安全性都需要非常复杂的数学证明,但基本思想只需要基本的线性代数。假设你有一个如下线性方程组: 求解x是一个经典的线性代数问题,可以用高斯消元 ...
分类:
其他好文 时间:
2020-03-30 20:06:02
阅读次数:
573
1 什么是逻辑回归 1.1逻辑回归与线性回归的区别: 线性回归预测的是一个连续的值,不论是单变量还是多变量(比如多层感知器),他都返回的是一个连续的值,放在图中就是条连续的曲线,他常用来表示的数学方法是Y=aX+b; 与之相对的,逻辑回归给出的值并不是连续的,而是 类似于“是” 和 “否” 的回答, ...
分类:
其他好文 时间:
2020-03-30 19:35:21
阅读次数:
74
什么是机器学习? 机器学习指的是机器通过统计学算法,对大量的历史数据进行学习从而生成经验模型,利用经验模型指导业务。 目前机器学习主要在一下一些方面发挥作用: 营销类场景:商品推荐、用户群体画像、广告精准投放 金融类场景:贷款发放预测、金融风险控制、股票走势预测、黄金价格预测 SNS关系挖掘:微博粉 ...
分类:
其他好文 时间:
2020-03-30 16:39:57
阅读次数:
164
对于从事IT行业的小伙伴来说,可能都非常疑惑,什么编程语言更简单易学呢?那当然是Python。Python语言简单清晰,对于其他语言来说更容易上手,更招人喜欢,适合IT小白学习,那么Python技术前景怎么样?为大家简单的分析一下吧。
分类:
编程语言 时间:
2020-03-30 15:54:15
阅读次数:
68
SAP官方帮助文档: https://www.sapanalytics.cloud/resources smart discovery/ SAP Analytics Cloud的Smart Discovery功能,底层基于机器学习技术,帮助用户对其业务数据进行挖掘,以作出更快更有效的商业决策。 新建 ...
分类:
其他好文 时间:
2020-03-29 12:36:42
阅读次数:
99
背景 维数灾难是机器学习中常见的现象,具体是指随着特征维数的不断增加,需要处理的数据相对于特征形成的空间而言比较稀疏,由有限训练数据拟合的模型可以很好的适用于训练数据,但是对于未知的测试数据,很大几率距离模型空间较远,训练的模型不能处理这些未知数据点,从而形成“过拟合”的现象。 方案 既然维数灾难严 ...
分类:
其他好文 时间:
2020-03-28 23:13:58
阅读次数:
69
常用的库:Numpy、Pandas、Matplotlib、Scipy等; 编辑器:IPython和Jupyter notebook(Anaconda包含); 1.Numpy:Numerical Python缩写,主要用于数值计算。 2.Pandas:数据分析的主要工具。 3.matplotlib:绘 ...
分类:
其他好文 时间:
2020-03-28 17:51:09
阅读次数:
71
机器学习分为四大块,分别是classification (分类),regression (回归), clustering (聚类), dimensionality reduction (降维)。 聚类(clustering) 无监督学习的结果。聚类的结果将产生一组集合,集合中的对象与同集合中的对象彼 ...
分类:
其他好文 时间:
2020-03-28 16:14:52
阅读次数:
398