在各类比赛中经常出现预测回归问题,一般使用scikit learn的模型,本文就对这些类库的使用做一个总结,总结时注重自己做比赛中的使用经验。 1. Ordinary Least Squares(最小二乘法) 最简单的线性模型,损失函数是平方差损失,常用梯度下降法求解参数。 使用要点:这个模型不像其 ...
分类:
其他好文 时间:
2020-02-29 15:05:01
阅读次数:
105
依据机器学习算法如何学习数据可分为3类: 有监督学习:从有标签的数据学习,得到模型参数,对测试数据正确分类; 无监督学习:没有标签,计算机自己寻找输入数据可能的模型; 强化学习(reinforcement learning):计算机与动态环境交互,学习错误反馈达到更优的目的。 依据机器学习期望结果来 ...
分类:
其他好文 时间:
2020-02-28 11:57:59
阅读次数:
60
保存为pickle 保存为joblib 参考:https://www.cnblogs.com/lianyingteng/p/7811126.html ...
分类:
其他好文 时间:
2020-02-27 23:34:08
阅读次数:
56
git添加远程库的时候有可能出现如下的错误, 怎么解决? 只要两步: 1、先删除 $ git remote rm origin 2、再次执行添加就可以了。 git常用操作 说明,以下整理来自廖雪峰大神的《git教程》。 各位童鞋要下载git但是网速不给力的,可以从这里下载:https://pan.b ...
分类:
其他好文 时间:
2020-02-27 15:50:59
阅读次数:
81
1 简介 scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。 SKlearn官网:http://scikit-lear ...
分类:
其他好文 时间:
2020-02-27 12:52:19
阅读次数:
78
1、问题简述 假设有一名植物学爱好者对她发现的鸢尾花的品种很感兴趣。她收集了每朵鸢尾花的一些测量数据: 花瓣的长度和宽度以及花萼的长度和宽度,所有测量结果的单位都是厘米。 她还有一些鸢尾花的测量数据,这些花之前已经被植物学专家鉴定为属于 setosa、versicolor 或 virginica 三 ...
分类:
编程语言 时间:
2020-02-27 01:16:47
阅读次数:
343
线上服务器CPU占用率高如何排查定位 环境 centos7 1核2GB Java8 模拟cpu占用高 新建一个名为jvm-learn的springboot项目 模拟代码如下 import org.springframework.boot.SpringApplication; import org.s ...
分类:
其他好文 时间:
2020-02-26 18:38:24
阅读次数:
74
Unlike JavaScript's const variable declarations, TypeScript allows you to create fully immutable types. In this lesson, we learn how to create immutab ...
分类:
其他好文 时间:
2020-02-26 01:28:44
阅读次数:
64
最近做项目想用下 xlearn,在自己的mac本上,已经安装了gcc9.1.0和cmake3.14.1,直接 pip install xlearn 就安装成功了,但是在一台centos6.6,内核版本为 2.6.32-754.6.3.el6.x86_64(使用unname -r 查看)的服务器上总是 ...
分类:
其他好文 时间:
2020-02-25 11:12:58
阅读次数:
226
在使用 pd.scatter_matrix() 函数时会出现 module 'pandas' has no attribute 'scatter_matrix'错误 解决方法: 将代码改成: pd.plotting.scatter_matrix() 这个就可以显示出散点图矩阵了 完整代码: iris ...
分类:
其他好文 时间:
2020-02-24 21:04:59
阅读次数:
112