机器学习算法可以分为: 监督学习 非监督学习 半监督学习 增强学习 监督学习:给机器的训练数据拥有“标记”或者“答案”,例如: 我们需要告诉机器左边的画面是一只狗,而右边的照片是一只猫。同理对于MNIST数据集,给机器图像信息后还应该附上标记信息,如图所示: 运用监督学习的场景举例: 图像已经拥有了 ...
分类:
编程语言 时间:
2018-04-22 13:01:52
阅读次数:
199
Python3 利用openpyxl 以及jieba 对帖子进行关键词抽取 ——向量生成 20180417学习笔记、20180421修改 一、工作 今天中午开了一次小组讨论会议,老师旁听了并给出了一些意见。 今天的工作主要是两个,一个是构造SVM所需要的向量,一个是标注无关帖子500条。 但是后面遇 ...
分类:
编程语言 时间:
2018-04-21 17:34:43
阅读次数:
267
libvirt用于管理KVM本身的工具 virt-install用于安装虚拟机需要的安装包,安装虚拟机 virt-mananger:管理创建删除虚拟机的工具 恢复内容开始 1 grep -E "svm | vmx" /proc/cpuinfo 查看kvm是否被加载 [root@localhost y ...
分类:
系统相关 时间:
2018-04-20 18:00:30
阅读次数:
227
首先我们应该对SVM的参数有一个详细的认知: sklearn.svm.SVC 参数说明: 本身这个函数也是基于libsvm实现的,所以在参数设置上有很多相似的地方。(PS: libsvm中的二次规划问题的解决算法是SMO)。sklearn.svm.SVC(C=1.0, kernel='rbf', d ...
分类:
其他好文 时间:
2018-04-17 23:53:49
阅读次数:
614
使用cross_val_score可以做,learning_curve,validition_curve也可以。 ...
分类:
其他好文 时间:
2018-04-16 18:35:27
阅读次数:
232
框架介绍 上一篇从总体上介绍了推荐系统,推荐系统online和offline是两个组成部分,其中offline负责数据的收集,存储,统计,模型的训练等工作;online部分负责处理用户的请求,模型数据的使用,online learning等。本篇因为online中有比较复杂的ranking,rank ...
分类:
其他好文 时间:
2018-04-15 12:10:44
阅读次数:
1200
一、支持向量机(SVM) 支持向量机,是用于解决分类问题。为什么叫做支持向量机,后面的内容再做解释,这里先跳过。 在之前 "《逻辑回归》" 的文章中,我们讨论过,对于分类问题的解决,就是要找出一条能将数据划分开的边界。 对于不同的算法,其定义的边界可能是不同的,对于SVM算法,是如何定义其边界的?其 ...
分类:
其他好文 时间:
2018-04-13 16:17:30
阅读次数:
145
转载自:https://www.leiphone.com/news/201706/dTRE5ow9qBVLkZSY.html 数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下降。绝大多数常见的 ...
分类:
其他好文 时间:
2018-04-12 19:52:49
阅读次数:
1144
1. 验证CPU是否支持KVM;如果结果中有vmx(Intel)或svm(AMD)字样,就说明CPU的支持的。 egrep '(vmx|svm)' /proc/cpuinfo 2. 关闭SELinux与防火墙 将 /etc/sysconfig/selinux 中的 SELinux=enforcing ...
分类:
其他好文 时间:
2018-04-12 18:38:44
阅读次数:
192
"洛谷题目传送门" emm。。。题目名写了个平衡树,但是这道题的理论复杂度最优解应该还是树状数组套值域线段树吧。 就像 "dynamic ranking" 那样(蒟蒻的 "Sol" ,放一个link骗访问量233) 所有的值(包括初始a数组,操作1、3、4、5的k)全部先丢进去离散化 对于1操作查比 ...
分类:
编程语言 时间:
2018-04-11 00:18:32
阅读次数:
194