Pipeline:一个管道将模型搭建的过程放在一起,如数据预处理和模型建立放在一起,方便参数的同时调整 转载自:http://blog.csdn.net/yisuoyanyv/article/details/74066962; http://blog.csdn.net/SA14023053/arti ...
分类:
其他好文 时间:
2017-11-05 13:56:56
阅读次数:
204
主要的步骤: 转载至:http://www.cnblogs.com/chenbjin/p/4200790.html?utm_source=tuicool&utm_medium=referral 1.数据中心化,均值为0,方差为1(目的:协方差矩阵表示的为方差,方差为1,消除量纲影响(由于最大化方差, ...
分类:
编程语言 时间:
2017-11-04 19:44:38
阅读次数:
616
详细剖析PCA主成分分析原理 转自:http://blog.codinglabs.org/articles/pca-tutorial.html PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用 ...
分类:
其他好文 时间:
2017-11-01 21:44:52
阅读次数:
253
目录: 爬虫性能原理 scrapy框架解析 一、爬虫性能原理 在编写爬虫时,性能的消耗主要在IO请求中,当单进程单线程模式下请求URL时必然会引起等待,从而使得请求整体变慢。 1、同步执行 1 import requests 2 3 def fetch_async(url): 4 response ...
分类:
编程语言 时间:
2017-10-30 15:06:30
阅读次数:
272
一、概述 最近邻规则分类(K-Nearest Neighbor)KNN算法 由Cover 和Hart在1968年提出了最初的邻近算法, 这是一个分类(classification)算法 输入基于实例的学习(instance-based learning), 懒惰学习(lazy learning) 二 ...
分类:
编程语言 时间:
2017-10-26 15:36:30
阅读次数:
137
hping官网介绍:http://www.hping.org/ hping is a command-line oriented TCP/IP packet assembler/analyzer. The interface is inspired to the ping(8) unix comma ...
分类:
其他好文 时间:
2017-10-26 13:36:43
阅读次数:
211
基本数据类型 数字 int 字符串 str 布尔值 bool 列表 list 元组 tuple 字典 dict 数据类型关系图 查看一个对象的类 运行输出: <type “str”> str是字符串类 备注:第一个是IDLE(python GUI)运行出来的,第二个是pycharm运行出来的 查看一 ...
分类:
编程语言 时间:
2017-10-25 21:24:54
阅读次数:
233
About This project is part of the Udacity Machine Learning Engineer Nanodegree (https://www.udacity.com/course/machine-learning-engineer-nanodegree-by ...
分类:
其他好文 时间:
2017-10-24 13:16:48
阅读次数:
156
梯度方向:上升的方向 梯度下降:沿着梯度的反方向下降,来最小化损失函数,也就是沿着梯度的反方向 泰勒级数:展开式通项 贝叶斯公式:后验概率=先验概率*条件概率 特征值与特征向量:特征值不同,特征向量线性无关 PCA:降维的同时尽可能的保留原始的信息 过程 1)先求解协方差矩阵 2)求解协方差矩阵的特 ...
分类:
其他好文 时间:
2017-10-22 22:13:15
阅读次数:
144
这节课主要是讲了些基本的numpy,scipy和线性的分类器(图像上面,比如knn),还讲了下一些损失函数 一:numpy,scipy和线性的分类器(图像上面,比如knn)主要讲代码 二:损失函数:主要是两大类 cost function、loss function、 objective(客观度) ...
分类:
其他好文 时间:
2017-10-22 21:20:33
阅读次数:
209