一、Scrapy简介与部署环境Scrapy是一个为了爬取网站数据,提取结构性数据而编写的第三方爬虫框架。可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。最初是为了页面抓取(更确切来说,网络抓取)所设计的,也可以应用在获取API所返回的数据(例如AmazonAssociates..
分类:
系统相关 时间:
2017-10-24 16:05:46
阅读次数:
1464
学习爬虫有一段时间了,今天使用Scrapy框架将校花网的图片爬取到本地。Scrapy爬虫框架相对于使用requests库进行网页的爬取,拥有更高的性能。 Scrapy官方定义:Scrapy是用于抓取网站并提取结构化数据的应用程序框架,可用于广泛的有用应用程序,如数据挖掘,信息处理或历史存档。 建立S ...
分类:
其他好文 时间:
2017-10-23 01:14:38
阅读次数:
307
什么是计算机计算机是电子数字计算机的简称,是一种自动的地,高速地进行数值运算和信息处理的电子设备。他主要由一些机械的,电子的器件组成,再配以适当的程序和数据。程序及数据输入后可以自动执行,用以解决某些实际问题。计算机中的各个物理实体为计算机硬件。程序和数据..
分类:
系统相关 时间:
2017-10-18 20:10:37
阅读次数:
292
(1)介绍 ·详细设计的根本目标是确定怎样具体地实现所要求的系统,也就是说, 经过这个阶段的设计工作,应该得出对目标系统的精确概述,从而在编 码阶段可以把这个描述直接翻译成某种程序设计语言的程序。 ·详细设计的阶段的任务还不是具体的编写程序,而是要设计出程序的“蓝图”, 详细设计的结果基本上决定最终 ...
分类:
其他好文 时间:
2017-10-17 17:31:23
阅读次数:
206
mysql_secure_installation 提示错误:Enter current password for root (enter for none):ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using p... ...
分类:
数据库 时间:
2017-10-16 14:50:38
阅读次数:
182
1 HttpContext上下文作用 有关应用程序状态信息,处理的请求以及构建的响应等信息全部通过HttpContext上下文获取 2 Httpcontext类用于从头至尾跟踪请求的状态,他也是有关请求的所有可用信息(包括httpRequest和httpResponse对象)的通道 3 模块 模块将 ...
分类:
Web程序 时间:
2017-10-12 21:36:29
阅读次数:
216
学习之前举一个简单的小栗子,让我们简单了解一下Ajax的应用与好处。一般网站都会有自己的数据库,用来单独存储用户的个人信息,平时我们在注册账号的时候会遇到信息输入的页面,假设第一个输入信息是用户名的填写,一般当你填写这第一个的时候旁边就会有提醒,提醒你的用户名是否合法,是否被占用等等。 这里就用到了 ...
分类:
Web程序 时间:
2017-10-09 22:32:32
阅读次数:
170
一个相对完整的http请求,输入ip和端口,输出响应码,响应头,响应体,是否超时,以及出错时的错误信息 处理包括: 1.协议处理,如果是443用https,其他用http 2.HTTPError处理,HTTPError一般是401,403,404之类的错误,虽然报错,但是也有响应头。注意获取错误信息 ...
分类:
编程语言 时间:
2017-10-09 17:47:43
阅读次数:
204
1.1 Steam平台的简单介绍 你选择的产品是? 如题,这次的作业我选择了Steam作为分析的对象。 为什么选择该产品作为分析? 我选择数字游戏贩售平台STEAM作为分析对象的原因有以下几点: 1.Steam是我已经使用了几年时间的一个软件,我相信我对他有一定的了解,能够做出客观的分析 2.作为目 ...
分类:
其他好文 时间:
2017-10-08 14:08:16
阅读次数:
198
语音识别是基于百度语音REST aip-python-sdk-1.6.0,树莓派上已安装pycurl,mplayer。 1:注册账号,获取token 2:提交语音相关信息 3:处理返回的Json数据包 具体代码过程可参考:http://blog.csdn.net/zyaiwmy/article/de ...
分类:
其他好文 时间:
2017-10-08 11:23:11
阅读次数:
627