Python readability的使用: from readability.readability import Document import urllib html = urllib.urlopen(url).read() readable_article = Document(html). ...
分类:
编程语言 时间:
2017-09-11 10:14:27
阅读次数:
263
import reimport urllib.request# ------ 获取网页源代码的方法 ---def getHtml(url): page = urllib.request.urlopen(url) html = page.read() return html# ------ getHt... ...
分类:
Web程序 时间:
2017-09-11 10:08:23
阅读次数:
262
# 爬虫项目原理:打开网址 获取源码 找到图片 匹配取出## urllib模块:urlopen打开 read源码# urlretrieve保存到文件,下载 ...
分类:
Web程序 时间:
2017-09-09 15:50:54
阅读次数:
189
#coding=utf-8import urllib.requestimport redef getHtml(url): page = urllib.request.urlopen(url) html = page.read() return htmldef getImg(html): html = ...
分类:
编程语言 时间:
2017-09-07 19:34:33
阅读次数:
165
准备: 1.扒网页,根据URL来获取网页信息 urlopen方法 url即为URL,data是访问URL时要传送的数据,timeout是设置超时时间 返回response对象 response对象的read方法,可以返回获取到的网页内容 POST GET 2.正则表达式re模块 Python 自带了 ...
分类:
编程语言 时间:
2017-09-07 13:22:18
阅读次数:
296
Python readability的使用: from readability.readability import Document import urllib html = urllib.urlopen(url).read() readable_article = Document(html). ...
分类:
Web程序 时间:
2017-09-04 09:46:25
阅读次数:
615
答案: 心得:在第85次和第140次的时候分别有个小坑 ...
分类:
编程语言 时间:
2017-09-02 11:24:01
阅读次数:
178
前言:Appium的初学者中难免会遇到各种问题,现将在使用中遇到的问题,做个简单记录 1、urllib2.URLError: <urlopen error [Errno 10061] > 解决方法: (1)发现是由于自己手机上连接了代理,去掉代理,以上报错消失 (2)没有启动Appium,启动后,以 ...
分类:
移动开发 时间:
2017-08-31 12:37:13
阅读次数:
336
来源网站:http://www.pythonclub.org/python-network-application/observer-spider 学用python也有3个多月了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚 ...
分类:
编程语言 时间:
2017-08-29 19:38:39
阅读次数:
244
一,回顾操作系统的概念 操作系统位于底层硬件与应用软件之间的一层 工作方式:向下管理软件,向上提供接口 二,进程线程的概念 进程是一个资源单位,线程是一个最小的执行单位 一个线程只能属于一个进程,而一个进程可以有多个线程,但至少有一个线程 三,并行与并发 并行: 就是有多个进程可以同时运行的叫做并行 ...
分类:
编程语言 时间:
2017-08-26 22:47:55
阅读次数:
353