# by luffycity.comimport refrom urllib.request import urlopendef getPage(url): # 获取网页的字符串 response = urlopen(url) return response.read().decode('utf-8 ...
分类:
其他好文 时间:
2018-10-15 16:16:50
阅读次数:
173
你有阅读的习惯吗?有自己的阅读框架吗? ... 国庆长假,没有到处跑,闲在家里读读书。看了一下我在豆瓣标记为 “想读” 的书籍已经突破了 300 本,而已标记读过的书才一百多本,感觉是永远读不完了。 好早以前我这个 “想读” 列表是很短的,一般不超过 20 本,因为以前我看见这个列表太长了后,就会主 ...
分类:
其他好文 时间:
2018-10-07 20:28:48
阅读次数:
169
1.scrapy框架 Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫 ...
分类:
其他好文 时间:
2018-10-04 22:26:20
阅读次数:
223
scrapy movie.py items.py pipelines.py mian.py 保存结果 txt文件 ...
分类:
其他好文 时间:
2018-10-04 10:29:58
阅读次数:
140
职位描述: 1、负责豆瓣用户产品多平台后端开发工作,主要编程语言是 Python 和 Go; 2、参与产品设计,与前端和移动端工程师一同探讨技术方案; 3、参与架构设计,与平台工程师合作优化新旧服务的性能和稳定性。 职位要求: 1、扎实的计算机基础知识,了解常用数据结构和算法; 2、熟练掌握至少一门 ...
分类:
编程语言 时间:
2018-10-01 01:10:58
阅读次数:
205
我们通常衡量一个Web系统的吞吐率的指标是QPS(Query Per Second,每秒处理请求数),解决每秒数万次的高并发场景,这个指标非常关键。举个例子,我们假设处理一个业务请求平均响应时间为100ms,同时,系统内有20台Apache的Web服务器,配置MaxClients为500个(表示Ap ...
分类:
Web程序 时间:
2018-09-28 01:43:39
阅读次数:
209
但是我们也发现每一次登陆都要输入密码和账户,还要验证,这也实在是太麻烦了,所以可以通过cookies,这就是我们常说的那些记住当前网址的密码 关于上面的那个爬虫,爬出来的其实是验证码的图片,还需要手动打开然后识别图片里面的数字再手动输入,这个其实也是很麻烦的 这里先给出思路以后验证(如果还记得的呼哈 ...
分类:
其他好文 时间:
2018-09-25 23:28:19
阅读次数:
198
自己瞎整理的一些书单,都是豆瓣评分比较高的书,可以作为选择的一个参考。 书名 豆瓣链接 ...
分类:
其他好文 时间:
2018-09-24 00:30:43
阅读次数:
265
https://www.cnblogs.com/milo-wjh/p/6796082.html 对于分享插件来说,大家肯定都很熟悉,最常用的就是百度分享、jiathis分享等,可分享的媒体也非常多,当然最常用的需求无非也就新浪微博、QQ空间、QQ好友、微信朋友圈、微信好友,其他什么乱七八糟的人人网、 ...
分类:
移动开发 时间:
2018-09-20 13:09:07
阅读次数:
575
在ubuntu中,升级了pip3,再次使用pip3安装相关的python包的时候就出现以下错误 解决:pip3文件在/usr/bin目录下,cd进去,进行以下修改 把下面三行 换成下面三行 问题解决,如果在pip时遇到权限问题,加sudo 如遇到超时或下载很慢,可以用豆瓣源下载 pip3 insta ...
分类:
其他好文 时间:
2018-09-18 14:24:58
阅读次数:
212