爬虫与反爬 (1) 基本的概念 爬虫: 自动获取网站数据的程序 关键是 定时,定量的,批量的获取 反爬虫: 使用技术手段 防止爬虫程序的方法 存在误伤,即 反爬技术 将普通用户识别为爬虫 如果误伤高 效果再好也不能使用 例子: 比如 限制 ip === 用户的ip 一般都是 局域网内动态分配的, 一 ...
分类:
其他好文 时间:
2018-03-22 11:27:06
阅读次数:
237
from urllib import request from lxml import etree # 请求的url url = "http://www.dfenqi.cn/Product/Index" # 请求的头文件 headers = { "User-Agent": "Mozilla/5.0 ...
分类:
Web程序 时间:
2018-03-21 17:29:09
阅读次数:
334
https://www.jianshu.com/p/2ff8e6f98257 PIL.Image与Base64 String的互相转换 mona_alwyn mona_alwyn 2018.01.18 19:02* 字数 281 阅读 39评论 0喜欢 0 2018.01.18 19:02* 字数 ...
分类:
其他好文 时间:
2018-03-21 17:27:50
阅读次数:
597
1.关于二叉树的定义 在计算机科学中,二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)。二叉树常被用于实现二叉查找树和二叉堆。 二叉树的每个结点至多只有二棵子树(不存在度大于2的结点),二叉树的子树有左右之分,次序 ...
分类:
其他好文 时间:
2018-03-20 18:13:05
阅读次数:
220
一、找出并了解当前较为流行的几种源代码管理工具(至少三种); CVS、 SVN、GIT、VSS 二、建立表格对这些源代码管理工具的优缺点进行比较分析。 1.CVS是个基于RCS文件的版本控制系统,不必担心有什么数据损失,如果必要的话可以手工修改RCS文件; 2.CVS代表了几乎代码控制系统的所有功能 ...
分类:
其他好文 时间:
2018-03-20 18:04:23
阅读次数:
161
使用集成的php输出kindeditor无法初始化 页面直接引用php <?php showEditor('content');?>发现无法初始化 后来发现 异步加载主要的问题是KindEditor.ready无法执行,修改在页面上引用即可 参考:http://www.cnblogs.com/zur ...
分类:
其他好文 时间:
2018-03-19 16:42:03
阅读次数:
164
对象操作 查询 直接数据库操作 查询 更新 插入更新删除 事务 ...
分类:
数据库 时间:
2018-03-19 11:45:02
阅读次数:
249
HAproxy负载均衡部署 1、安装HAproxy 2、编辑配置文件 ...
分类:
其他好文 时间:
2018-03-18 20:04:54
阅读次数:
181
首先是第一章,书中例举出了从小孩玩的纸飞机,到“飞屋”,到莱特兄弟的飞机最后到我们看到的飞机。我想到的是,有的人从兴趣出发,觉得某些项目也好,工程也好,需要去实现。有的人放弃了,止步于纸飞机,有的人坚持了,做出了航模,到最后,有人成功实现了飞天梦。但是如果一开始这条路就走不通呢?就像永动机一样,很多 ...
分类:
其他好文 时间:
2018-03-18 15:02:27
阅读次数:
178