Web抓取Web站点使用HTML描述,这意味着每个web页面是一个结构化的文档。有时从中 获取数据同时保持它的结构是有用的。web站点不总是以容易处理的格式, 如 csv 或者 json 提供它们的数据。 这正是web抓取出场的时机。Web抓取是使用计算机程序将web页面数据进行收集 并整理成所需格 ...
分类:
编程语言 时间:
2018-01-10 15:52:10
阅读次数:
214
python学习笔记(六)之集合1python中各种类型与其各种方法,都可以使用下面的方法查到:(1)交互模式下用dir()或者help()(2)google集合特点:英语set,有的可变,有的不可变;元素无次序,不可重复。集合没有索引(可以使用dir(set)查看),也就没有顺序而言,它不属于序列。集合中的元素是hashable(不可变)类型!创建集合--字符串实例1:s1=set("
分类:
编程语言 时间:
2018-01-10 15:50:02
阅读次数:
186
遇到了一个很诡异的错误。写一个字典,存入json文件。之后读出判断是否存在key。结果惊奇的发现,同一个key居然存在两次。 原因:json会将数值key转换为unicode 结论:使用json时字典key不可为数值! 复现问题: 对比a和c可以看到,数值型的key被转成了unicode,之后再写入 ...
分类:
编程语言 时间:
2018-01-10 15:34:39
阅读次数:
189
动态类型(dynamic typing) 是Python另一个重要的核心概念。我们之前说过,Python的变量(variable)不需要声明,而在赋值时,变量重复赋值为任意值。这些都与动态类型的概念相关。 动态类型 在我们接触的对象中,有一类特殊的对象,适用于存储数据的。常见的该类对象包括各种数字, ...
分类:
编程语言 时间:
2018-01-10 15:33:56
阅读次数:
129
Python3之sys模块 一.简介 sys模块用于提供对python解释器的相关操作。 二.常用函数 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 ...
分类:
编程语言 时间:
2018-01-10 15:33:26
阅读次数:
164
一、下载python3 下载python3版本 二、安装依赖包 三、解压安装 四、验证 $ python2.7 -VPython 2.7.5 Python 3.7.0a3 五、设置为默认版本 六、更改yum配置 #!/usr/bin/python更改为#!/usr/bin/python2.7 同理更 ...
分类:
编程语言 时间:
2018-01-10 15:31:36
阅读次数:
181
collections模块 在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter、deque、defaultdict、namedtuple和OrderedDict等。 1.namedtuple: 生成可以使用名字来访问 ...
分类:
编程语言 时间:
2018-01-10 14:51:22
阅读次数:
226
http://www.cnblogs.com/wupeiqi/articles/5095821.html Python之路【第八篇】:堡垒机实例以及数据库操作 堡垒机前戏 开发堡垒机之前,先来学习Python的paramiko模块,该模块机遇SSH用于连接远程服务器并执行相关操作 SSHClient ...
分类:
数据库 时间:
2018-01-10 14:50:25
阅读次数:
268