http://www.allitebooks.org/ 是我见过最良心的网站,所有书籍免费下载 周末无聊,尝试采集此站所有Pdf书籍。 采用技术 python3.5 Beautiful soup 分享代码 最简单的爬虫,没有考虑太多的容错,建议大家尝试的时候,温柔点, 别把这个良心网站搞挂掉了 ...
分类:
编程语言 时间:
2019-06-07 19:28:29
阅读次数:
115
P38——Python哲学 打开Python shell,输入import this,会看到下面的话: The Zen of Python, by Tim Peters Beautiful is better than ugly.优美胜于丑陋(Python 以编写优美的代码为目标) Explicit ...
分类:
编程语言 时间:
2019-06-05 09:36:44
阅读次数:
106
```
# coding=utf-8 from bs4 import BeautifulSoup
import requests
import urllib
x = 1
y = 1 def crawl(url): res = requests.get(url) soup = BeautifulSou... ...
分类:
Web程序 时间:
2019-06-03 22:00:21
阅读次数:
311
XML: 1、概念:Extensible Markup Language 可扩展标记语言。 * 可扩展:标签是自定义的。 2、功能:存储数据 : * 配置文件 。 * 在网络中传输。 3、语法: * 基本语法:1、后缀名:.xml 2、第一行必须写文档声明: 3、xml文档中有且仅有一个根标签。 4 ...
分类:
其他好文 时间:
2019-06-03 12:12:40
阅读次数:
87
Beautiful: - 基本使用 from bs4 import BeautifulSoup 解析库: BeautifulSoup4 - 安装: - 解析库安装 pip3 install beautifulsoup4 - 解析器安装 pip3 install lxml - 基本使用 - 导入模块 ...
分类:
其他好文 时间:
2019-06-01 21:09:42
阅读次数:
110
今天我们来学习以下有关于数据提取以及数据库的一些知识, 我们知道其实数据库是一个非常神奇的存在,它是是按照 数据结构来组织、 存储和管理数据的仓库 我们可以使用它对数据进行储存和管理! 下面是有关于sqlite3的学习,SQLite3 可使用 sqlite3 模块与 Python 进行集成。 这是一 ...
分类:
数据库 时间:
2019-05-30 01:47:10
阅读次数:
145
全排列枚举 这题不能用贪心的。。反例很多。。 有一个最暴力的方法就是枚举所有全排列,在n次交换内能复原就更新答案。 为了方便复原,我们枚举的全排列是原数的每个位数的位置的全排列。 include define INF 0x3f3f3f3f define full(a, b) memset(a, b, ...
分类:
其他好文 时间:
2019-05-28 17:09:37
阅读次数:
93
使用正则表达式 正则表达式相关知识 在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要,正则表达式就是用于描述这些规则的工具,换句话说正则表达式是一种工具,它定义了字符串的匹配模式(如何检查一个字符串是否有跟某种模式匹配的部分或者从一个字符串中将与模式匹配的部分提取出来或者替 ...
分类:
其他好文 时间:
2019-05-27 10:39:09
阅读次数:
122
Beautiful Soup和lxml一样,也是一个HTML/XML的解析器,主要的功能也是如何解析和提取HTML/XML数据lxml只会局部遍历,而Beautiful Soup是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml/Beau ...
分类:
其他好文 时间:
2019-05-26 15:39:33
阅读次数:
129
html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were Lacie and Tillie and they ... ...
分类:
编程语言 时间:
2019-05-26 13:20:15
阅读次数:
172