由于多线程爬取数据比单线程的效率要高,尤其对于爬取数据量大的情况,效果更好,所以这次采用多线程进行爬取。具体代码和流程如下: import math import re from concurrent.futures import ThreadPoolExecutor import requests ...
分类:
编程语言 时间:
2021-05-24 12:04:44
阅读次数:
0
1.判断目录是否存在 在Python中,有时需要判断给定的目录是否存在,这时可以使用os.path模块提供的exists()函数实现。 os.path.exists(path) 其中,path为要判断的目录,可以是绝对路径,也可以采用相对路径。如果给定的路径存在,则返回true,否则返回false。 ...
分类:
编程语言 时间:
2021-05-24 12:03:48
阅读次数:
0
代码: 1 import time 2 import traceback 3 import requests 4 from lxml import etree 5 import re 6 from bs4 import BeautifulSoup 7 from lxml.html.diff impo ...
分类:
数据库 时间:
2021-05-24 12:00:17
阅读次数:
0
关键字参数 关键字参数允许我们在传入必选参数外,还可以接受关键字参数kw: def person(name, age, **kw) prit('name:', name, 'age:', age, 'other', kw) 这里的name, age是必须的,kw可选,意味着第三个参数开始我们可以传入 ...
分类:
编程语言 时间:
2021-05-24 11:11:59
阅读次数:
0
这篇文章主要是对python中的数据进行认识,对于很多初学者来讲,其实数据的认识是最重要的,也是最容易出错的。本文结合数据与内存形态讲解python中的数据,内容包括: 引用与对象 可变数据类型与不可变数据类型 引用传递与值传递 深拷贝与浅拷贝 (id函数:你可以通过python的内置函数 id() ...
分类:
编程语言 时间:
2021-05-24 11:08:14
阅读次数:
0
如果要限制关键字参数的名字,就可以用命名关键字参数,例如,只接收city和job作为关键字参数。 这种方式定义的函数如下: def person(name, age, *, city, job) print(name, age, city, job) # 调用 person('city', 22, ...
分类:
编程语言 时间:
2021-05-24 11:07:39
阅读次数:
0
在别人博客看到这样一句话,觉得总结得蛮到位的:程序运行平台 = CPU+OS+Compiler | | | 在C语言和C++中,经常会出现某一种数据类型所占的字节数为多大的问题,其实这些机器字长和和机器位数没有直接关系,但是和编译器有关系,由编译器在编译期间决定。 | | | | 16位编译器 | ...
分类:
编程语言 时间:
2021-05-24 11:01:21
阅读次数:
0
1 #include <iostream> 2 #include <cstdlib> 3 #include <Windows.h> 4 using namespace std; 5 6 int main() 7 { 8 int i, j; 9 int x = 0; 10 int y = 5; 11 ...
分类:
编程语言 时间:
2021-05-24 10:59:22
阅读次数:
0
批量修改文件名 python 对文件进行批量改名用到的是 os 模块中的 listdir 方法和 rename 方法。 os.listdir(dir):获取指定目录下的所有子目录和文件名 os.rename(原文件名,新文件名):对文件或目录改名 把混乱的文件名改成有序的文件名: import os ...
分类:
编程语言 时间:
2021-05-24 10:50:28
阅读次数:
0
##环境准备 安装windows最新版本git,硬盘建议空闲空间大于100G,内存16G。 安装vs2019,选择默认安装路径,组件选择最新的windows sdk和c++环境,因为google chromium的源码庞大,第三库极多,所以MFC和ATL也需要勾选安装。 打开控制面板,选中windo ...