1 import random 2 3 agent1="Mozilla/5.0 (Linux; U; Android 8.1.0; zh-cn; BLA-AL00 Build/HUAWEIBLA-AL00) AppleWebKit/537.36 (KHTML, like Gecko) Version ...
分类:
其他好文 时间:
2020-02-08 23:18:34
阅读次数:
162
from bs4 import BeautifulSoupimport urllibimport urllib.requestimport re# import json headers={"User-Agent" : "Mozilla/5.0 (compatible; MSIE 9.0; Wind ...
分类:
编程语言 时间:
2020-02-08 00:40:43
阅读次数:
107
安装三大浏览器驱动driver 1.chromedriver 下载地址:https://code.google.com/p/chromedriver/downloads/list 2.Firefox的驱动geckodriver 下载地址:https://github.com/mozilla/geck ...
分类:
其他好文 时间:
2020-02-07 14:33:12
阅读次数:
62
时间:2020.2.6 今天把昨天做到一半的首都之窗百姓信件爬取完成了。 源码如下: 1 import requests 2 import io 3 from bs4 import BeautifulSoup 4 #信1705-1 赵路仓 5 kv = {'user-agent': 'Mozilla ...
分类:
编程语言 时间:
2020-02-07 01:24:07
阅读次数:
110
分享一些常见的User-Agent,从网上搜集来的,可能不怎么完整。 User-Agent (1)百度 Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html) Mozilla/5.0 (c ...
分类:
其他好文 时间:
2020-02-06 23:05:43
阅读次数:
102
import requests from lxml import etree ###网址 url="https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6" ###模拟浏览器 header={'User-Agent':'Mozilla ...
分类:
其他好文 时间:
2020-02-06 14:34:39
阅读次数:
73
import re import requests def parse_page(url): headers = { 'User-Agent': 'Mozilla / 5.0(Windows NT 10.0;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) ...
分类:
其他好文 时间:
2020-02-03 19:21:36
阅读次数:
64
作用域和闭包 作用域 JS中有两种作用域:全局作用域|局部作用域 栗子1 console.log(name); //undefined var name = '波妞'; var like = '宗介' console.log(name); //波妞 function fun(){ console.l ...
分类:
其他好文 时间:
2020-02-02 20:07:25
阅读次数:
96
HTTP是基于TCP协议的,需要三次握手,HTTP1.1协议,是keep-alive的。 第一部分,请求行 首先要明白GET, POST, PUT,DELETE这个很简单不重复,举几个例子: 在云计算中,如果我们的服务器端要提供一个基于 HTTP 协议的 API,获取所有云主机的列表, 这就会使用 ...
分类:
Web程序 时间:
2020-01-31 22:44:21
阅读次数:
113
参考:https://www.cnblogs.com/wuhaozhou/p/5800788.html javascript 学习:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Inheritance_and_the_prototyp ...
分类:
移动开发 时间:
2020-01-31 18:58:39
阅读次数:
100