搜索关键字：requests，搜索到4533个结果！码迷,mamicode.com！

python爬虫使用lxml解析数据编码乱码问题

问题状况： response = requests.get(url=url, headers=headers).text html = etree.HTML(response) name = html.xpath("/html/body/div[2]/ul/li[1]/a/p/text()")[0] ...

分类：编程语言时间：2020-07-28 14:08:09 阅读次数：87

requests模块使用

#!/usr/bin/python import requests if __name__ == "__main__": url = 'https://sogou.com' response = requests.get(url=url) page_text = response.text prin ...

分类：其他好文时间：2020-07-28 10:18:26 阅读次数：68

requests实战之网页采集器

import requests #UA伪装： #UA:User-Agent(请求载体的身份标识)检测: #门户网站的服务器会检测对应请求的身份载体标识，如果检测到请求的载体身份标识为某一款浏览器 #说明该请求是一个正常的请求，但是，如果检测到请求的载体身份标识不是某一款浏览器的，则表示该请求不是正常 ...

分类：Web程序时间：2020-07-28 10:17:22 阅读次数：79

requests实战之豆瓣电影爬取

import requests import json if __name__ == "__main__": url = 'https://movie.douban.com/j/chart/top_list' param = { 'type':'24', 'interval_id':'100:90' ...

分类：其他好文时间：2020-07-28 10:16:51 阅读次数：79

xpath案例-58二手房

#!/usr/bin/python import requests from lxml import etree #需求：爬取58二手房中的房源信息 if __name__ == "__main__": headers = { 'User-Agent':'Mozilla/5.0 (Windows N ...

分类：其他好文时间：2020-07-28 10:12:45 阅读次数：79

xpath案例-全国城市名爬取

#!/usr/bin/python import requests from lxml import etree #项目需求：解析出所有的城市名称https://www.aqistudy.cn/historydata/ if __name__ == "__main__": # headers = { ...

分类：其他好文时间：2020-07-28 10:10:33 阅读次数：61

古诗文网验证码识别

#!/usr/bin/python import requests from lxml import etree from codeClass import YDMHTTP #封装识别验证码图片的函数 def getCodeText(imgPath,codeType): pass #将验证码下载到本 ...

分类：其他好文时间：2020-07-28 10:10:21 阅读次数：95

模拟登录人人网

#编码流程： #1.验证码的识别，获取验证码图片的文字数据 #2.对post请求进行发送（处理请求函数） #3.对响应函数进行持久化存储 import requests from lxml import etree from CodeClass import YDMHttp #1.对验证码图片进行捕 ...

分类：其他好文时间：2020-07-28 10:08:07 阅读次数：164

获取人人网当前用户的个人详情页数据

#编码流程： #1.验证码的识别，获取验证码图片的文字数据 #2.对post请求进行发送（处理请求函数） #3.对响应函数进行持久化存储 import requests from lxml import etree from CodeClass import YDMHttp #创建一个session ...

分类：其他好文时间：2020-07-28 10:07:17 阅读次数：75

线程池在爬虫案例中的应用

import requests from lxml import etree import re from multiprocessing.dummy import Pool #需求：爬取梨视频的视频数据 headers = { 'User-Agent':'Mozilla/5.0 (Windows ...

分类：编程语言时间：2020-07-28 10:02:06 阅读次数：77

共4533条上一页 1 ... 15 16 17 18 19 ... 454 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)