码迷,mamicode.com
首页 > 编程语言 > 详细

python爬虫所遇问题列举

时间:2019-11-28 23:03:57      阅读:84      评论:0      收藏:0      [点我收藏+]

标签:add   默认端口   获得   协议   osi   nic   error   问题   inf   

1、通过python socket库来构造请求报文,向服务器发送图片请求时

  (1)图片在浏览器请求头中的remote address信息跟通过python socket输出远程连接地址和端口号不一致

    Remote Address:183.61.138.62:443

    raddr=(‘183.61.138.62‘, 80)

    80表示http协议默认端口,443表示https协议默认端口

    技术图片

 

 

技术图片

 

   2、在浏览器中输入图片地址,然后调试Network窗口发现,响应体不是直接返回image文件,而是文档文件

技术图片

 

   3、及时正确返回包含图片二进制码的响应报文时,为了获得Content-Length(图片的大小),必须将响应行和响应头解码,但是解码在对图片二进制码进行解码时,

会报错:

    UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xff in position 516: invalid start byte

    如何解决?

python爬虫所遇问题列举

标签:add   默认端口   获得   协议   osi   nic   error   问题   inf   

原文地址:https://www.cnblogs.com/loveprogramme/p/11944474.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!