码迷,mamicode.com
首页 > Web开发 > 详细

淘宝爬取图片和url

时间:2019-11-21 12:13:48      阅读:133      评论:0      收藏:0      [点我收藏+]

标签:不能   dev   enc   代码   方法   表达式   开发者   blog   扫码   

刚开始爬取了 百度图片和搜狗图片

但是图片不是很多,随后继续爬取淘宝图片,但是淘宝反爬比较厉害 之前的方法不能用

记录可行的 淘宝爬取 利用selenium爬取

https://cloud.tencent.com/developer/article/1151774

github

https://github.com/Python3WebSpider/TaobaoProduct

(需要修改代码,自己扫码登陆 继续爬)看issues

注意:爬多了 肯能出现滑块验证 使用开发者模式避免

利用pyquery进行搜索   就不需要正则表达式了

使用方法

https://www.cnblogs.com/gj5379/p/8514535.html

淘宝爬取图片和url

标签:不能   dev   enc   代码   方法   表达式   开发者   blog   扫码   

原文地址:https://www.cnblogs.com/bob-jianfeng/p/11904468.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!