码迷,mamicode.com
首页 > 其他好文 > 详细

scrapy加载cookies登陆

时间:2016-12-30 20:32:56      阅读:128      评论:0      收藏:0      [点我收藏+]

标签:color   spi   name   callback   cto   cal   scrapy   sspi   items   

import scrapy
from xxxx.items import XXXXItem
from scrapy.http.request import Request

class ZndsSpider(scrapy.spiders.Spider):
    name = "xxxx"
    allowed_domains = ["xxxx.com"]
    start_urls=[]

    cookie={xxx:xxx,xxx:xxx}

    def start_requests(self):
        for url in self.start_urls:
       #加载cookies,指定回调函数,返回response
yield Request(url,cookies=self.cookie,callback=self.parse_url)

  def parse_url(self,response): body = scrapy.Selector(response) for sel in body.xpath(xxx):        item=XXXXItem() item[XX]=sel.xpath(td[1]/text()).extract() item[XX]=sel.xpath(td[3]/span/a/u/text()).extract() item[XX]=sel.xpath(td[5]/a/text()).extract() yield item

 

scrapy加载cookies登陆

标签:color   spi   name   callback   cto   cal   scrapy   sspi   items   

原文地址:http://www.cnblogs.com/fj0716/p/6237932.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!