當前位置 主頁 > 網站技術 > 代碼類 > 最大化 縮小

    Scrapy框架實現的登錄網站操作示例

    欄目:代碼類 時間:2020-02-06 12:10

    本文實例講述了Scrapy框架實現的登錄網站操作。分享給大家供大家參考,具體如下:

    一、使用cookies登錄網站

    import scrapy
    class LoginSpider(scrapy.Spider):
      name = 'login'
      allowed_domains = ['xxx.com']
      start_urls = ['https://www.xxx.com/xx/']
      cookies = ""
      def start_requests(self):
        for url in self.start_urls:
          yield scrapy.Request(url, cookies=self.cookies, callback=self.parse)
      def parse(self, response):
        with open("01login.html", "wb") as f:
          f.write(response.body)
    
    

    二、發送post請求登錄, 要手動解析網頁獲取登錄參數

    import scrapy
    class LoginSpider(scrapy.Spider):
      name='login_code'
      allowed_domains = ['xxx.com']
      #1. 登錄頁面
      start_urls = ['https://www.xxx.com/login/']
      def parse(self, response):
        #2. 代碼登錄
        login_url='https://www.xxx.com/login'
        formdata={
          "username":"xxx",
          "pwd":"xxx",
          "formhash":response.xpath("http://input[@id='formhash']/@value").extract_first(),
          "backurl":response.xpath("http://input[@id='backurl']/@value").extract_first()
        }
        #3. 發送登錄請求post
        yield scrapy.FormRequest(login_url, formdata=formdata, callback=self.parse_login)
      def parse_login(self, response):
        #4.訪問目標頁面
        member_url="https://www.xxx.com/member"
        yield scrapy.Request(member_url, callback=self.parse_member)
      def parse_member(self, response):
        with open("02login.html",'wb') as f:
          f.write(response.body)
    
    

    三、發送post請求登錄, 自動解析網頁獲取登錄參數

    import scrapy
    class LoginSpider(scrapy.Spider):
      name='login_code2'
      allowed_domains = ['xxx.com']
      #1. 登錄頁面
      start_urls = ['https://www.xxx.com/login/']
      def parse(self, response):
        #2. 代碼登錄
        login_url='https://www.xxx.com/login'
        formdata={
          "username":"xxx",
          "pwd":"xxx"
        }
        #3. 發送登錄請求post
        yield scrapy.FormRequest.from_response(
          response,
          formxpath="http://*[@id='login_pc']",
          formdata=formdata,
          method="POST", #覆蓋之前的get請求
          callback=self.parse_login
        )
      def parse_login(self, response):
        #4.訪問目標頁面
        member_url="https://www.xxx.com/member"
        yield scrapy.Request(member_url, callback=self.parse_member)
      def parse_member(self, response):
        with open("03login.html",'wb') as f:
          f.write(response.body)
    
    

    更多相關內容可查看本站專題:《Python Socket編程技巧總結》、《Python正則表達式用法總結》、《Python數據結構與算法教程》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總》

    希望本文所述對大家基于Scrapy框架的Python程序設計有所幫助。

    下一篇:沒有了
777亚洲人成视频免费视频