博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
利用selenium爬取重定向内容
阅读量:5805 次
发布时间:2019-06-18

本文共 1078 字,大约阅读时间需要 3 分钟。

# -*- coding: UTF-8 -*-from selenium import webdriverfrom bs4 import BeautifulSoupimport time#这里我已经下载了geckodriver放在火狐文件夹,如果放入所需要执行的Python脚本的所在处就不用写这个了myDriver = webdriver.Firefox(executable_path ='F:\setup place\Firefox\geckodriver.exe')myDriver.get('http://www.heibanke.com/accounts/login')time.sleep(3)myDriver.find_element_by_id('id_username').send_keys('test')myDriver.find_element_by_id('id_password').send_keys('test123')myDriver.find_element_by_id('id_submit').click()time.sleep(1)number = 0 #被重定向后我们就重新写入要进入的URLwhile number<31:        myDriver.get('http://www.heibanke.com/lesson/crawler_ex02/')    time.sleep(2)    myDriver.find_element_by_name('username').send_keys('test')    myDriver.find_element_by_name('password').send_keys(str(number))    myDriver.find_element_by_id('id_submit').click()    time.sleep(2)    html = myDriver.page_source    bs_obj = BeautifulSoup(html,"html.parser")    print bs_obj.h3    if bs_obj.text.find(u'密码错误')>0:        number = number + 1        print number    else:        print bs_obj.text        breaktime.sleep(2)myDriver.close()复制代码

转载地址:http://dwgfx.baihongyu.com/

你可能感兴趣的文章
[转载]设置Ubuntu自动连接无线,无须再输入密钥环和无线密码
查看>>
九叔Xen App测试报告
查看>>
Apache配置
查看>>
Ext gridPanel 单元格数据的渲染
查看>>
Android SDK 的下载代理
查看>>
Method Swizzling对Method的要求
查看>>
佛祖保佑,永不宕机
查看>>
四、配置开机自动启动Nginx + PHP【LNMP安装 】
查看>>
LNMP一键安装
查看>>
SQL Server数据库概述
查看>>
Linux 目录结构及内容详解
查看>>
startx命令--Linux命令应用大词典729个命令解读
查看>>
华为3026c交换机配置tftp备份命令
查看>>
Oracle命令导入dmp文件
查看>>
OCP读书笔记(24) - 题库(ExamD)
查看>>
Http、TCP/IP协议与Socket之间的区别(转载)
查看>>
解决Unable to load R3 module ...VBoxDD.dll (VBoxDD):GetLastError=1790
查看>>
.net excel利用NPOI导入oracle
查看>>
vrpie在Visio Studio 中无法调试的问题
查看>>
第六课:数据库的基本工具
查看>>