模拟浏览器登录并提交数据

网络爬虫学习中,简单的静态页面数据,难以满足我们的一颗“好学”之心,且现在我们“好奇”的数据往往藏得很深,要么需要登录,要么为动态加载……今天,就来分享一下模拟浏览器对QQ邮箱(我们只是学习、分享、交流)的登录操作!

1、前期准备

“搞事情”之前,我们需要先准备两个工具,分别是需要模拟浏览器登录的模块selenium和对应的驱动插件chromedriver.exe

这里,我们用了一个模拟浏览器登录的模块selenium

安装selenium模块:

pip install selenium

下载驱动插件chromedriver.exe,插件版本需与浏览器版本相同或相近,此处用的是谷歌浏览器,可在浏览器网页中输入地址chrome://version/,查看浏览器版本:

登录采集——模拟浏览器登录QQ邮箱

接着进入驱动下载页面***/index.html,下载相同或相近版本的chromedriver.exe:

登录采集——模拟浏览器登录QQ邮箱

解压后将放到指定位置(随便放哪里,只要你知道在哪里),此处放于
“F:\PycharmProjects\tensorflow”文件路径下。

2、页面简析(如果着急看效果,跳过此步)

打开QQ邮箱官网(***/),得到如下界面,这里有几种登录方式,其中微信登录只能通过扫码实现,我们既然想用Python去自动化批量发送邮件,微信扫码登录自然不现实(若有高手可攻克此步,还望分享)。

QQ登录方式有两种,要么点击已登录的QQ头像(可通过COOKIE实现),要么直接密码登录,今天我们介绍后者。

登录采集——模拟浏览器登录QQ邮箱

点击账号密码登录,发现网址和之前没有变化,

登录采集——模拟浏览器登录QQ邮箱

抓包后看到,返回的Referer信息一长串,这难道就是登录页面的实际网址?

登录采集——模拟浏览器登录QQ邮箱

复制Referer里的连接信息到浏览器看看,果然!好,那我们就不去请求邮箱官网了,直接对这个连接下手。

登录采集——模拟浏览器登录QQ邮箱

但是这个连接信息还是有扫码登录或是之前的COOKIE信息,我们想要的是账号密码登录,点击密码登录后,进入一个很单纯的表单页面。不错,我们找的就是它,检查密码登录的元素,发现它在类名为switch_btn的a标签下。

登录采集——模拟浏览器登录QQ邮箱登录采集——模拟浏览器登录QQ邮箱

3、完整代码

好了,QQ邮箱的密码登录方式大概就是这个意思,接下来我们直接上代码:

from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsimport time# 初始化以及配置浏览器chrome_optiOns= Options()# 1、添加user-agentchrome_options.add_argument('User-Agent="你自己的user-agent')# 2、禁止图片加载 数字1:可以加载图片 数字2:禁止加载图片No_Image_loading = {"profile.managed_default_content_settings.images": 1}chrome_options.add_experimental_option("prefs", No_Image_loading)path = 'F:\PycharmProjects\tensorflow\chromedriver.exe' # 更改为你自己的插件路径driver = webdriver.Chrome(executable_path=path, chrome_optiOns=chrome_options)# 登录页面driver.get('***/cgi-bin/xlogin?appid=522005705&daid=4&s_url=***/cgi-bin/login?vt=passport%26vm=wpt%26ft=loginpage%26target=&style=25&low_login=1&proxy_url=***/proxy.html&need_qr=0&hide_border=1&border_radius=0&self_regurl=***/chs/index.html?type=1&app_id=11005?t=regist&pt_feedback_link=***/discuss/350_1.shtml&css=***/zh_CN/htmledition/style/ptlogin_input_for_xmail440503.css')time.sleep(2)# 切换进入“账号密码登录”driver.find_element_by_id('switcher_plogin').click() # 点击​# 输入账号信息driver.find_element_by_id('u').send_keys('你自己的QQ')

QQ邮箱的登录你掌握了,那其他网页的登录呢?赶快去试试吧!

——————————————————————————

登录采集——模拟浏览器登录QQ邮箱

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:dandanxi6@qq.com

(0)
上一篇 2023年 6月 2日 上午10:18
下一篇 2023年 6月 2日 上午10:28

相关推荐

  • 页码首页不显示从第二页开始,word插入页码第一页不显示页码

    一份长文档中,通常有封面、目录、正文内容等等。而我们在设置页码时,如果不作其它设置,页码都是从封面开始。为了不让封面也显示页码,而第二页设置页码从1开始,这个该怎么设置呢? 其实方…

    2023年 2月 25日
  • 仙剑幻璃镜官网礼包,怎样注册仙剑幻璃镜

    《仙剑奇侠传幻璃镜》手游官方微博正式宣布,大宇集团首款“自主研发”的仙剑系列手游《仙剑奇侠传幻璃镜》将于5月5日开启公测,这与制作人张孝全曾经预计于2016年第三季度发布的计划相比…

    2022年 12月 20日
  • qq申诉好友辅助没收到邮件怎么办

    在忘记QQ密码想要申诉的过程中通常有好友申诉这一步,不过在申诉的过程中很多小伙伴们反映称在好友在辅助验证的时候收不到验证码。那么这是怎么回事呢?怎么成功申诉回自己的QQ呢?下面一起…

    2023年 8月 28日
  • 支付宝明细最多查几年?你清楚吗?怎么查看

    支付宝明细查看是没有时间限制的,从开户到现在的全部账单记录都是可以查看。在支付宝的我的页面,打开账单,选择要查询的年月,就可以查询想要查看的账单记录。 当前的操作环境为Androi…

    2023年 1月 3日
  • 口袋妖怪漆黑的魅影5.0全神兽攻略

    在《漆黑的魅影5.0EX:无尽混沌》版本中,玩家们可以捕捉各个版本的许多神兽,比如创世神阿尔宙斯等这些超级厉害的。本文笔者整理了口袋妖怪漆黑的魅影5.0无尽混沌三个周目的全神兽捕捉…

    2023年 6月 15日
  • 怎么把照片做成小于20k

    教程来了,将现有照片做成小于20K的一寸照片 目前有很多人会遇到这种情况: 社保要求一寸照片小于20k 公务员考试要求照片小于20k 各种证件要求照片小于20k 那么怎么才能让保存…

    2022年 12月 17日
  • 不小心在网站上输入了地址和手机号

    ———————————– 小雷想换新…

    2023年 9月 14日
  • 中国银行银税贷(中国银行银税贷江苏)

    基本信息 额度:最高300万。 利率:最高年化率4.35%。 期限:最长1年期。 户籍要求:大陆户籍 借款人年龄:20-65周岁; 还款方式: 随借随还、先息后本; 申请时效:线上…

    2023年 1月 29日
  • 阻止电脑广告弹窗弹框,阻止广告弹窗彻底关闭

    方案一、 1、360浏览器,设置,实验室里一些显示去掉勾 2、打开360安全卫士,点击功能大全,搜索“弹框过滤”,启动过滤 3、打开360安全卫士,点击卫士右上角,菜单,设置,功能…

    互联网 2023年 4月 9日
  • 汉服商图拍摄要求

    开设线下汉服实体店要面对诸多问题,例如引流与获客,一个小技巧即可免费增加门店的曝光。这就是地图标注。 什么是地图标注? 地图标注是将商家或企业的线下地址信息标注到互联网电子地图、手…

    2023年 4月 16日