模拟浏览器登录并提交数据

网络爬虫学习中,简单的静态页面数据,难以满足我们的一颗“好学”之心,且现在我们“好奇”的数据往往藏得很深,要么需要登录,要么为动态加载……今天,就来分享一下模拟浏览器对QQ邮箱(我们只是学习、分享、交流)的登录操作!

1、前期准备

“搞事情”之前,我们需要先准备两个工具,分别是需要模拟浏览器登录的模块selenium和对应的驱动插件chromedriver.exe

这里,我们用了一个模拟浏览器登录的模块selenium

安装selenium模块:

pip install selenium

下载驱动插件chromedriver.exe,插件版本需与浏览器版本相同或相近,此处用的是谷歌浏览器,可在浏览器网页中输入地址chrome://version/,查看浏览器版本:

登录采集——模拟浏览器登录QQ邮箱

接着进入驱动下载页面***/index.html,下载相同或相近版本的chromedriver.exe:

登录采集——模拟浏览器登录QQ邮箱

解压后将放到指定位置(随便放哪里,只要你知道在哪里),此处放于
“F:\PycharmProjects\tensorflow”文件路径下。

2、页面简析(如果着急看效果,跳过此步)

打开QQ邮箱官网(***/),得到如下界面,这里有几种登录方式,其中微信登录只能通过扫码实现,我们既然想用Python去自动化批量发送邮件,微信扫码登录自然不现实(若有高手可攻克此步,还望分享)。

QQ登录方式有两种,要么点击已登录的QQ头像(可通过COOKIE实现),要么直接密码登录,今天我们介绍后者。

登录采集——模拟浏览器登录QQ邮箱

点击账号密码登录,发现网址和之前没有变化,

登录采集——模拟浏览器登录QQ邮箱

抓包后看到,返回的Referer信息一长串,这难道就是登录页面的实际网址?

登录采集——模拟浏览器登录QQ邮箱

复制Referer里的连接信息到浏览器看看,果然!好,那我们就不去请求邮箱官网了,直接对这个连接下手。

登录采集——模拟浏览器登录QQ邮箱

但是这个连接信息还是有扫码登录或是之前的COOKIE信息,我们想要的是账号密码登录,点击密码登录后,进入一个很单纯的表单页面。不错,我们找的就是它,检查密码登录的元素,发现它在类名为switch_btn的a标签下。

登录采集——模拟浏览器登录QQ邮箱登录采集——模拟浏览器登录QQ邮箱

3、完整代码

好了,QQ邮箱的密码登录方式大概就是这个意思,接下来我们直接上代码:

from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsimport time# 初始化以及配置浏览器chrome_optiOns= Options()# 1、添加user-agentchrome_options.add_argument('User-Agent="你自己的user-agent')# 2、禁止图片加载 数字1:可以加载图片 数字2:禁止加载图片No_Image_loading = {"profile.managed_default_content_settings.images": 1}chrome_options.add_experimental_option("prefs", No_Image_loading)path = 'F:\PycharmProjects\tensorflow\chromedriver.exe' # 更改为你自己的插件路径driver = webdriver.Chrome(executable_path=path, chrome_optiOns=chrome_options)# 登录页面driver.get('***/cgi-bin/xlogin?appid=522005705&daid=4&s_url=***/cgi-bin/login?vt=passport%26vm=wpt%26ft=loginpage%26target=&style=25&low_login=1&proxy_url=***/proxy.html&need_qr=0&hide_border=1&border_radius=0&self_regurl=***/chs/index.html?type=1&app_id=11005?t=regist&pt_feedback_link=***/discuss/350_1.shtml&css=***/zh_CN/htmledition/style/ptlogin_input_for_xmail440503.css')time.sleep(2)# 切换进入“账号密码登录”driver.find_element_by_id('switcher_plogin').click() # 点击​# 输入账号信息driver.find_element_by_id('u').send_keys('你自己的QQ')

QQ邮箱的登录你掌握了,那其他网页的登录呢?赶快去试试吧!

——————————————————————————

登录采集——模拟浏览器登录QQ邮箱

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:dandanxi6@qq.com

(0)
上一篇 2023年 6月 2日 上午10:18
下一篇 2023年 6月 2日 上午10:28

相关推荐

  • 模拟生存游戏中文版

    大多数接受过初中语文教育的中国人,很难不对“桃花源”这个名字产生条件反射的向往。这很可能是大家在世界观尚未成型之时,被“灌输”的第一个乌托邦世界,也因此为每个人心里造出了一片自由美…

    2023年 8月 28日
  • 支付宝的校园日记和白领日记在哪

    日前,支付宝9.9.7版本上线了圈子功能,并且开放了校园日记和白领日记两个圈子。圈子中发布信息的都是校园和社会中的女性朋友,针对男性朋友只有芝麻评分达到750以上的才可以评论,否则…

    2023年 2月 26日
  • 支付宝花呗还款日开启预约调整,支付宝花呗还款日怎么调整

    新华社杭州7月30日电(记者张璇)记者30日从支付宝获悉,支付宝对外宣布开启花呗出账日与对应还款日调整预约。根据规定,满足一定条件的花呗用户,可选择每月15日或20日进行还款,一年…

    互联网 2023年 3月 15日
  • qq号被盯上怎么办,qq号被人知道会有什么影响啊

    用户在日常使用中应有良好的账号保密习惯 最近,QQ号被盗事件频发。用户黄先生的QQ号十多天前突然间被盗,盗号者利用黄先生的QQ号码向很多联系人发送了不良信息;随后,黄先生的两位同事…

    2022年 12月 29日
  • 百度网盘搜索神器安卓

    平时也推荐过种子搜索、电影搜索神器,今天说说百度网盘搜索神器,这个安卓app融合了12家网盘搜索网站,所以资源还是比较丰富的。 1、简介 网盘搜索神器,千万级别数据,主要是爬取各大…

    2023年 7月 12日
  • 按键精灵基础命令教程,按键精灵教程基础知识

    金猪脚本(原飞猪脚本)以按键精灵教学为主,涉及UiBot,Python,Lua等脚本编程语言,教学包括全自动办公脚本,游戏辅助脚本,引流脚本,网页脚本,安卓脚本,IOS脚本,注册脚…

    2023年 2月 5日
  • 心愿点买牛魔皮肤

    大家好,这里是阿呆的峡谷日记,将会给你带来王者荣耀最新的爆料内容。 每年12月份到来之后,除了皮肤碎片商店是很多玩家比较关注的之外,其实还有一些社区活动也是很多玩家比较关心的,比如…

    2023年 1月 6日
  • 如何用ps渐变过渡效果

    欢迎观看Photoshop 教程,小编带大家了解如何利用渐变工具实现平滑过渡。 在 Photoshop 中合成图片时,要获得无缝渐变的混合效果,最好的方法就是图层蒙版和渐变工具搭配…

    2023年 4月 29日
  • 抽完的烟盒不要丢分享一个省钱小妙招

    抽完的烟盒别再扔了,留在家里特别“值钱”,快回家把烟盒找出来 近年来,随着环保意识的不断提升,人们对于资源的重视程度也越来越高。在这个背景下,有一件看似微小的事情却逐渐引起了人们的…

    2023年 8月 30日
  • 可以免费换底证件照的软件有哪些

    证件照现在大家基本上都会保存一张电子版,不过不同的情况或者考试啥的要求的底色都不一样,所以咱们经常就需要给证件照更换底色,但又不是人人都会,那怎么简单一键更换证件照底色呢?继续往下…

    2023年 2月 24日