位置: IT常识 - 正文

Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程)

编辑:rootadmin
Python爬虫之Web自动化测试工具Selenium&&Chrome handless

推荐整理分享Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:web爬虫视频教程,如何用python爬虫网站文档,web爬虫视频教程,python爬虫网页源代码,python 爬虫 https,python web爬虫,python webkit 爬虫,python web爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

​ ​

@作者 : SYFStrive

@博客首页 : HomePage

🥧 上一篇续文传送门

📌:个人社区(欢迎大佬们加入) 👉:社区链接🔗

📌:如果觉得文章对你有帮助可以点点关注 👉:专栏连接🔗

💃:程序员每天坚持锻炼💪

🔗:阅读文章

📋目录Selenium简介为什么使用selenium❓如何安装selenium❓selenium的使用步骤❓selenium获取🔍源码练习selenium获取🛒源码练习selenium之元素定位❓方法访问的相关使用交互的相关使用小总结✍Chrome handless简介系统要求Chrome handless相关使用Chrome handless简单封装最后

Selenium简介Selenium是一个用于Web应用程序测试的工具。Selenium 测试直接运行在浏览器中,就像真正的用户在操作一样。(真正的用户还不给数据那么网站存在的意义是什么?)支持通过各种driver(FirfoxDriver,IternetExplorerDriver,OperaDriver,ChromeDriver)驱动 真实浏览器完成测试。selenium也是支持无界面浏览器操作的。缺点:有点慢为什么使用selenium❓

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

如何安装selenium❓

步骤:

下载对应浏览器版本驱动查看自己浏览器的版本 (如以🛠为例:谷歌浏览器右上角‐‐>帮助‐‐>关于)以🛠浏览器为例:驱动下载:点击跳转把下载好的放驱动放在项目的目录下安装语法:pip install selenium其他驱动驱动名链接GGhttps://chromedriver.chromium.org/downloadsEehttps://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/🦊https://github.com/mozilla/geckodriver/releases🍏https://webkit.org/blog/6900/webdriver-support-in-safari-10/selenium的使用步骤❓因为随着 selenium版本的升级一些语法也随之发生改变请参考 👇 文档(不懂的可以私聊我互相交流)官方文档:点击跳转至官方selenium文档:直接跳至selenium文档导入:from selenium import webdriver创建谷歌浏览器操作对象:path = 谷歌浏览器驱动文件路径bor= webdriver.Chrome(path)访问网址url = 要访问的网址bor.get(url) = 自动打开浏览器获取内容content = bor.page_source = 获取爬取的源码selenium获取🔍源码练习

📰代码演示:

如果出现下面的报错不要慌:问题出现在浏览器驱动版本不一致 或者 高于当前浏览器版本(下载对应的驱动即可)

如下图(成功🆗):

selenium获取🛒源码练习

📰代码演示:

如下图(成功🆗):

selenium之元素定位❓

说明:元素定位:自动化要做的就是模拟鼠标和键盘来操作来操作这些元素,点击、输入等等。操作这些元素前首先要找到它们,WebDriver提供很多定位元素的方法(比如:自动抢票等😀)

方法

🔋:表示常用 推荐:博客园文章关于元素定位的相关使用:👉点击跳转🔗 常用的六种方法方法:(对应关系 (这是旧版的(报错但不影响使用)) =>(新版):使用新版需要导入:from selenium.webdriver.common.by import By)

方法使用举例find_element_by_id=>find_element(By.ID, “ID”)eg:button = bor.find_element_by_id(‘id值’) 🔋find_elements_by_name=>find_element(By.NAME, “NAME”)eg:name = bor.find_element_by_name(‘input里面的name’)find_element_by_xpath=>find_element(By.XPATH, “XPATH”)eg:xpath1 = bor.find_element_by_xpath(‘//input[@id=“id值”]’) 返回值 🔋find_elements_by_tag_name=>find_element(By.NAME, “NAME”)eg:names = bor.find_elements_by_tag_name(‘标签名’)find_elements_by_css_selector=>find_element(By.CSS_SELECTOR, ‘#J_footer’)eg:my_input = bor.find_elements_by_css_selector(‘这里简单记使用的是Bs4语法’)[0]🔋find_elements_by_link_text=>find_element(By.LINK_TEXT, ‘秒杀’)eg:bor.find_element_by_link_text(“页面中的链接文本”)find_element(By.CLASS_NAME, “CLASS_NAME”)eg:name = bor.find_elements(By.CLASS_NAME, “秒杀”)方法对比find_element VS find_elements 一个返回的是值,一个是列表Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程)

📰代码演示:

如下图(成功🆗):

访问的相关使用

说明:定位到元数后获取该元素的文本、类,Id名等等……

访问元素信息:

获取元素属性 .get_attribute(‘class’)获取元素文本 .text获取标签名 .tag_name

📰代码演示:

如下图(成功🆗)

交互的相关使用

说明:如自动打开🔍然后输入大司马然后点击他的简介进行查看(自动执行(刷起来))

交互:

点击:click()输入:send_keys()后退操作:bor.back()前进操作:bor.forword()模拟JS滚动:js=‘document.documentElement.scrollTop=100000’bor.execute_script(js) 执行js代码退出:bor.quit()

📰代码演示:

如下图(全自动的(gif太大传不了,可以自己把time设置大一点感受)🆗):

链接👉: 点击查看

小总结✍

**使用步骤:**使用selenium获取源码 👉 定位元素 👉 访问元素 👉 模拟交互

Chrome handless简介Chrome handless 跟 Selenium使用方法差不多,使用起来速度比Selenium更快Chrome-headless 模式, Google 针对 Chrome 浏览器 59版 新增加的一种模式,可以让你不打开UI界面的情况下使用 Chrome 浏览器,所以运行效果与 Chrome 保持完美一致。优点:快缺点:无界面系统要求系统要求:ChromeUnix\Linux 系统需要 chrome >= 59Windows 系统需要 chrome >= 60Python3.6Selenium==3.4.*ChromeDriver==2.31Chrome handless相关使用配置固定模板:

📰代码演示:

如下图(成功🆗):

Chrome handless简单封装

最后

本文章到这里就结束了,觉得不错的请给我专栏点点订阅,你的支持是我们更新的动力,感谢大家的支持,希望这篇文章能帮到大家

点击跳转到我的Python专栏

下篇文章再见ヾ( ̄▽ ̄)ByeBye

本文链接地址:https://www.jiuchutong.com/zhishi/300055.html 转载请保留说明!

上一篇:钉钉消息防撤回功能研究与实现-可查看历史消息[文件/图文/管理员/链接 撤回拦截](钉钉防止撤回)

下一篇:使用YOLOv5模型进行目标检测!AI大佬手撕源码带你学(yolov3模型大小是多少)

  • 详解利用微博推广和赚钱的10种方法(微博推广怎么推)

    详解利用微博推广和赚钱的10种方法(微博推广怎么推)

  • 学生用的笔记本电脑怎么选(学生用的笔记本)(学生用的笔记本本子一般多大尺寸)

    学生用的笔记本电脑怎么选(学生用的笔记本)(学生用的笔记本本子一般多大尺寸)

  • 云上贵州怎么取消自动续费(云上贵州扣款怎样退)

    云上贵州怎么取消自动续费(云上贵州扣款怎样退)

  • 美团自行车怎么锁车(美团自行车怎么使用)

    美团自行车怎么锁车(美团自行车怎么使用)

  • 华为nova7pro的屏幕是曲面屏的吗(华为nova7pro的屏幕刷新率)

    华为nova7pro的屏幕是曲面屏的吗(华为nova7pro的屏幕刷新率)

  • 微信发word格式乱了(微信发word文档)

    微信发word格式乱了(微信发word文档)

  • 快手如何横屏观看别人的视频(快手横屏观看别人的作品)

    快手如何横屏观看别人的视频(快手横屏观看别人的作品)

  • backspace键是什么意思(backspace键是什么意思失灵)

    backspace键是什么意思(backspace键是什么意思失灵)

  • wps企业版有什么区别(wps2021企业版)

    wps企业版有什么区别(wps2021企业版)

  • 8p建议更新13.3.1系统吗(8p建议更新ios16.0.2)

    8p建议更新13.3.1系统吗(8p建议更新ios16.0.2)

  • 抖音视频怎么用自己的音乐(抖音视频怎么用自己的声音配音的)

    抖音视频怎么用自己的音乐(抖音视频怎么用自己的声音配音的)

  • 华为验证码不显示在屏幕上怎么办(华为手机验证码显示不全如何设置)

    华为验证码不显示在屏幕上怎么办(华为手机验证码显示不全如何设置)

  • 为什么面部解锁突然不能用了(为什么面部解锁录不进去)

    为什么面部解锁突然不能用了(为什么面部解锁录不进去)

  • 光猫有无线功能吗(光猫有无线功能还用装路由器吗)

    光猫有无线功能吗(光猫有无线功能还用装路由器吗)

  • 1978机器什么意思(什么叫1978机器)

    1978机器什么意思(什么叫1978机器)

  • ip68级防水有多强(ip68级防水是多少米)

    ip68级防水有多强(ip68级防水是多少米)

  • 苹果xsmax原彩显示是啥(苹果xsmax原彩显示在哪里)

    苹果xsmax原彩显示是啥(苹果xsmax原彩显示在哪里)

  • ipad5代是什么型号(ipad 5代是什么)

    ipad5代是什么型号(ipad 5代是什么)

  • vivo怎样设置软件密码(vivo怎样设置软件自动更新)

    vivo怎样设置软件密码(vivo怎样设置软件自动更新)

  • 华为智慧识屏怎么关(华为智慧识屏怎么识别音乐)

    华为智慧识屏怎么关(华为智慧识屏怎么识别音乐)

  • 微博我的缓存在哪里找(微博上我的缓存在哪)

    微博我的缓存在哪里找(微博上我的缓存在哪)

  • 微信正在输入为什么有的人没有(微信正在输入为什么关不掉)

    微信正在输入为什么有的人没有(微信正在输入为什么关不掉)

  • 拼多多无需物流点哪里(拼多多无需物流怎么发货)

    拼多多无需物流点哪里(拼多多无需物流怎么发货)

  • 苹果11抬头灯为什么不亮(苹果11抬头灯为什么会闪)

    苹果11抬头灯为什么不亮(苹果11抬头灯为什么会闪)

  • 小米手机镜像功能在哪(小米手机镜像功能怎么找不到了)

    小米手机镜像功能在哪(小米手机镜像功能怎么找不到了)

  • 饿了么可以开电子发票吗(饿了么开电瓶可以工资扣)

    饿了么可以开电子发票吗(饿了么开电瓶可以工资扣)

  • 趣头条人脸验证在哪里(头条人脸识别解决)

    趣头条人脸验证在哪里(头条人脸识别解决)

  • 抖音如何去掉水印(抖音如何去掉水印发朋友圈)

    抖音如何去掉水印(抖音如何去掉水印发朋友圈)

  • 手环的nfc功能怎么用(手环的nfc功能怎么开启)

    手环的nfc功能怎么用(手环的nfc功能怎么开启)

  • Kali Linux桌面外观样式怎么更换? kali外观优化技巧(kali linux安装kde桌面)

    Kali Linux桌面外观样式怎么更换? kali外观优化技巧(kali linux安装kde桌面)

  • 穿越火线下载安装成功后玩不了是怎么回事?(穿越火线下载安装)

    穿越火线下载安装成功后玩不了是怎么回事?(穿越火线下载安装)

  • 【工具】Vue中生成二维码组件——vue-qr(vue sse)

    【工具】Vue中生成二维码组件——vue-qr(vue sse)

  • 进项税额抵扣怎么做账
  • 子公司注销母公司投资损失企业所得税
  • 企业保持存货的必要性是什么
  • 企业商品收入确认的依据
  • 小公司可以不交五险一金吗
  • 劳保如何入账
  • 盘盈的存货一般作为什么处理
  • 往来核算会计的岗位职责和工作内容
  • 房产公司增值税和土地增值税
  • 单位食堂油烟管道清洗记录表
  • 风险溢价包括哪些违约风险溢价 流动性风险溢价
  • 国税变更办税人怎么变更
  • 个人开劳务发票要同时交个税吗?
  • 增资印花税增加哪个税目
  • 公司用上年多缴的社保
  • 有单位购买我公司开发的房产作为“投资性房地产”,该单位需要缴纳房产税吗?
  • 软件合同审核要点
  • 银行基本户年费
  • 收到工伤保险的发票
  • 其他应付款冲回计入哪个科目
  • 个税是负数直接工资加上吗
  • 微软输入法打不出汉字
  • thinkphp i方法
  • PHP:xml_set_object()的用法_XML解析器函数
  • mmc.exe是什么进程
  • linux1970
  • 苹果手机铃声删除在哪里
  • cefres.dll是什么
  • 克拉莫16首
  • 点云目标检测数据集
  • 不能错过的只有你下架了吗
  • frameworkscheduled
  • php中的九大缓存技术
  • php常用数组函数有哪些
  • vue清空input file的值
  • 开源ei
  • 承租方承担的税费是多少
  • 微信公众号的推送
  • 什么是公司帐户
  • 印花税缴纳方式不包括哪些
  • 金税盘 解锁
  • 电力安装有前途吗
  • 证券公司收益凭证管理办法
  • 测绘费 土地增值税
  • 开办费用的财务是如何处理的
  • 增值税专用发票查询系统官方网站
  • 应付账款抹零摘要怎么写
  • 已认证的增值税专用发票可以作废吗
  • 资金占用费如何计算企业所得税
  • 应交税费减免税额在借方还是贷方
  • 红字发票最多几个月
  • 实收资本的账务处理会影响什么
  • 进项税额转出可以在所得税前扣除吗
  • 制单的基本要求是什么
  • sql 随机
  • sqlserver2000数据库连接不上
  • won10怎么安装
  • 电脑如何进入bios选择u盘启动
  • windows 个性化设置包含哪些方面?
  • eve是什么文件
  • 图形化ssh
  • mxtask.exe - mxtask是什么进程文件 有什么用
  • windows8任务栏在下面怎么不显示
  • linux确认命令
  • kb4592449-windows安全每月质量汇总
  • win8系统开机怎么进入桌面
  • android游戏排行榜
  • node.js安装模式选择
  • node.js 作用
  • career和calling的区别
  • linux shell -s
  • u3d unity3d
  • jquery动态添加css样式
  • javascript代码用什么来标记
  • javascript教程完整版
  • mysql里多表查询语句怎么写
  • 无自然人登记信息是怎么回事
  • 农业银行联行号查询系统官网
  • 个人所得税全员申报什么时候开始的
  • 税务开通需要什么东西
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设