位置: IT常识 - 正文

Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程)

编辑:rootadmin
Python爬虫之Web自动化测试工具Selenium&&Chrome handless

推荐整理分享Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:web爬虫视频教程,如何用python爬虫网站文档,web爬虫视频教程,python爬虫网页源代码,python 爬虫 https,python web爬虫,python webkit 爬虫,python web爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

​ ​

@作者 : SYFStrive

@博客首页 : HomePage

🥧 上一篇续文传送门

📌:个人社区(欢迎大佬们加入) 👉:社区链接🔗

📌:如果觉得文章对你有帮助可以点点关注 👉:专栏连接🔗

💃:程序员每天坚持锻炼💪

🔗:阅读文章

📋目录Selenium简介为什么使用selenium❓如何安装selenium❓selenium的使用步骤❓selenium获取🔍源码练习selenium获取🛒源码练习selenium之元素定位❓方法访问的相关使用交互的相关使用小总结✍Chrome handless简介系统要求Chrome handless相关使用Chrome handless简单封装最后

Selenium简介Selenium是一个用于Web应用程序测试的工具。Selenium 测试直接运行在浏览器中,就像真正的用户在操作一样。(真正的用户还不给数据那么网站存在的意义是什么?)支持通过各种driver(FirfoxDriver,IternetExplorerDriver,OperaDriver,ChromeDriver)驱动 真实浏览器完成测试。selenium也是支持无界面浏览器操作的。缺点:有点慢为什么使用selenium❓

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

如何安装selenium❓

步骤:

下载对应浏览器版本驱动查看自己浏览器的版本 (如以🛠为例:谷歌浏览器右上角‐‐>帮助‐‐>关于)以🛠浏览器为例:驱动下载:点击跳转把下载好的放驱动放在项目的目录下安装语法:pip install selenium其他驱动驱动名链接GGhttps://chromedriver.chromium.org/downloadsEehttps://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/🦊https://github.com/mozilla/geckodriver/releases🍏https://webkit.org/blog/6900/webdriver-support-in-safari-10/selenium的使用步骤❓因为随着 selenium版本的升级一些语法也随之发生改变请参考 👇 文档(不懂的可以私聊我互相交流)官方文档:点击跳转至官方selenium文档:直接跳至selenium文档导入:from selenium import webdriver创建谷歌浏览器操作对象:path = 谷歌浏览器驱动文件路径bor= webdriver.Chrome(path)访问网址url = 要访问的网址bor.get(url) = 自动打开浏览器获取内容content = bor.page_source = 获取爬取的源码selenium获取🔍源码练习

📰代码演示:

如果出现下面的报错不要慌:问题出现在浏览器驱动版本不一致 或者 高于当前浏览器版本(下载对应的驱动即可)

如下图(成功🆗):

selenium获取🛒源码练习

📰代码演示:

如下图(成功🆗):

selenium之元素定位❓

说明:元素定位:自动化要做的就是模拟鼠标和键盘来操作来操作这些元素,点击、输入等等。操作这些元素前首先要找到它们,WebDriver提供很多定位元素的方法(比如:自动抢票等😀)

方法

🔋:表示常用 推荐:博客园文章关于元素定位的相关使用:👉点击跳转🔗 常用的六种方法方法:(对应关系 (这是旧版的(报错但不影响使用)) =>(新版):使用新版需要导入:from selenium.webdriver.common.by import By)

方法使用举例find_element_by_id=>find_element(By.ID, “ID”)eg:button = bor.find_element_by_id(‘id值’) 🔋find_elements_by_name=>find_element(By.NAME, “NAME”)eg:name = bor.find_element_by_name(‘input里面的name’)find_element_by_xpath=>find_element(By.XPATH, “XPATH”)eg:xpath1 = bor.find_element_by_xpath(‘//input[@id=“id值”]’) 返回值 🔋find_elements_by_tag_name=>find_element(By.NAME, “NAME”)eg:names = bor.find_elements_by_tag_name(‘标签名’)find_elements_by_css_selector=>find_element(By.CSS_SELECTOR, ‘#J_footer’)eg:my_input = bor.find_elements_by_css_selector(‘这里简单记使用的是Bs4语法’)[0]🔋find_elements_by_link_text=>find_element(By.LINK_TEXT, ‘秒杀’)eg:bor.find_element_by_link_text(“页面中的链接文本”)find_element(By.CLASS_NAME, “CLASS_NAME”)eg:name = bor.find_elements(By.CLASS_NAME, “秒杀”)方法对比find_element VS find_elements 一个返回的是值,一个是列表Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程)

📰代码演示:

如下图(成功🆗):

访问的相关使用

说明:定位到元数后获取该元素的文本、类,Id名等等……

访问元素信息:

获取元素属性 .get_attribute(‘class’)获取元素文本 .text获取标签名 .tag_name

📰代码演示:

如下图(成功🆗)

交互的相关使用

说明:如自动打开🔍然后输入大司马然后点击他的简介进行查看(自动执行(刷起来))

交互:

点击:click()输入:send_keys()后退操作:bor.back()前进操作:bor.forword()模拟JS滚动:js=‘document.documentElement.scrollTop=100000’bor.execute_script(js) 执行js代码退出:bor.quit()

📰代码演示:

如下图(全自动的(gif太大传不了,可以自己把time设置大一点感受)🆗):

链接👉: 点击查看

小总结✍

**使用步骤:**使用selenium获取源码 👉 定位元素 👉 访问元素 👉 模拟交互

Chrome handless简介Chrome handless 跟 Selenium使用方法差不多,使用起来速度比Selenium更快Chrome-headless 模式, Google 针对 Chrome 浏览器 59版 新增加的一种模式,可以让你不打开UI界面的情况下使用 Chrome 浏览器,所以运行效果与 Chrome 保持完美一致。优点:快缺点:无界面系统要求系统要求:ChromeUnix\Linux 系统需要 chrome >= 59Windows 系统需要 chrome >= 60Python3.6Selenium==3.4.*ChromeDriver==2.31Chrome handless相关使用配置固定模板:

📰代码演示:

如下图(成功🆗):

Chrome handless简单封装

最后

本文章到这里就结束了,觉得不错的请给我专栏点点订阅,你的支持是我们更新的动力,感谢大家的支持,希望这篇文章能帮到大家

点击跳转到我的Python专栏

下篇文章再见ヾ( ̄▽ ̄)ByeBye

本文链接地址:https://www.jiuchutong.com/zhishi/300055.html 转载请保留说明!

上一篇:钉钉消息防撤回功能研究与实现-可查看历史消息[文件/图文/管理员/链接 撤回拦截](钉钉防止撤回)

下一篇:使用YOLOv5模型进行目标检测!AI大佬手撕源码带你学(yolov3模型大小是多少)

  • 孙春兰强调 总结基层经验做法 推动防控措施持续优化

    孙春兰强调 总结基层经验做法 推动防控措施持续优化

  • 华为手机怎么p字在图片上(华为手机怎么批量删除联系人)

    华为手机怎么p字在图片上(华为手机怎么批量删除联系人)

  • 电话hd1是什么意思(电话上hd是什么)

    电话hd1是什么意思(电话上hd是什么)

  • 笔记本电脑1tb的意思(笔记本电脑1TB的)

    笔记本电脑1tb的意思(笔记本电脑1TB的)

  • iphone11面容录入一直显示在低一点(苹果11面容录入不了是什么原因)

    iphone11面容录入一直显示在低一点(苹果11面容录入不了是什么原因)

  • ios13怎么下载不用密码(苹果13怎么下载不了app)

    ios13怎么下载不用密码(苹果13怎么下载不了app)

  • 快手小店电脑版在哪里下载(快手小店电脑版怎么退保证金)

    快手小店电脑版在哪里下载(快手小店电脑版怎么退保证金)

  • 广场可见和主页可见的区别(广场可见主页看得见吗)

    广场可见和主页可见的区别(广场可见主页看得见吗)

  • 华为省电模式闹钟响吗(华为手机超级省电模式闹钟响不响)

    华为省电模式闹钟响吗(华为手机超级省电模式闹钟响不响)

  • 网易云私信显示已读吗(网易云私信显示账号异常)

    网易云私信显示已读吗(网易云私信显示账号异常)

  • nova7和se区别(nova7和nova7 se的区别)

    nova7和se区别(nova7和nova7 se的区别)

  • iphone11面部识别不灵敏(iphone11面部识别提示低一点)

    iphone11面部识别不灵敏(iphone11面部识别提示低一点)

  • 没发货退款一定成功吗(如果没发货我退款不处理)

    没发货退款一定成功吗(如果没发货我退款不处理)

  • 五g卡4g手机能用吗(五g手机4g卡可以用5g网络吗)

    五g卡4g手机能用吗(五g手机4g卡可以用5g网络吗)

  • 买二手苹果笔记本需要注意什么(买二手苹果笔记本哪个年份好)

    买二手苹果笔记本需要注意什么(买二手苹果笔记本哪个年份好)

  • 在soul里怎么找一个人(在soul里怎么找附近的人)

    在soul里怎么找一个人(在soul里怎么找附近的人)

  • a1593是全网通吗(a1593是什么型号)

    a1593是全网通吗(a1593是什么型号)

  • 淘宝图片怎么上传清晰(淘宝图片怎么上传)

    淘宝图片怎么上传清晰(淘宝图片怎么上传)

  • 什么叫ods(什么叫odm)

    什么叫ods(什么叫odm)

  • 抖音怎么隐藏已关注的人(怎样在抖音上隐藏自己)

    抖音怎么隐藏已关注的人(怎样在抖音上隐藏自己)

  • 手机京东怎么取消订单(手机京东怎么取消无货订购订单)

    手机京东怎么取消订单(手机京东怎么取消无货订购订单)

  • 荣耀20怎么关闭后台程序(荣耀20怎么关闭系统更新通知)

    荣耀20怎么关闭后台程序(荣耀20怎么关闭系统更新通知)

  • 1660显卡支持win7吗(1660显卡支持win7系统吗)

    1660显卡支持win7吗(1660显卡支持win7系统吗)

  • cad怎样加文字(怎么在cad加文字)

    cad怎样加文字(怎么在cad加文字)

  • 新手机如何找回微信群(新手机如何找回微信密码)

    新手机如何找回微信群(新手机如何找回微信密码)

  • 在WIN10中,任务栏变宽该如何还原?(在windows 10中任务栏())

    在WIN10中,任务栏变宽该如何还原?(在windows 10中任务栏())

  • [error] Error: Fail to open IDE 问题解决

    [error] Error: Fail to open IDE 问题解决

  • ElementUI快速上手(jar包本地下载)(element ui)

    ElementUI快速上手(jar包本地下载)(element ui)

  • 息税前利润变动率
  • 个人所得税年度汇算时间
  • 税票抵扣是用进项票还是销项票
  • 工商银行资产负债表
  • 购买办公用品并分发有关部门会计分录
  • 内部资金往来科目
  • 地产项目开发
  • 存货周转次数变高的可能原因是
  • 滞纳金用留抵增值税交怎么处理
  • 公对公房产转让税费
  • 12月份未计提的费用汇算清缴如何调整?
  • 没有及时报关怎么办
  • 费用没有发票是什么意思
  • 季度企业所得税计算方法举例
  • 企业开出增值税专用发票后注销
  • 职工的大病医保怎么报销
  • 年底增值税有余额吗
  • 未确认融资费用摊销额怎么计算
  • 港杂费是由谁收取
  • 华为折叠手机mateX5价格
  • mac系统怎么删除用户
  • win10怎么防火墙白名单
  • 总产值在报表中怎么看
  • 怎么证明公司的存在
  • 包装物押金收入含税吗
  • 代扣代缴个税手续费
  • php面向对象的三大特征
  • 购进的包装物怎么入库
  • php数组函数 菜鸟
  • php基础入门教程
  • 建筑企业总包方都有哪些印花税
  • php递归遍历文件夹
  • php获取数据
  • 设备租赁费属于设备费吗
  • 测试工程师有前途么
  • php图片库
  • 税费减免政策2020
  • 资产减值损失属于什么科目借贷方向
  • 注册一个公司没有流水可以吗
  • 前端培训费用大概多少
  • 不借助的英文
  • python next iter
  • 资产是指()
  • 其他应付款二级明细科目有哪些
  • 公司账户取出来要交税吗
  • 开劳务发票需要的资料有哪些?
  • 企业弥补亏损的渠道有哪些
  • 车辆理赔款如何入账
  • 没有票的成本怎么处理
  • 工会经费返还属于什么收入
  • 年度汇算清缴要补税怎么办
  • 根据企业
  • 房地产开发企业增值税税率
  • 讲课费需要提供发票吗
  • mysqlsum查询慢
  • SQL Server 2000 清理日志精品图文教程
  • Mysql中FIND_IN_SET()和IN区别简析
  • innodb update 锁
  • win8开机提示激活
  • bios报警声
  • win81蓝屏重启故障
  • 笔记本win8为什么不能连无线
  • perl时间函数
  • cocos2d教程
  • h5 nodejs
  • css实现放大缩小的动画效果
  • node.js怎么样
  • unity3d物体移动代码
  • javascript编程基础
  • python yield from 用法
  • JAVAscript字符串类型单引号和双引号意一样吗
  • jquery设置单选框
  • 通用申报表怎么填样本
  • 补充协议需要双方签字盖章吗
  • 深圳小微企业税收优惠政策2023
  • 文化服务包括哪些专业
  • 20年灵活就业人员社保新标准
  • 车辆购置税退税需要什么资料
  • 广东省哪里地方考中控证好
  • 印花税会计分录怎么做 印花税需要计提吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设