位置: IT常识 - 正文

Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程)

编辑:rootadmin
Python爬虫之Web自动化测试工具Selenium&&Chrome handless

推荐整理分享Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:web爬虫视频教程,如何用python爬虫网站文档,web爬虫视频教程,python爬虫网页源代码,python 爬虫 https,python web爬虫,python webkit 爬虫,python web爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

​ ​

@作者 : SYFStrive

@博客首页 : HomePage

🥧 上一篇续文传送门

📌:个人社区(欢迎大佬们加入) 👉:社区链接🔗

📌:如果觉得文章对你有帮助可以点点关注 👉:专栏连接🔗

💃:程序员每天坚持锻炼💪

🔗:阅读文章

📋目录Selenium简介为什么使用selenium❓如何安装selenium❓selenium的使用步骤❓selenium获取🔍源码练习selenium获取🛒源码练习selenium之元素定位❓方法访问的相关使用交互的相关使用小总结✍Chrome handless简介系统要求Chrome handless相关使用Chrome handless简单封装最后

Selenium简介Selenium是一个用于Web应用程序测试的工具。Selenium 测试直接运行在浏览器中,就像真正的用户在操作一样。(真正的用户还不给数据那么网站存在的意义是什么?)支持通过各种driver(FirfoxDriver,IternetExplorerDriver,OperaDriver,ChromeDriver)驱动 真实浏览器完成测试。selenium也是支持无界面浏览器操作的。缺点:有点慢为什么使用selenium❓

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

如何安装selenium❓

步骤:

下载对应浏览器版本驱动查看自己浏览器的版本 (如以🛠为例:谷歌浏览器右上角‐‐>帮助‐‐>关于)以🛠浏览器为例:驱动下载:点击跳转把下载好的放驱动放在项目的目录下安装语法:pip install selenium其他驱动驱动名链接GGhttps://chromedriver.chromium.org/downloadsEehttps://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/🦊https://github.com/mozilla/geckodriver/releases🍏https://webkit.org/blog/6900/webdriver-support-in-safari-10/selenium的使用步骤❓因为随着 selenium版本的升级一些语法也随之发生改变请参考 👇 文档(不懂的可以私聊我互相交流)官方文档:点击跳转至官方selenium文档:直接跳至selenium文档导入:from selenium import webdriver创建谷歌浏览器操作对象:path = 谷歌浏览器驱动文件路径bor= webdriver.Chrome(path)访问网址url = 要访问的网址bor.get(url) = 自动打开浏览器获取内容content = bor.page_source = 获取爬取的源码selenium获取🔍源码练习

📰代码演示:

如果出现下面的报错不要慌:问题出现在浏览器驱动版本不一致 或者 高于当前浏览器版本(下载对应的驱动即可)

如下图(成功🆗):

selenium获取🛒源码练习

📰代码演示:

如下图(成功🆗):

selenium之元素定位❓

说明:元素定位:自动化要做的就是模拟鼠标和键盘来操作来操作这些元素,点击、输入等等。操作这些元素前首先要找到它们,WebDriver提供很多定位元素的方法(比如:自动抢票等😀)

方法

🔋:表示常用 推荐:博客园文章关于元素定位的相关使用:👉点击跳转🔗 常用的六种方法方法:(对应关系 (这是旧版的(报错但不影响使用)) =>(新版):使用新版需要导入:from selenium.webdriver.common.by import By)

方法使用举例find_element_by_id=>find_element(By.ID, “ID”)eg:button = bor.find_element_by_id(‘id值’) 🔋find_elements_by_name=>find_element(By.NAME, “NAME”)eg:name = bor.find_element_by_name(‘input里面的name’)find_element_by_xpath=>find_element(By.XPATH, “XPATH”)eg:xpath1 = bor.find_element_by_xpath(‘//input[@id=“id值”]’) 返回值 🔋find_elements_by_tag_name=>find_element(By.NAME, “NAME”)eg:names = bor.find_elements_by_tag_name(‘标签名’)find_elements_by_css_selector=>find_element(By.CSS_SELECTOR, ‘#J_footer’)eg:my_input = bor.find_elements_by_css_selector(‘这里简单记使用的是Bs4语法’)[0]🔋find_elements_by_link_text=>find_element(By.LINK_TEXT, ‘秒杀’)eg:bor.find_element_by_link_text(“页面中的链接文本”)find_element(By.CLASS_NAME, “CLASS_NAME”)eg:name = bor.find_elements(By.CLASS_NAME, “秒杀”)方法对比find_element VS find_elements 一个返回的是值,一个是列表Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程)

📰代码演示:

如下图(成功🆗):

访问的相关使用

说明:定位到元数后获取该元素的文本、类,Id名等等……

访问元素信息:

获取元素属性 .get_attribute(‘class’)获取元素文本 .text获取标签名 .tag_name

📰代码演示:

如下图(成功🆗)

交互的相关使用

说明:如自动打开🔍然后输入大司马然后点击他的简介进行查看(自动执行(刷起来))

交互:

点击:click()输入:send_keys()后退操作:bor.back()前进操作:bor.forword()模拟JS滚动:js=‘document.documentElement.scrollTop=100000’bor.execute_script(js) 执行js代码退出:bor.quit()

📰代码演示:

如下图(全自动的(gif太大传不了,可以自己把time设置大一点感受)🆗):

链接👉: 点击查看

小总结✍

**使用步骤:**使用selenium获取源码 👉 定位元素 👉 访问元素 👉 模拟交互

Chrome handless简介Chrome handless 跟 Selenium使用方法差不多,使用起来速度比Selenium更快Chrome-headless 模式, Google 针对 Chrome 浏览器 59版 新增加的一种模式,可以让你不打开UI界面的情况下使用 Chrome 浏览器,所以运行效果与 Chrome 保持完美一致。优点:快缺点:无界面系统要求系统要求:ChromeUnix\Linux 系统需要 chrome >= 59Windows 系统需要 chrome >= 60Python3.6Selenium==3.4.*ChromeDriver==2.31Chrome handless相关使用配置固定模板:

📰代码演示:

如下图(成功🆗):

Chrome handless简单封装

最后

本文章到这里就结束了,觉得不错的请给我专栏点点订阅,你的支持是我们更新的动力,感谢大家的支持,希望这篇文章能帮到大家

点击跳转到我的Python专栏

下篇文章再见ヾ( ̄▽ ̄)ByeBye

本文链接地址:https://www.jiuchutong.com/zhishi/300055.html 转载请保留说明!

上一篇:钉钉消息防撤回功能研究与实现-可查看历史消息[文件/图文/管理员/链接 撤回拦截](钉钉防止撤回)

下一篇:使用YOLOv5模型进行目标检测!AI大佬手撕源码带你学(yolov3模型大小是多少)

  • 微信上怎么建群(企业微信上怎么建群)

    微信上怎么建群(企业微信上怎么建群)

  • realme gt neo2语音助手怎么唤醒小布(realmegtneo语音唤醒)

    realme gt neo2语音助手怎么唤醒小布(realmegtneo语音唤醒)

  • 一加9rt屏幕分辨率是多少(一加9r的屏幕分辨率)

    一加9rt屏幕分辨率是多少(一加9r的屏幕分辨率)

  • 红轴和静音红轴的区别(红轴和静音红轴哪个好)

    红轴和静音红轴的区别(红轴和静音红轴哪个好)

  • 华为p40微信分身怎么弄(华为P40微信分身怎么弄)

    华为p40微信分身怎么弄(华为P40微信分身怎么弄)

  • 百家号实名认证过不了怎么办(百家号实名认证不了怎么办)

    百家号实名认证过不了怎么办(百家号实名认证不了怎么办)

  • 纽扣电池没电了怎么办(纽扣电池没电了会漏液吗)

    纽扣电池没电了怎么办(纽扣电池没电了会漏液吗)

  • 红米note5支持18w快充吗(红米note5支持5g网络吗)

    红米note5支持18w快充吗(红米note5支持5g网络吗)

  • 华为mate30pro锁屏键失灵(华为mate30pro锁屏密码忘了怎么解开)

    华为mate30pro锁屏键失灵(华为mate30pro锁屏密码忘了怎么解开)

  • QQ号被盗的原因(qq号被盗是因为什么原因)

    QQ号被盗的原因(qq号被盗是因为什么原因)

  • 苹果手机跳屏是什么原因(苹果手机跳屏是屏幕坏了吗)

    苹果手机跳屏是什么原因(苹果手机跳屏是屏幕坏了吗)

  • ipad怎么输入中文(ipad输入法怎么输入中文)

    ipad怎么输入中文(ipad输入法怎么输入中文)

  • 就寝设置后能删除吗(就寝 设置)

    就寝设置后能删除吗(就寝 设置)

  • 俄罗斯的面积(俄罗斯的面积比冥王星大吗)

    俄罗斯的面积(俄罗斯的面积比冥王星大吗)

  • 苹果11配置(苹果11配置相当于骁龙多少)

    苹果11配置(苹果11配置相当于骁龙多少)

  • 微信运动是不是要联网(微信运动是不是12点后重新计算)

    微信运动是不是要联网(微信运动是不是12点后重新计算)

  • 荣耀手环有通话功能吗(荣耀手环接电话如何设置方法)

    荣耀手环有通话功能吗(荣耀手环接电话如何设置方法)

  • 信息拦截怎么取消(信息拦截怎么取消苹果)

    信息拦截怎么取消(信息拦截怎么取消苹果)

  • 苹果怎么隐藏照片视频(苹果怎么隐藏照片)

    苹果怎么隐藏照片视频(苹果怎么隐藏照片)

  • 天猫精灵曲奇连不上网(天猫精灵曲奇连不上怎么办)

    天猫精灵曲奇连不上网(天猫精灵曲奇连不上怎么办)

  • 热点资讯怎么设置不出界面(手机的热点资讯)

    热点资讯怎么设置不出界面(手机的热点资讯)

  • 趣步怎么使用(趣步怎么啦)

    趣步怎么使用(趣步怎么啦)

  • iPhone手机怎样开启原彩显示(iphone手机怎样开热点)

    iPhone手机怎样开启原彩显示(iphone手机怎样开热点)

  • 画吧怎么用(画吧怎么用图层)

    画吧怎么用(画吧怎么用图层)

  • Win10怎么实现自动换壁纸功能? Win10自动换壁纸的技巧(windows10怎么设置自启动)

    Win10怎么实现自动换壁纸功能? Win10自动换壁纸的技巧(windows10怎么设置自启动)

  • 其他权益工具投资属于什么科目
  • 工商年报中的资金数额怎么填
  • 评估入账几种情况
  • 预付的成本票计入什么科目?
  • 合同不交印花税合法吗
  • 建筑挂靠企业账务处理
  • 奖金做预发年底结算缴税怎么做?
  • 应收账款增值税专用发票
  • 政府转账捐赠怎么做分录
  • 预付费用计入当期费用吗
  • 固定资产暂估入账条件
  • 库存商品做账
  • 财产税放在哪个科目
  • 土地使用权出让和划拨有什么区别
  • 汇算清缴时费用占收入多少
  • 土地使用税如何计算缴纳
  • 关于个人所得税下列说法正确的是
  • 支付现金未给发票怎么做账?
  • 应收账款账龄分析简单例题
  • 预提差率费怎么记账
  • 1697509099
  • 年末商品库存属于什么指标
  • 电脑图标怎么在下面显示
  • 支付工程款需要什么财务手续
  • 附加税享受税收减免的怎么记账
  • uefi系统安装win7gho
  • 电脑bios打开usb接口
  • gsicon.exe是什么进程 作用是什么 gsicon进程查询
  • PHP:mb_ereg_search_pos()的用法_mbstring函数
  • 库存退回
  • linux怎样安装
  • PHP:mcrypt_enc_get_modes_name()的用法_Mcrypt函数
  • 企业短期借款的债权人均为银行
  • 个人独资企业是小规模纳税人吗
  • 零售金银首饰的商场要交消费税吗
  • php yield 异步
  • 凯斯西储大学在哪个城市
  • php qrcode生成二维码
  • 资产负债表应收账款怎么计算
  • 新版python
  • yii2.0框架
  • 3月1日前包括什么意思
  • 100%控股权什么意思
  • dedecms插件
  • 收到的销项负数发票如何申报
  • 技术服务收入属于什么收入
  • 配电室增容验收标准
  • 营改增后房屋租赁税变化
  • 保理公司的钱来自哪里
  • 余利宝本金会亏吗
  • 递延所得税会计处理全过程
  • 资产负债表和科目余额表怎么核对
  • 固定资产为什么不能直接计入费用
  • 小规模纳税人收到专票后如何处理
  • 申报高新技术企业专利有什么要求
  • 采用现销方式销售商品的会计分录
  • 明细账怎么订起来
  • 小规模纳税人如何建账记账及流程
  • 什么叫商业会计
  • macbook launch
  • 在microsoft store
  • 获取linuxip
  • windows8怎么隐藏任务栏
  • 关于windows的说法正确的是
  • win10改服务器
  • linux自动获取校时服务器时间
  • 移动宽带解绑怎么办理
  • win8系统怎么设置
  • windows资源管理器在哪个文件夹
  • cocos环境搭建
  • 2014 ChinaJoy落下帷幕 十大年度热门事件盘点
  • dos改时间
  • angularjs删除数组元素
  • 详解node HTTP请求客户端 - Request
  • javascript例题
  • 脚本 python
  • 三水水厂热线电话号码
  • 电子税务局用户名和密码是什么
  • 运输费属于什么会计分录
  • 湖南社保卡怎么网上缴费
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设