位置: IT常识 - 正文

Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程)

发布时间:2024-01-17
Python爬虫之Web自动化测试工具Selenium&&Chrome handless

推荐整理分享Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:web爬虫视频教程,如何用python爬虫网站文档,web爬虫视频教程,python爬虫网页源代码,python 爬虫 https,python web爬虫,python webkit 爬虫,python web爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

​ ​

@作者 : SYFStrive

@博客首页 : HomePage

🥧 上一篇续文传送门

📌:个人社区(欢迎大佬们加入) 👉:社区链接🔗

📌:如果觉得文章对你有帮助可以点点关注 👉:专栏连接🔗

💃:程序员每天坚持锻炼💪

🔗:阅读文章

📋目录Selenium简介为什么使用selenium❓如何安装selenium❓selenium的使用步骤❓selenium获取🔍源码练习selenium获取🛒源码练习selenium之元素定位❓方法访问的相关使用交互的相关使用小总结✍Chrome handless简介系统要求Chrome handless相关使用Chrome handless简单封装最后

Selenium简介Selenium是一个用于Web应用程序测试的工具。Selenium 测试直接运行在浏览器中,就像真正的用户在操作一样。(真正的用户还不给数据那么网站存在的意义是什么?)支持通过各种driver(FirfoxDriver,IternetExplorerDriver,OperaDriver,ChromeDriver)驱动 真实浏览器完成测试。selenium也是支持无界面浏览器操作的。缺点:有点慢为什么使用selenium❓

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

如何安装selenium❓

步骤:

下载对应浏览器版本驱动查看自己浏览器的版本 (如以🛠为例:谷歌浏览器右上角‐‐>帮助‐‐>关于)以🛠浏览器为例:驱动下载:点击跳转把下载好的放驱动放在项目的目录下安装语法:pip install selenium其他驱动驱动名链接GGhttps://chromedriver.chromium.org/downloadsEehttps://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/🦊https://github.com/mozilla/geckodriver/releases🍏https://webkit.org/blog/6900/webdriver-support-in-safari-10/selenium的使用步骤❓因为随着 selenium版本的升级一些语法也随之发生改变请参考 👇 文档(不懂的可以私聊我互相交流)官方文档:点击跳转至官方selenium文档:直接跳至selenium文档导入:from selenium import webdriver创建谷歌浏览器操作对象:path = 谷歌浏览器驱动文件路径bor= webdriver.Chrome(path)访问网址url = 要访问的网址bor.get(url) = 自动打开浏览器获取内容content = bor.page_source = 获取爬取的源码selenium获取🔍源码练习

📰代码演示:

如果出现下面的报错不要慌:问题出现在浏览器驱动版本不一致 或者 高于当前浏览器版本(下载对应的驱动即可)

如下图(成功🆗):

selenium获取🛒源码练习

📰代码演示:

如下图(成功🆗):

selenium之元素定位❓

说明:元素定位:自动化要做的就是模拟鼠标和键盘来操作来操作这些元素,点击、输入等等。操作这些元素前首先要找到它们,WebDriver提供很多定位元素的方法(比如:自动抢票等😀)

方法

🔋:表示常用 推荐:博客园文章关于元素定位的相关使用:👉点击跳转🔗 常用的六种方法方法:(对应关系 (这是旧版的(报错但不影响使用)) =>(新版):使用新版需要导入:from selenium.webdriver.common.by import By)

方法使用举例find_element_by_id=>find_element(By.ID, “ID”)eg:button = bor.find_element_by_id(‘id值’) 🔋find_elements_by_name=>find_element(By.NAME, “NAME”)eg:name = bor.find_element_by_name(‘input里面的name’)find_element_by_xpath=>find_element(By.XPATH, “XPATH”)eg:xpath1 = bor.find_element_by_xpath(‘//input[@id=“id值”]’) 返回值 🔋find_elements_by_tag_name=>find_element(By.NAME, “NAME”)eg:names = bor.find_elements_by_tag_name(‘标签名’)find_elements_by_css_selector=>find_element(By.CSS_SELECTOR, ‘#J_footer’)eg:my_input = bor.find_elements_by_css_selector(‘这里简单记使用的是Bs4语法’)[0]🔋find_elements_by_link_text=>find_element(By.LINK_TEXT, ‘秒杀’)eg:bor.find_element_by_link_text(“页面中的链接文本”)find_element(By.CLASS_NAME, “CLASS_NAME”)eg:name = bor.find_elements(By.CLASS_NAME, “秒杀”)方法对比find_element VS find_elements 一个返回的是值,一个是列表Python爬虫之Web自动化测试工具Selenium&&Chrome handless(web爬虫视频教程)

📰代码演示:

如下图(成功🆗):

访问的相关使用

说明:定位到元数后获取该元素的文本、类,Id名等等……

访问元素信息:

获取元素属性 .get_attribute(‘class’)获取元素文本 .text获取标签名 .tag_name

📰代码演示:

如下图(成功🆗)

交互的相关使用

说明:如自动打开🔍然后输入大司马然后点击他的简介进行查看(自动执行(刷起来))

交互:

点击:click()输入:send_keys()后退操作:bor.back()前进操作:bor.forword()模拟JS滚动:js=‘document.documentElement.scrollTop=100000’bor.execute_script(js) 执行js代码退出:bor.quit()

📰代码演示:

如下图(全自动的(gif太大传不了,可以自己把time设置大一点感受)🆗):

链接👉: 点击查看

小总结✍

**使用步骤:**使用selenium获取源码 👉 定位元素 👉 访问元素 👉 模拟交互

Chrome handless简介Chrome handless 跟 Selenium使用方法差不多,使用起来速度比Selenium更快Chrome-headless 模式, Google 针对 Chrome 浏览器 59版 新增加的一种模式,可以让你不打开UI界面的情况下使用 Chrome 浏览器,所以运行效果与 Chrome 保持完美一致。优点:快缺点:无界面系统要求系统要求:ChromeUnix\Linux 系统需要 chrome >= 59Windows 系统需要 chrome >= 60Python3.6Selenium==3.4.*ChromeDriver==2.31Chrome handless相关使用配置固定模板:

📰代码演示:

如下图(成功🆗):

Chrome handless简单封装

最后

本文章到这里就结束了,觉得不错的请给我专栏点点订阅,你的支持是我们更新的动力,感谢大家的支持,希望这篇文章能帮到大家

点击跳转到我的Python专栏

下篇文章再见ヾ( ̄▽ ̄)ByeBye

本文链接地址:https://www.jiuchutong.com/zhishi/300055.html 转载请保留说明!

上一篇:钉钉消息防撤回功能研究与实现-可查看历史消息[文件/图文/管理员/链接 撤回拦截](钉钉防止撤回)

下一篇:使用YOLOv5模型进行目标检测!AI大佬手撕源码带你学(yolov3模型大小是多少)

  • a1584拆机(a1586)(A1584拆机教程)

    a1584拆机(a1586)(A1584拆机教程)

  • 格力空调小金豆什么价格(格力空调小金豆)(格力空调小金豆遥控器)

    格力空调小金豆什么价格(格力空调小金豆)(格力空调小金豆遥控器)

  • 红米note10与红米note10pro区别(红米note10与红米note9)

    红米note10与红米note10pro区别(红米note10与红米note9)

  • 怎么查ip地址(怎么查ip地址冲突)

    怎么查ip地址(怎么查ip地址冲突)

  • 皮皮虾图片暂时无法保存为什么(皮皮虾图片暂时无法保存在哪设置)

    皮皮虾图片暂时无法保存为什么(皮皮虾图片暂时无法保存在哪设置)

  • vsco注册收不到验证码(为什vsco这个软件没法注册)

    vsco注册收不到验证码(为什vsco这个软件没法注册)

  • WPS电脑筛选功能怎么用(wps office筛选功能)

    WPS电脑筛选功能怎么用(wps office筛选功能)

  • 钉钉直播回放倍数算吗(钉钉直播回放倍速怎么算时间)

    钉钉直播回放倍数算吗(钉钉直播回放倍速怎么算时间)

  • 电话被拉黑了信息能发过去吗(电话被拉黑了信息还能发出去吗)

    电话被拉黑了信息能发过去吗(电话被拉黑了信息还能发出去吗)

  • cad如何生成方格网(cad怎么生成)

    cad如何生成方格网(cad怎么生成)

  • 微信上显示你已添加了(微信上显示你已被网警监视)

    微信上显示你已添加了(微信上显示你已被网警监视)

  • 苹果lightning什么意思(iphone lightning)

    苹果lightning什么意思(iphone lightning)

  • 滴滴驾驶行为报告什么意思(滴滴驾驶行为报告对司机有什么影响)

    滴滴驾驶行为报告什么意思(滴滴驾驶行为报告对司机有什么影响)

  • 华为电脑管家登录不了(华为电脑管家登录不了华为帐号)

    华为电脑管家登录不了(华为电脑管家登录不了华为帐号)

  • 苹果下载不了钉钉怎么回事(苹果下载不了钉钉怎么办)

    苹果下载不了钉钉怎么回事(苹果下载不了钉钉怎么办)

  • 极米z6怎么调焦距(极米z6怎么对焦)

    极米z6怎么调焦距(极米z6怎么对焦)

  • 快手怎么举报主播成功(快手怎么举报主播,没直播的情况下)

    快手怎么举报主播成功(快手怎么举报主播,没直播的情况下)

  • 怎么关闭淘宝虚拟3d人生(怎么关闭淘宝虚拟号码)

    怎么关闭淘宝虚拟3d人生(怎么关闭淘宝虚拟号码)

  • 手机用久了卡慢怎么办(手机用久了好卡)

    手机用久了卡慢怎么办(手机用久了好卡)

  • xr下载app用不了面容id

    xr下载app用不了面容id

  • win7怎样设置屏幕亮度(win7怎样设置屏幕锁定时间)

    win7怎样设置屏幕亮度(win7怎样设置屏幕锁定时间)

  • 三星c7文件管理在哪(三星手机的文件管理在哪里能找到)

    三星c7文件管理在哪(三星手机的文件管理在哪里能找到)

  • 酷我如何上传歌曲(酷我音乐怎么上传自己的音乐作品?)

    酷我如何上传歌曲(酷我音乐怎么上传自己的音乐作品?)

  • 全民k歌怎么向人约歌(全民k歌怎样k歌)

    全民k歌怎么向人约歌(全民k歌怎样k歌)

  • 磁盘重新分区(磁盘重新分区,里面的文件是否会丢失)

    磁盘重新分区(磁盘重新分区,里面的文件是否会丢失)

  • 路由器WDS桥接成功但是电脑无法上网该解决方法(路由器wds桥接成功为什么不能上网)

    路由器WDS桥接成功但是电脑无法上网该解决方法(路由器wds桥接成功为什么不能上网)

  • 车船使用税会打折么
  • 股东退股如何清算盈亏
  • 单位承担的社保费用计入应付职工薪酬科目吗
  • 上年多计提增值税,今年如何调整
  • 会计准则体系包括会计制度吗
  • 印花税是不是必须要交
  • 承租方支付租金会计科目
  • 小企业销售费用多少算高
  • 季度流动比率怎么算
  • 公司收到银行承兑汇票会计分录
  • 免单计入什么科目
  • 所得税汇算清缴退税会计分录怎么做
  • 餐饮招待怎么入账
  • 商品进销差价账户的用途性质及核算内容
  • 增值税附加税可以抵扣吗?
  • 广告公司可以开服务费吗
  • 购买税控系统专用设备
  • 销售货物收入与租金收入的纳税区别
  • 专用发票发票联丢失怎么办
  • 为什么要结转成本差异
  • 个体工商户比如
  • 小规模纳税人出售使用过固定资产
  • 办妥托收手续会计分录
  • linux 的ll
  • linux压缩.gz
  • 误删开始菜单
  • 使用Huagepage和PGO来提升PHP7的执行性能
  • 免征的增值税需要纳税调整吗
  • mcrlnstaller
  • linux中的文件
  • PHP:pg_connect()的用法_PostgreSQL函数
  • 付款结算单范本
  • 第一部塞班手机
  • 在建工程可以计入资本性支出吗
  • nginx隐藏后缀
  • 建筑业统一发票真伪查询
  • php中正则表达式
  • 存货损失的账务处理
  • mac m1 rosetta编译
  • 企业预缴增值税附加税率
  • 企业所得税的计提和缴纳分录
  • 毛利率为负也可以投资吗
  • 递延收益会计科目的账务处理
  • js数组方法filter
  • 企业投资入股要交多少税
  • 公司扣个税查不到怎么办
  • 外汇核销是什么意思
  • 企业用车年检需要什么资料
  • mysql5.7设置编码
  • 企业发生的广告费应计入
  • 电子发票与纸质发票具有不同的法律效力
  • 商业汇票贴现时间轴
  • microsoft SQL server 2014可以删吗
  • db2比较大小
  • 小规模费用发票可以抵扣增值税吗
  • 社会保险差额缴纳
  • 无形资产属于货物吗为什么
  • 应收账款坏账计提比例新标准
  • 项目评审结果
  • 城市生活垃圾处理费征收管理办法
  • 现金冲账是什么意思
  • 没有认证的进项发票可以做成本吗
  • 锁mysql
  • sqlserver 断开数据库连接
  • mysql join 慢
  • 如何删除windows media center
  • 应用商店升级版
  • linux自动化装机
  • debian安装zsh
  • 微软今天正式停产了吗
  • Win7旗舰版64位如何关闭电脑触摸屏功能的方法
  • windows 10 开始菜单
  • 批处理查询文件是否存在
  • angularjs1.5
  • ugui scrollview
  • [置顶] [Android Studio 权威教程]AS添加第三方库的6种方式(Jar,module,so等)
  • 关于车辆购置税的申报与缴纳下列说法正确的有
  • 西安车辆购置税缴纳多少
  • 工会经费怎么缴付
  • 营业费用指哪些
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号