位置: 编程技术 - 正文

简单实现python爬虫功能(python怎么爬)

编辑:rootadmin

推荐整理分享简单实现python爬虫功能(python怎么爬),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:用python做爬虫,python爬视频教程,python爬虫的几种方法,python 爬app,python简单的爬虫教程,python简单的爬虫教程,python爬视频教程,python 爬app,内容如对您有帮助,希望把文章链接给更多的朋友!

在我们日常上网浏览网页的时候,经常会看到一些好看的图片,我们就希望把这些图片保存下载,或者用户用来做桌面壁纸,或者用来做设计的素材。

  我们最常规的做法就是通过鼠标右键,选择另存为。但有些图片鼠标右键的时候并没有另存为选项,还有办法就通过就是通过截图工具截取下来,但这样就降低图片的清晰度。好吧~!其实你很厉害的,右键查看页面源代码。

  我们可以通过python 来实现这样一个简单的爬虫功能,把我们想要的代码爬取到本地。下面就看看如何使用python来实现这样一个功能。

一、获取整个页面数据

首先我们可以先获取要下载图片的整个页面信息。

getjpg.py

  Urllib模块提供了读取web页面数据的接口,我们可以像读取本地文件一样读取www和ftp上的数据。首先,我们定义了一个getHtml()函数:

简单实现python爬虫功能(python怎么爬)

  urllib.urlopen()方法用于打开一个URL地址。

  read()方法用于读取URL上的数据,向getHtml()函数传递一个网址,并把整个页面下载下来。执行程序就会把整个网页打印输出。

二、筛选页面中想要的数据

Python 提供了非常强大的正则表达式,我们需要先要了解一点python 正则表达式的知识才行。

假如我们百度贴吧找到了几张漂亮的壁纸,通过到前段查看工具。找到了图片的地址,如:src=”   re.compile() 可以把正则表达式编译成一个正则表达式对象.   re.findall() 方法读取html 中包含 imgre(正则表达式)的数据.

运行脚本将得到整个页面中包含图片的URL地址。

三、将页面筛选的数据保存到本地把筛选的图片地址通过for循环遍历并保存到本地,代码如下:

这里的核心是用到了urllib.urlretrieve()方法,直接将远程数据下载到本地。通过一个for循环对获取的图片连接进行遍历,为了使图片的文件名看上去更规范,对其进行重命名,命名规则通过x变量加1。保存的位置默认为程序的存放目录。程序运行完成,将在目录下看到下载到本地的文件。

结果展示:

标签: python怎么爬

本文链接地址:https://www.jiuchutong.com/biancheng/379971.html 转载请保留说明!

上一篇:python实现颜色空间转换程序(Tkinter)(python颜色表)

下一篇:简单介绍Python中的几种数据类型(python介绍的主要内容)

  • 增值税出口退税计入什么科目
  • 所得税汇算清缴账务处理
  • 什么是进项税额转出
  • 补发上年度奖金如何计税
  • 跨年的预收账款怎么记账
  • 会计继续教育还需要学吗
  • 卖家电税是多少
  • 企业之间交换房屋 契税
  • 投资性房地产在非货币性资产交换怎么处理
  • 增值税纳税申报表在哪里打印
  • 知道税额怎么算含税金额
  • 注销公司报表应注意什么
  • 企业现金类资产包括
  • 预付材料购货款计入什么科目
  • 一般纳税人季报利润表怎么填
  • 固定资产折旧提完了之后还要怎么处理吗
  • 分期收款销售商品确认收入会计分录
  • 金税盘抵减增值税的账务处理
  • 全年一次性奖金个税计算
  • 待抵扣进项税贷方有余额什么意思
  • 提示涉税风险该怎么弄
  • 小微企业增值税收优惠政策
  • 土地作价入股政策
  • 其他应付款下的固定资产怎么报废
  • 出售无形资产是什么科目
  • 采购及安装合同怎么缴纳印花税
  • 成品油零售加油站增值税规定
  • 计提税金怎么提
  • 在win7系统中文件属性有哪些
  • 第三方检测公司招聘信息
  • win7系统网络一直转圈,什么都打不开
  • php验证码扭曲效果怎么做
  • laravel执行seed命令
  • 存货跌价准备的分录
  • 公司给员工购买商业保险报销哪些
  • 网页单行文本框
  • MVC架构模式
  • 文化事业建设费计入什么科目
  • 物流公司修理班的管理有那些书
  • 零申报的申报表怎么填
  • 三栏式明细账需要每笔结余额吗
  • 上市公司净资产转正的方法
  • 普通发票可以抵扣进项吗
  • windows7/windows10/windows11最强Audacity音频编辑播放器软件,免费下载
  • SQL Server 使用 SET FMTONLY ON 获得表的元数据
  • 借条这样写才有效
  • 支付给临时工的费用
  • 收到服务费的增值税发票
  • 小企业会计准则适用于哪些企业
  • 文化事业建设税怎么申报
  • 预缴增值税怎么计提
  • 合作研究开发项目的合同
  • 一般纳税人农业企业免企业所得吗
  • 甲方代付农民工工资谁报个税
  • 违约投标保证金多少
  • 小规模纳税人企业所得税税率
  • 公交车ic卡网上充值
  • 公司开办期间的住宿费会计分录
  • 记账凭证先写借方还是贷方
  • 其它流动资产为负数原因
  • 其他应收款收不回来了,如何核销
  • 编制利润表的主要根据是
  • 固定资产如何管理
  • sqlserver 类型
  • mysql分组后取最新的一条记录
  • unix vi命令
  • windows7的常用菜单
  • windows注销登录会怎样
  • 网站遇到错误号怎么办
  • linux安装编译工具
  • 怎么恢复电脑win7系统
  • 服务器不支持密码鉴定
  • js 读取 excel
  • js array数组
  • mysql数据类型大全
  • python django运行
  • python 备份文件夹
  • 环保税要求标注什么
  • 福建原盐和自然盐有什么区别
  • 消费税和增值税的异同点
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设