位置: 编程技术 - 正文

python入门教程之识别验证码(python基础教程 入门教程)

编辑:rootadmin

推荐整理分享python入门教程之识别验证码(python基础教程 入门教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python入门教程 非常详细,python 入门,python的入门教程,python基础入门教程,python 入门,python 入门指南,python 入门指南,python 入门指南,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

验证码?我也能破解?

关于验证码的介绍就不多说了,各种各样的验证码在人们生活中时不时就会冒出来,身为学生日常接触最多的就是教务处系统的验证码了,比如如下的验证码:

识别办法

模拟登陆有着复杂的步骤,在这里咱们不管其他操作,只负责根据输入的一张验证码图片返回一个答案字符串。

我们知道验证码为了制作干扰,会把图片弄成五颜六色的样子,而我们首先就是要去除这些干扰,这一步就需要不断试验了,增强图片色彩,加大对比度等等都可以产生帮助。

python入门教程之识别验证码(python基础教程 入门教程)

在经过各种对图片的操作之后,终于找到了比较完美的去除干扰方案。可以看到在去除干扰之后,最优情况下,我们将得到一张十分纯净的黑白字符图片。一张图片上有四个字符,没办法一下子就把四个字符全部识别,需要把图片进行裁剪,裁剪成每张小图只有一个字符的样子,再对每张图片分别进行识别。

接下来就是识别文字了,我们首先把得到的小图转换成表示的矩阵,每个矩阵代表一个字符。

比如数字六的矩阵

远远望过去,眯着眼睛还是能分辨出来的。

因为验证码十分规整,每个数字所在的位置都是固定的,所以并不需要涉及什么机器学习的算法,只是简单的进行一下矩阵的比对就可以了,在所有的实现做好的矩阵中找到相似度最高的矩阵就可以了,在这里的比对方法多种多样,反正数据简单能正确识别出来就好。

至此,咱们的验证码识别工作就结束了。

这次进行的验证码识别主要采用python的PIL进行图片操作,模拟登陆自动填写验证码的全部代码请看这里:

示例代码

总结

本文链接地址:https://www.jiuchutong.com/biancheng/378650.html 转载请保留说明!

上一篇:python 链接和操作 memcache方法(python 内连接)

下一篇:Windows安装Python、pip、easy_install的方法(windows安装python pip)

免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

鄂ICP备2023003026号

网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

友情链接: 武汉网站建设 电脑维修 湖南楚通运网络