位置: 编程技术 - 正文
推荐整理分享Shell+Curl网站状态检查脚本 抓出无法访问的站点(网页shell命令),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:shell 获取网页内容,shell website,shell website,shell website,shell打开网址,shell打开网页,shell html,shell html,内容如对您有帮助,希望把文章链接给更多的朋友!
一开始搭建中国博客联盟,既有博友提醒我,做网址大全这类网站维护很麻烦,需要大量的精力去Debug一些已夭折的网站,更是拿松哥的博客大全举例。当然,我也是深以为然。前些时间,看到梦轩丽人的boke网址大全的维护记录,好像是纯手工检查,张戈实在是佩服的五体投地,太有毅力了。
现在博客联盟也收录的博客也已破了,全部来自自主提交,不管你是草博还是名博,张戈不会强买强卖。由于大部分都是建站不过半年的新站,半路放弃、提前太监的博客估计还是有的,于是我决定还是把站点维护这个工作做起来。
上午用PHP做了一个放到了京东云试了下,发现检测速度一般,要等上半天(我写的php太蹩脚,就不献丑了)。随后,我在VPS上写了一个多线程的网站状态检测脚本,直接从数据库load站点地址,然后用curl去检测返回码,发现速度非常好,基本1分钟内就能出结果
以下是脚本代码:
Ps:关于shell多线程脚本,后续文章会有一个详细说明,本文篇幅有限,就不多说了。以下是中国博客联盟第一次成员站点存活检测的结果:①、 非返回码的异常站点:
②、脚本抓取的无法访问站点:
人工访问筛选结果:
wangyingxue.net(王英学博客):无法访问,经确认处于备案中 √www.tao.com(长江博客):可以访问 √blog.hack7d.com(Mcdull技术博客):无法访问 ×www..com(教师日记):可以访问 √www.3miaotu.com(三秒兔):无法访问 ×xiaoxiaomayi.com(小小蚂蚁博客):可以访问 √www.awrui.com(李文栋博客):可以访问 √
Ps:脚本检测机制为:8s内未连通的判定为异常,并重试3次,最后输出结果,若三次均异常则为。从图中和人工筛选可以看出,存在一些误杀,这个和8s的设定有一定关系。可以考虑设置为更长时间,得到更准确的结果,当然最终还是要结合人工确认的,所以也没多大关系。
后续,中国博客联盟会制订一个检查周期,最短每星期检查一次,最长一个月检查一次,争取让每个展示的站点都能正常访问。当然,我也会将每次检查的结果公布在中国博客联盟的站长资讯专栏,方便所有成员查看。由于目前中国博客联盟部署在京东云擎,无法远程操控数据库,所以只好暂时用半自动的模式。等以后有时间搬到了阿里云等VPS上后,将会将脚本改成全自动状态,当有网站联系多次检测为失联状态时,将会暂时将其设置为隐藏状态。
Linux用户在第一次登录时强制更改初始密码 下面介绍如何迫使用户在下一次登录时更改其密码。Linux下的每个用户帐户都与和密码相关的各个配置和信息关联起来。比如说,它记得上一次密码更改
Linux之split命令详解 命令功能:切割文件,将文件以行为单位或以字节为单位进行切割命令语法:split[?help][?version]split[-行数][-l行数][要切割的文件][输出文件名],以行数为
Linux执行.sh文件时提示No such file or directory该怎么办(三种解决办法) 先给大家看下问题描述,下图是我在运行时出现错误截图:解决方法分析原因,可能因为我平台迁移碰到权限问题我们来进行权限转换1)在Windows下转换
标签: 网页shell命令
本文链接地址:https://www.jiuchutong.com/biancheng/371383.html 转载请保留说明!上一篇:linux下python3连接mysql数据库问题(linux怎么调用python)
友情链接: 武汉网站建设