位置: 编程技术 - 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

编辑:rootadmin

推荐整理分享Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux 查找nginx,linux查看nginx进程命令,linux 查找nginx,查看nginx命令,linux如何查看nginx日志,linux nginx版本查看命令,linux查看nginx配置文件,linux查看nginx,内容如对您有帮助,希望把文章链接给更多的朋友!

摘要

做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.log,access.log这个文件记录的应该是最近一天的日志情况,首先请看看日志大小,如果很大(超过MB)建议别用这些命令分析,因为这些命令很消耗CPU,或者更新下来放到分析机上执行,以免影响网站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次数

cat access.log | grep Baiduspider | wc

最左面的数值显示的就是爬行次数。

2. 百度蜘蛛的详细记录(Ctrl C可以终止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n cat access.log | grep Baiduspider | head -n

只看最后条或最前条,这用就能知道这个日志文件的开始记录的时间和日期。

3. 百度蜘蛛抓取首页的详细记录

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像对首页非常热爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜欢内页。

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

4. 百度蜘蛛派性记录时间点分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行页面按次数降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的数据,鉴于大陆的特殊性,大家应该对百度的log更为关注。

附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢&#;Google adsense广告之所以能与内容相关,因为每个包含着adsense的广告被访问后,很快就有个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了,真厉害啊!

ps:linux下nginx如何启用网站日志,查看蜘蛛爬虫

默认的路径是你安装时候指定的

如果用的LNMP之类的安装包

你可以在SHELL下

whereisnginx

找到相应的路径之后

在NGINX下的CONF文件夹里看配置文件,日志文件如果记录了话

在配置文件里有路径的~

Linux Shell脚本面试问集合 Q:1Shell脚本是什么、它是必需的吗答:一个Shell脚本是一个文本文件,包含一个或多个命令。作为系统管理员,我们经常需要使用多个命令来完成一项任务

iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS iredmail是一套以postfix为核心的整合邮件系统的安装脚本,可以达到快速部署邮件服务器的目的。经过上面的一系列分析后,进入到获取安装包的步骤,

exit(-1)或者return(-1)shell得到的退出码为什么是 下面我写了一个helloworld程序,一起看看吧://filename:main.c#includestdio.hintmain(void){printf("hellowolrd!n");return(-);}编译执行:gccmain.c&&./a.out现在我们看看在当前s

标签: linux查看nginx配置文件

本文链接地址:https://www.jiuchutong.com/biancheng/368685.html 转载请保留说明!

上一篇:浅谈:linux cron 计划任务常用符号小结(浅谈一下新冠的好处)

下一篇:Windows命令行bat批处理延迟sleep方法(批处理延时)(Windows命令行删除文件夹)

  • 个体工商户一直没办税务登记证
  • 购进货物支付的运输费用如何计算增值税
  • 进口增值税的税率
  • 一般纳税人简易征收的适用范围
  • 关于美容院的会计如何做账
  • 公司车辆过户给个人需要交多少税
  • 应收账款可以挂其他应收款吗
  • 公司开电费发票怎么入账
  • 库存商品损失怎么做账
  • 零售行业的销售员有加班费吗
  • 个体工商户需要缴纳哪些税
  • 支付刻制公司印章费
  • 税控机减免税额怎么算
  • 一张发票多个单位报销,怎么分辨
  • 已核销的贷款收回计入什么科目
  • 个人股东从公司借款合法吗
  • 小规模纳税人核定征收标准
  • 个体不超过10万怎么交税
  • 免税增值税发票怎么做账
  • 本月合计怎么做
  • 母公司代发工资如何处理
  • 纺织厂收购棉花如何计税?
  • 视同销售行为怎么进行财税处理?
  • 车辆的代驾费应该怎么收
  • 如何取消网络拦截
  • linux系统添加静态路由命令
  • 说一下键盘
  • 新电商行业
  • php中file
  • 职工教育经费支出包括哪些内容
  • 发票填开有哪些规范性要求
  • 微信小程序登录后端
  • 【第三趴】uni-app页面搭建与路由配置(了解工程目录结构、学会搭建页面、配置路由并成功运行)
  • pytorch torch
  • mapbox怎么用
  • 微服务框架图
  • 生产型企业出口退税会计分录
  • 城镇土地使用税减免税政策2023年
  • 没有交过税怎么办
  • 有关事业单位无编人员的规定
  • 远期外汇合约的特点
  • 母子公司之间的租赁房屋
  • 收回款项的会计处理分录
  • 交去年企业所得税怎么做资产负债表
  • discuz mysql8.0
  • dedecms转其他cms
  • 企业其他应收款包括哪些
  • sql server怎么用sql语句创建数据库
  • 法人股的利弊
  • 新老税法
  • 预付款退回来了怎么做账
  • 预付款预缴如何做账
  • 期间费用逐年上升说明什么
  • 短期借款利息的使用账户是
  • 内账的表格怎么做
  • 折旧和摊销的概念
  • 支付宝如何打印付款凭证
  • 销售净利润怎么算
  • sql server本地服务器地址如何查看
  • 新装mysql设置密码
  • 如何编译安装
  • linux targz
  • wfxswtch.exe - wfxswtch是什么进程
  • win8怎么玩帝国时代2
  • win102020h2版本
  • win8安装应用商店
  • win8补丁官网
  • webpack 构建流程
  • nodejs 视频切片
  • js去除hover样式
  • iframe嵌入页面出现跨域问题
  • 怎么看物理内存
  • unity官方插件
  • node-js
  • jquery中的css方法
  • 简单的比较
  • 浙江市税务局怎么进
  • 陕西税务电子税务局官网安装
  • 留抵退税退回的款如何做账
  • 积极配合税务局工作
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设