位置: 编程技术 - 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

编辑:rootadmin

推荐整理分享Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux 查找nginx,linux查看nginx进程命令,linux 查找nginx,查看nginx命令,linux如何查看nginx日志,linux nginx版本查看命令,linux查看nginx配置文件,linux查看nginx,内容如对您有帮助,希望把文章链接给更多的朋友!

摘要

做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.log,access.log这个文件记录的应该是最近一天的日志情况,首先请看看日志大小,如果很大(超过MB)建议别用这些命令分析,因为这些命令很消耗CPU,或者更新下来放到分析机上执行,以免影响网站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次数

cat access.log | grep Baiduspider | wc

最左面的数值显示的就是爬行次数。

2. 百度蜘蛛的详细记录(Ctrl C可以终止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n cat access.log | grep Baiduspider | head -n

只看最后条或最前条,这用就能知道这个日志文件的开始记录的时间和日期。

3. 百度蜘蛛抓取首页的详细记录

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像对首页非常热爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜欢内页。

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

4. 百度蜘蛛派性记录时间点分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行页面按次数降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的数据,鉴于大陆的特殊性,大家应该对百度的log更为关注。

附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢&#;Google adsense广告之所以能与内容相关,因为每个包含着adsense的广告被访问后,很快就有个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了,真厉害啊!

ps:linux下nginx如何启用网站日志,查看蜘蛛爬虫

默认的路径是你安装时候指定的

如果用的LNMP之类的安装包

你可以在SHELL下

whereisnginx

找到相应的路径之后

在NGINX下的CONF文件夹里看配置文件,日志文件如果记录了话

在配置文件里有路径的~

Linux Shell脚本面试问集合 Q:1Shell脚本是什么、它是必需的吗答:一个Shell脚本是一个文本文件,包含一个或多个命令。作为系统管理员,我们经常需要使用多个命令来完成一项任务

iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS iredmail是一套以postfix为核心的整合邮件系统的安装脚本,可以达到快速部署邮件服务器的目的。经过上面的一系列分析后,进入到获取安装包的步骤,

exit(-1)或者return(-1)shell得到的退出码为什么是 下面我写了一个helloworld程序,一起看看吧://filename:main.c#includestdio.hintmain(void){printf("hellowolrd!n");return(-);}编译执行:gccmain.c&&./a.out现在我们看看在当前s

标签: linux查看nginx配置文件

本文链接地址:https://www.jiuchutong.com/biancheng/368685.html 转载请保留说明!

上一篇:浅谈:linux cron 计划任务常用符号小结(浅谈一下新冠的好处)

下一篇:Windows命令行bat批处理延迟sleep方法(批处理延时)(Windows命令行删除文件夹)

  • 印花税核定征收文件
  • 企业进入
  • 高新企业收到政府补贴怎么做账
  • 税控盘锁死日期查询
  • 进项和销项必须在一个月吗
  • 非盈利组织收到投资款如何做账
  • 交通运输企业的装卸业务的全部费用
  • 政策信息咨询服务要到哪个部门办理资质
  • 小规模纳税人销售货物税率是多少
  • 员工异地缴纳社保协议
  • 退税降低
  • 贷款厂家贴息
  • 上市公司个税手续流程
  • 计税收入金额是什么意思
  • 个人股权转让申报表
  • 预付款发票可以入费用吗
  • 7月1日后通用机打发票纳税人识别号怎么填?
  • 企业自主招聘有编制吗
  • 股票期权个人所得税税率表
  • 城建税教育费附加和地方教育费附加
  • 汇算清缴纳税调整项目明细表怎么填
  • 预提长期借款利息的会计分录怎么写
  • 公司股权转让流程是先工商还是税务
  • win11怎么用
  • 留存收益在哪里可以查到
  • 旅游开发公司税率
  • 劳务公司发放农民工工资要开发票吗?
  • 优先股的发行主体
  • php数字转换大写
  • 支付航天开票技术服务费280
  • 计提五险一金的分录怎么写
  • macos big sur怎么恢复出厂设置
  • macbook直接显示桌面
  • loadprofiles什么意思
  • 马格达拉之战
  • 业务招待费能不能计入销售费用
  • 在西伯利亚森林中是真实故事吗
  • 固定资产减少的账务处理
  • 采用定额法计算产品成本,其程序如何?
  • 申报表30栏一直不填写会怎么样
  • php -r
  • php shell_exec()
  • linux用mv文件移动指定文件
  • 企业一直亏损老板也赚钱
  • dedecms转其他cms
  • mongodb性能测试
  • 玩转mongodb4.0从入门到实践
  • 员工加班打车费进项可以抵扣吗
  • 研发费用资本化条件有哪些
  • 兼职工资比正式工的工资高还是低
  • 同一控制下的长投入账价值按什么计算
  • 闽侯县安置房交易缴纳土地出让金
  • 收到定期存款怎么做分录
  • 产品检测费怎么入账
  • 机票开的个人的票是什么
  • 低值易耗的管理制度
  • 电子钥匙有效期多久
  • sqlserver 字符串包含
  • mysql5.7版本的服务的名字是
  • 删除重复记录mysql
  • 快速解决小孩便秘
  • linux文件切片命令
  • 恢复注册表的方法
  • ubuntu20.04怎么用
  • 鲁大师完全卸载
  • linux 查看磁盘io繁忙
  • win10 ie浏览器双击没有反应
  • linux管理器
  • win7系统电脑无声音
  • js代码执行顺序简单介绍
  • 如何理解js中的原型
  • perl获取文件名
  • bootstrap基础教程
  • VectorField2D
  • 深圳市税务局网上办税大厅官网
  • 免税企业可以收增值税专票吗
  • 怎样查询一个企业是不是一般纳税人
  • 黑龙江省国税局举报电话
  • 实地税务稽查需注意什么
  • 小规模纳税人开专票税率是1%还是3%
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设