位置: 编程技术 - 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

编辑:rootadmin

推荐整理分享Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux 查找nginx,linux查看nginx进程命令,linux 查找nginx,查看nginx命令,linux如何查看nginx日志,linux nginx版本查看命令,linux查看nginx配置文件,linux查看nginx,内容如对您有帮助,希望把文章链接给更多的朋友!

摘要

做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.log,access.log这个文件记录的应该是最近一天的日志情况,首先请看看日志大小,如果很大(超过MB)建议别用这些命令分析,因为这些命令很消耗CPU,或者更新下来放到分析机上执行,以免影响网站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次数

cat access.log | grep Baiduspider | wc

最左面的数值显示的就是爬行次数。

2. 百度蜘蛛的详细记录(Ctrl C可以终止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n cat access.log | grep Baiduspider | head -n

只看最后条或最前条,这用就能知道这个日志文件的开始记录的时间和日期。

3. 百度蜘蛛抓取首页的详细记录

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像对首页非常热爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜欢内页。

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

4. 百度蜘蛛派性记录时间点分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行页面按次数降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的数据,鉴于大陆的特殊性,大家应该对百度的log更为关注。

附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢&#;Google adsense广告之所以能与内容相关,因为每个包含着adsense的广告被访问后,很快就有个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了,真厉害啊!

ps:linux下nginx如何启用网站日志,查看蜘蛛爬虫

默认的路径是你安装时候指定的

如果用的LNMP之类的安装包

你可以在SHELL下

whereisnginx

找到相应的路径之后

在NGINX下的CONF文件夹里看配置文件,日志文件如果记录了话

在配置文件里有路径的~

Linux Shell脚本面试问集合 Q:1Shell脚本是什么、它是必需的吗答:一个Shell脚本是一个文本文件,包含一个或多个命令。作为系统管理员,我们经常需要使用多个命令来完成一项任务

iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS iredmail是一套以postfix为核心的整合邮件系统的安装脚本,可以达到快速部署邮件服务器的目的。经过上面的一系列分析后,进入到获取安装包的步骤,

exit(-1)或者return(-1)shell得到的退出码为什么是 下面我写了一个helloworld程序,一起看看吧://filename:main.c#includestdio.hintmain(void){printf("hellowolrd!n");return(-);}编译执行:gccmain.c&&./a.out现在我们看看在当前s

标签: linux查看nginx配置文件

本文链接地址:https://www.jiuchutong.com/biancheng/368685.html 转载请保留说明!

上一篇:浅谈:linux cron 计划任务常用符号小结(浅谈一下新冠的好处)

下一篇:Windows命令行bat批处理延迟sleep方法(批处理延时)(Windows命令行删除文件夹)

  • 房产税的计税基础包括契税吗
  • 个人住房5年后买卖如何交税?
  • 发行股票的手续费计入什么费用
  • 个体户开票超过500万能注销吗
  • 一般纳税人软件销售税率
  • 免税小规模企业开专票可以吗
  • 事业单位人员租房有补助吗
  • 设计、制造
  • 哪些支出允许在企业所得税前扣除
  • 原材料被盗计入什么科目
  • 结转增值税销项的账务处理
  • 营业外收入的核算内容主要有哪些
  • 物业公司收取电费加价依据
  • 税务迁移会影响外经证核销吗
  • 所得税营业成本包括哪些
  • 补交社保后的个税怎么交
  • 行政单位库存物资管理办法
  • 库存成本与实际成本不符
  • 个人独资企业所得税缴纳标准
  • 将外购商品用于在建工程计入固定资产成本吗
  • 增值税发票确认时间
  • 第一次申领发票可以增额吗?
  • 总分机构怎么纳税
  • 劳务所得个税税率表
  • 员工劳务报酬分录
  • 默认网关不可用修复后过一会又不好使了
  • 外购货物用于建造厂房可以抵扣进项税吗
  • 个体工商户投资金额填多少
  • PHP:mb_convert_kana()的用法_mbstring函数
  • 产品销售账务处理办法
  • windows7如何制表
  • php 读取大excel
  • node 卸载
  • 物流辅助服务包括货物运输吗
  • 预提借款税费会减少吗
  • 怎么编制资金平衡表格
  • 工程前期费用是什么意思
  • 电子税务局税种核定在哪里
  • 高速费发票可以重开吗
  • 个人所得税定额税率
  • mssqlserver服务安装
  • 收据大写后面的空格怎么填
  • 其他应付款的会计编码
  • 工业企业制造费用包括哪些
  • 2021年税控盘收费
  • 应收账款坏账计入资产减值损失还是信用减值损失
  • 收到跨年的发票怎么入账
  • 什么是委托加工原材料
  • 商贸公司库存表怎么做
  • 留抵税额可以抵欠税吗
  • 小微企业和小规模纳税人的区别
  • 什么是加计扣除农产品进项税额
  • 如何恢复数据库数据
  • mysql性能分析语句
  • 主键自增长的数据如何导入
  • mac安装surge
  • 怎么设置xp系统
  • 没有光驱有什么影响
  • linux ssh免密码
  • xp系统电脑开机密码忘记了
  • mac文本软件
  • 如何设置macbook
  • window系统桌面
  • cocos2d-js-min.js
  • [置顶]马粥街残酷史
  • 基于web的学生成绩管理系统毕业论文
  • Unsolved bug in fltk-1.1.10/src/filename_list.cxx for scandir --已解决!
  • eclipse从本地导入项目
  • python中类怎么用
  • vue远程调用组件
  • Android---43---Service之IntentService
  • js的类型有哪几种
  • js设计模式有什么用
  • js回调函数应用场景
  • 税务局遴选能去什么单位
  • 常州国家税务局待遇
  • 甘肃税务局电子发票怎么开
  • 上海市税务局领导简介
  • 神州浩天财务软件
  • 审计如何聚焦主责主业
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设