位置: 编程技术 - 正文

linux 文本处理工具之一grep命令详解 (linux 文字处理)

编辑:rootadmin

推荐整理分享linux 文本处理工具之一grep命令详解 (linux 文字处理),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:Linux文本处理工具,linux文本处理常用命令,linux文本处理工具的实验总结与反思,linux文本处理常用命令,Linux文本处理工具,linux文本处理三剑客,linux文本处理工具的实验总结与反思,Linux文本处理工具,内容如对您有帮助,希望把文章链接给更多的朋友!

grep(Globel Search Regular Expression and Printing out the line)全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,是一个对行进行操作的搜索工作,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包括grep、egrep和fgrep。 egrep表示扩展的grep,相比grep支持更多的元字符,"grep -E"相当于egrep。fgrep是fast grep,不支持元字符,但是搜索速度更快。grep搜索的结果被送到屏幕,不影响原文件内容。

1、grep的语法[] (man grep查看grep的帮助文档) grep [options] 'pattern' FILE 命令 选项 模式 文件

grep不加引号直接过滤字符串;grep在进行模式匹配的时候必须加引号,单引和双引号都可以;grep在引用变量的时候必须加双引号

2、grep的选项[option]

-r:递归的搜索 -v:反向选取,只显示不符合模式的行 -o:只显示被模式匹配到的字符串,而不是整个行 -i:匹配时不区分大小写 -A #:显示匹配到的行时,顺便显示后面的#行(#表示数值) -B #:前面的#行 -C #:前后的#行 -E:使用扩展的正则表达式

eg:grep选项的例子

复制代码代码如下:cat > eg1.text << EOF This is first how are you How old are you fine,thanks what,so what What is your name EOF grep "you" eg1.text grep -o "you" eg1.text grep -v "you" eg1.text grep -i "what" eg1.text grep -A 1 "fine" eg1.text grep -B 1 "fine" eg1.text grep -C 1 "fine" eg1.text

以上代码直接粘贴复制在linux上可直接运行,代码解释运行效果,如下3、 正则表达式(man regex)是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串,通常被用来检索或替换那些符合某个模式的文本内容。正则表达式分为:基本正则表达式和扩展正则表达式。 元字符就是指那些在正则表达式中具有特殊意义的专用字符。

grep支持基本正则表达式的元字符:

^:锚点行首的符合条件的内容,用法格式"^pattern" $:锚点行首的符合条件的内容,用法格式"pattern$" ^$:匹配空白行 .:匹配任意单个字符 *:匹配紧挨在前面的字符任意次(0,1,多次) .*:匹配任意长度的任意字符 ?:匹配紧挨在前面的字符0次或1次{m,n}:匹配其前面的字符至少m次,至多n次{m,}:匹配其前面的字符至少m次 {m}:精确匹配前面的m次{0,n}:0到n次 <:锚点词首----相当于b,用法格式:<pattern >:锚点词尾,用法格式:>pattern<pattern>:单词锚点 ():分组,用法格式:(pattern),引用第一个小括号的分组1,第二个是2,以此类推 []:匹配指定范围内的任意单个字符 [^]:匹配指定范围外的任意单个字符

eg:基本正则表达的例子

(1)、显示/proc/meminfo文件中以不区分大小的s开头的行;

grep "^[sS]" /proc/meminfo

(2)、显示/etc/passwd中以nologin结尾的行;

grep "nologin$" /etc/passwd

(3)、显示/etc/inittab中空格开头的行;

grep "^$" /etc/inittab

(4)、显示/etc/passwd中,以r开头的字符而后跟了任意单个字符的行;

grep --color "^r." /etc/passwd

(5)、显示/etc/passwd中,以r开头后跟了o,o出现任意次的行;

grep --color "^ro*" /etc/passwd

(6)、显示/etc/passwd文件中,r后跟了任意长度任意字符后跟了h的行;

grep --color "r.*h" /etc/passwd

(7)、显示/etc/passwd中,r后跟了o,o出现0次或者1次的行;

grep --color "ro?" /etc/passwd

(8)、显示/etc/passwd中,r后跟了o,o出现至少1次至多2次的行;

grep --color "ro{1,2}" /etc/passwd

(9)、显示/etc/passwd中,r后跟了o,o只出现2次的行;

grep --color "ro{2}" /etc/passwd

linux 文本处理工具之一grep命令详解 (linux 文字处理)

()、显示/etc/passwd中,匹配root这个单词的行;

grep --color "<root>" /etc/passwd

grep支持扩展表达式的元字符:支持所有基本正则表达式的元字符,有些和基本元字符在用法上不一样,扩展正则表达式的命令egrep或者grep -E?:匹配紧挨在前面的字符0次或1次{m,n}:至少m次,至多n次():分组+:至少匹配前面的字符一次a|b:匹配a或者b

eg:扩展正则表达式的例子

(1)、显示/etc/passwd中,r开头后跟了o,o出现0次或者1次的行;

egrep --color "ro?" /etc/passwd

(2)、显示/etc/passwd中,r开头后跟了o,o出现至少1次至多2次的行;

egrep --color "ro{1,2}" /etc/passwd

(3)、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的;

egrep --color "^([0-9]).*1$" /etc/inittab

(4)、显示/etc/passwd中,r开头后跟了o,o出现至少1次;

复制代码代码如下:egrep --color "ro+" /etc/passwdgrep -E --color "ro{1,}" /etc/passwd

(5)、显示/etc/passwd中,匹配root或者halt的行;

egrep --color "root|halt" /etc/passwd

(6)、显示/var/log/secure文件中包含"LOGIN ON"或者"Failed passwd"的行;

egrep --color "(LOGIN ON|Failed passwd)" /var/log/secure

grep支持字符和字符集合 d:数字字符匹配。等效于 [0-9]。 s:匹配任何空白字符,包括空格、制表符、换页符等。与 [ fnrtv] 等效。 S:匹配任何非空白字符。与 [^ fnrtv] 等效 w:匹配任何字类字符,包括下划线。与“[A-Za-z0-9_]”等效。 W:与任何非单词字符匹配。与“[^A-Za-z0-9_]”等效。 [:digit:]:所有数字, 相当于0-9 或者d [:lower:]:所有的小写字母 [:upper:]:所有的大写字母 [:alpha:]:所有的字母 [:alnum:]:相当于[0-9a-zA-Z] [:space:]:空白字符 相当于s [:punct:]:所有标点符号

eg:支持字符集合的例子

(1)、显示/etc/rc.d/rc.sysinit中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行;

复制代码代码如下:grep "^#[[:space:]]{1,}[^[:space:]]" /etc/rc.d/rc.sysinit grep -E "^#s{1,}S" /etc/rc.d/rc.sysinit

(2)、显示/etc/inittab中包含了:一个数字:(即两个冒号中间一个数字)的行;

复制代码代码如下:grep --color ":[[:digit:]]:" /etc/inittabgrep --color ":d:" /etc/inittab

经典的例子

(1)、分组的例子

复制代码代码如下:cat > test.txt <<EOF He like his liker He love his lover She love her lover She like her lover EOF grep "l..e.*l..er" test.txt grep "(l..e).*1r" test.txt

(2)、匹配1-的数字

复制代码代码如下:cat > num.txt << EOF EOF grep --color -E "<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|[0-5])>" num.txt (3)、匹配ABC类IP地址即 1.0.0.1---...

复制代码代码如下:cat > ip.txt <<EOF 1.0.0. 1.0.0. 1.2.3.4 ... ... 2... EOF grep -E --color "<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-1][0-9]|[0-3]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|[0-5]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|[0-5]).([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|[0-4])>" ip.txt (4)、匹配Email地址:任意长度数字字母@任意长度数字字母.(com|org|net等等)

复制代码代码如下:cat > email.txt << EOF @qq.com jie@sina.cn ken_tom@netcom.org jerry#li@baidu.net li@souhu.net EOF grep -E --color "^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$" email.txt (5)、匹配手机号码:手机号码是1[3|4|5|8]后面接9位数字的

复制代码代码如下:cat > tel.txt << EOF EOF grep --color -E "<1[3|4|5|8][0-9]{9}>" tel.txt 本文出自 “技术之路---桀” 博客

轻松学会文本处理工具之二 linux sed命令 sed:StreamEditor文本流编辑,sed是一个非交互式的面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,

Linux find 强大的文件查找工具 一切皆文件是Linux的哲学思想之一,这条命令可以统计当前linux系统中有多少文件ls-R/|wc-l建议放在后台执行,因为你的系统文件很多则会消耗很多时间,

Linux系统下批量压缩图片尺寸大小的方法 现在手机用户非常庞大,针对手机用户的流量不得不考虑,但手机网络带宽较小,怎么将互联网上的图片压缩是个难题,在windows上容易,有很多软件,

标签: linux 文字处理

本文链接地址:https://www.jiuchutong.com/biancheng/359014.html 转载请保留说明!

上一篇:linux磁盘格式化与管理知识点总结(linux磁盘格式化后一定会清空数据吗)

下一篇:轻松学会文本处理工具之二 linux sed命令(文本文本)

  • 增值税专用发票几个点
  • 小规模纳税人到底能不能收专票
  • 专票待认证
  • 高新技术企业亏损弥补
  • 计入税金及附加的科目
  • 回购股票不注销没有意义
  • 企业所得税成本没有发票怎么处理
  • 受托代销商品款是什么科目
  • 二季度资产总额怎么计算
  • 劳务派遣差额计税公式
  • 销售折扣开票怎么开
  • 调价单生成什么科目
  • 视同销售应付福利费账务处理是怎样的?
  • 企业征地补偿支出需要什么凭据做账?
  • 商铺租金收入交什么税一共多少个点
  • 2年前的增值税发票能不能用
  • 融资租赁 车辆
  • 代销方式的特点
  • 可以背书转让的公司
  • 居民企业的判定条件
  • 一万元国债一年多少利息
  • 企业可以采用在产品按固定成本计算法的有
  • 公司给供电局转账违法吗
  • 专票密码区出来一点能报吗
  • 自行生产的存货转固定资产怎么做账
  • 建筑物拆除物资包括哪些
  • 临时工工资单怎么做
  • 失控发票一定要盖章吗
  • 联想电脑bios启动项设置方法
  • win7系统ie浏览器在哪里
  • 利润总额为负数净利润怎么算
  • 旅游开发企业会计账务处理
  • 企业购入一批材料卖价5万元
  • 特殊收入应扣减可加计扣除的研发费用政策依据
  • 公司出租房租怎么交税
  • PHP+MySQL之Insert Into数据插入用法分析
  • 布拉索夫地图
  • 融资租赁业务的特点
  • 工业企业成本怎么结转
  • 报个税时显示扣缴单位无有效的税费种认定信息
  • 配置多数据源的好处
  • uni-app实例教程
  • php抓取
  • 无极框架下载
  • 申请退税怎么算
  • nodejs安装及环境配置win10
  • 贷款和应收款项属于金融资产的哪类
  • 母子公司资产划转的涉税问题
  • c语言怎么给函数传递数组
  • python如何运行
  • 织梦如何使用
  • 出租车发票可以改时间吗
  • 汇算清缴报表填报顺序
  • 福利费为什么通过应付职工薪酬科目要紧吗
  • 单位安装摄像头合法吗
  • 利润表中的资产处置收益应该计入营业利润还是利润总额
  • 出口货物没有进项发票用什么平台申报
  • 以固定资产换入无形资产
  • 营业税金及附加和税金及附加有什么区别
  • 原材料属于固定资本还是流动资本
  • 财产租赁合同印花税申报期限
  • 公司建账初期做账怎么做
  • 集团公司对子公司总经理的绩效考核
  • 小微企业即征即退
  • 购买本公司产品未付款需要签名字吗
  • Select count(*)、Count(1)和Count(列)的区别及执行方式
  • 在幻灯片母版中
  • reg注册表格式文件
  • linux查看组的信息
  • win7系统怎么设置开机启动项
  • python rem
  • 枚举的内容怎么输出
  • js字符串转为json
  • 网页javascript错误
  • 浏览器app测试要点
  • 八大排序算法的时间空间复杂度
  • 怎样理解句子我还没弄清楚是怎么回事
  • 特殊工种作业人员
  • 工资个人所得税法
  • 为什么专利转让要交税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设