位置: 编程技术 - 正文

linux awk 多文件操作2种实现方法 (linux的awk命令大全)

编辑:rootadmin

推荐整理分享linux awk 多文件操作2种实现方法 (linux的awk命令大全),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux的awk用法,linux的awk命令大全,awk 输出多个文件,linux的awk命令大全,linux awk命令使用实例,linux awk nr,linux awk nr,awk 多文件处理,内容如对您有帮助,希望把文章链接给更多的朋友!

我们经常会将2个有关联文本文件进行合并处理。分别从不同文件获取需要的列,然后,整体输出到一起。awk进行多文件处理时候,常常会遇到2个方面问题,第一个是怎么样合并多个文件为一个文件。第二个问题就是怎么样将多行合并为一行显示。我这里说下我的处理2种方法,还有实现思路。

实例文本:

复制代码代码如下:[chengmo@centos5 shell]$ awk 'FNR==1{print "rn"FILENAME}{print $0}' a.txt b.txt a.txt wang man wangsan woman wangming man wangzheng man b.txt

需要合并得到结果:

wang man wangsan woman wangming man wangzheng man

awk多文件操作方法一:

实现思路:

通过外部命令合并文件,然后通过排序,然后通过awk进行合并操作。

首先:

复制代码代码如下:[chengmo@centos5 shell]$ cat a.txt b.txt | sort -n -k1 |awk '{print}' wang man wangsan woman wangming man wangzheng man

现在需要把:第一列相同的处理合并到一行,这里需要用“next”语句。它操作,可以参考awk 多行合并【next 使用介绍】(常见应用4)

linux awk 多文件操作2种实现方法 (linux的awk命令大全)

继续:

复制代码代码如下:[chengmo@centos5 shell]$ cat a.txt b.txt | sort -n -k1 |awk 'NR%2==1{fd1=$2"t"$3;next}{print $0"t"fd1}' wang man wangsan woman wangming man wangzheng man

需要把几行合并,经常用到方法是:NR%num 然后将行值保存下来,next该行。在输出时候打印出来。

awk多文件操作方法二

实现思路

不借助第3放工具打开,直接通过awk 打开多个文件。然后可以通过:FILENAME获得当前处理文件名。NR总记录 FNR当前文件记录,以及ARGC传入参数总数,ARGV是数组,各个参数值。

看下这些实例:

复制代码代码如下:[chengmo@centos5 shell]$ awk 'BEGIN{print ARGC,ARGV[0],ARGV[1],ARGV[2]}{print FILENAME,NR,FNR,$0}' a.txt b.txt 3 awk a.txt b.txt a.txt 1 1 wang mana.txt 2 2 wangsan woman a.txt 3 3 wangming mana.txt 4 4 wangzheng manb.txt 5 1 b.txt 6 2 b.txt 7 3 b.txt 8 4

程序代码:

复制代码代码如下:[chengmo@centos5 shell]$ awk ' BEGIN{ if(ARGC<3) { exit 1; } file=""; } { aData[FILENAME,$1]=ARGV[1]==FILENAME?$0:$2"t"$3; } END{ for(k in aData) { split(k,idx,SUBSEP); if(idx[1]==ARGV[1] && (ARGV[2],idx[2]) in aData) { print aData[ARGV[1],idx[2]],aData[ARGV[2],idx[2]] | "sort -n -k1"; } } }' a.txt b.txt wang man wangsan woman wangming man wangzheng man

代码说明:

这里用到2维数组,aData[文件名,关联列对应值] ,这种方法可以将多个文件内容。放入一个统一二维数组。然后循环数组,通过if((i,j} in array) 查找对应列值,在其它文件中是否存在。

以上是2种实现方法,其中第一种思路较为简单,很容易理解。第二种处理起来较为复杂。有更好方法大家给我分享。

linux下通过awk查看ip连接数(常见应用一) 复制代码代码如下:[chengmo@localhost~]$awk'BEGIN{while("netstat-an"|getline){if($5~/[1-]/){split($5,t1,":");tarr[t1[1]]++;}}for(kintarr){printk,tarr[k]|"sort-r-n-k2";}};'/pp$5是netstatan第

shell awk实现实时监控网卡流量脚本(常见应用二) 实现原理:[chengmo@localhost~]$cat/proc/net/devInter-|Receive|Transmitface|bytespacketserrsdropfifoframecompressedmulticast|bytespacketserrsdropfifocollscarriercompressedlo:

awk 分析web日志(页面执行时间)(常见应用3) 前一段时间,我写过一篇文章,shell脚本分析nginx日志访问次数最多及最耗时的页面(慢查询),其中提到了分析耗时页面重要性。今天主要讲的,是通过

本文链接地址:https://www.jiuchutong.com/biancheng/359051.html 转载请保留说明!

上一篇:linux awk 正则表达式、正则运算符详细介绍 (awk正则表达式中引入变量)

下一篇:linux下通过awk查看ip连接数(常见应用一) (linux中awk怎么用)

免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

鄂ICP备2023003026号

网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

友情链接: 武汉网站建设 电脑维修 湖南楚通运网络