位置: 编程技术 - 正文

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

编辑:rootadmin

推荐整理分享awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:awk实现文件中45列交换,awk实现for循环按行遍历,awk实现for循环按行遍历,awk实现group by,awk实现for循环的写法,awk实现wc功能,awk实现for循环的写法,awk实现字符串拼接,内容如对您有帮助,希望把文章链接给更多的朋友!

最近看到论坛里面有几个不错的小例子,对于学习awk还是有帮助,在这儿详细的说一下

一、类似数据库中的left join查询

要求输出结果是,aaa,,,ddd,rts,

实现方法:

解释:当NR和FNR相同时,这就说明在对第一个文件进行操作,a[$1]=$2表示,建立一个数组,以第一个字段为下标,第二个字段为值。当NR!=FNR时,说明在对第二个文件进行操作,注意:这个时候的$1和前面的$1不是同一个东西了,前面的$1表示的是a.txt的第一个字段,而后面的$1表示的是b.txt的第一个字段。a[$1]表示以b.txt中第一个字段的为下标的值,如果a[$1]有值的话,说明也存在于a.txt文件中,这样就把数据print出来就行了。

实现方法2:

解释:-v OFS=","这个是设置输出时的列分割符,$1 in a这个是b.txt文件中的第一列的值是不是在数组a的key中,这个对做程序的来说很好理解,各种语言当中都有这样的用法,或者函数。例如,php中有in_array函数。比较一下,方法1和方法2中的print,方法1我加了双引号,方法2我却没有加,但是输出的效果却是一样的。

二、去除重复的值

如果有a,b和b,a这样的情况,就删除b,a,当然数字也一样;

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

实现方法1:

解释:for(i=1;i<=NF;i++)a[i]=$i;将每一列中的二个字段放到数组中,asort(a),这个数组进行排序,后面的代码是将数组数据输出来,通sort命令对输入的数据进行排序,相同数据会排在一起,通过uniq来进行去除相同的列。这种方法比较有通用性,不光适合二列,三列,四列都行。不过效率差了点。

实现方法2:

解释:方法2的二种写法,出来的结果是一样的,a[$0];没有赋值也没有报错,为什么呢?awk在遇到这样没有定义的变量时,会给它一个初值。if (!($2 OFS $1 in a))表示返转字段不在数组a中,这里所说的在,表示key是不是存在,不是值。print 不写默认是一行。

实现方法3:

解释:!a[$1_$2]++&&!a[$2_$1]++等于if(!a[$1_$2]++&&!a[$2_$1]++),对于首次出现的记录,a[$2_$1]的值是未定义的,由于后面的 ++ 是数学计算,所以a[$2_$1]会被赋值成数字0,也是由于 ++ 操作符,会先取值,再计算,从左到右 ++ 运算符的优先级大于!运算符的,所以对于第一行记录实际上是if(! 0) print $0 ! 是取反,0 是假,! 0 就是真,那么就会执行后面的 print $0对于后面出现的重复记录,a[$0] 经过 ++ 的计算已经变为 1、2、3 。。。而 ! 1 ! 2 ! 3 ... 都为假,不会打印。

三、awk的局部变量

这个例子来说明一下,awk怪异的局部变量

把都是数字的行,最大的那个数字加起来,第一行是2,第二行是3,每四行是3,第五行是4,总和是

在max方法里面,变量sum是会影响外面的,这里的sum是全局的。[root@krlcgcms mytest]# awk -f add.sh sumsum=

[root@krlcgcms mytest]# awk -f add.sh sumsum=

shell自定义函数的6个特点总结 最近系统的学习了一下shell的函数,总体感觉根其他语言的函数差不多,不过它也有自身的特点一,调用函数必须在定义函数的后,不然会报错的funfun(){

shell备份文件、重命名文件、删除指定文件的3个脚本分享 因为经常会用到shell脚本,所以经常会写一些,但是我从来没有系统的学习过shell脚本,遇到问题,就去看手册,或者google一下,到了一定的程度才发现

总结的7个shell字符串操作方法和实例分享 每一种语言都有他独自的字符串操作方法,shell也一样,下面以以例子的方式,简单介绍常用方法。1,取得字符串长度string=abc//等号二边不要有空

标签: awk实现wc功能

本文链接地址:https://www.jiuchutong.com/biancheng/371588.html 转载请保留说明!

上一篇:shell中的循环语句、判断语句实例(shell中的循环语句有哪些)

下一篇:shell自定义函数的6个特点总结(shell自定义命令)

  • 计提应交个人所得税分录怎么做
  • 未确认融资费用怎么算
  • 餐具报损表格样板
  • 工程材料票抵扣比例
  • 公司费用计入什么科目
  • 核算无形资产的过程中,使用的会计账户有
  • 银行承兑汇票背书转让后怎么查询
  • 销售额负数 如何填报报表
  • 航天金穗服务费抵扣
  • 诉讼费走哪个会计科目
  • 刷信用卡付货款怎么操作
  • 借方增加的科目记忆口诀
  • 即征即退和一般项目进项税比例怎样算出进项税额
  • 外贸企业需要交哪些税费
  • 跨行业能开发票吗
  • 所得税营业成本包括哪些
  • 小规模纳税人酒水税率
  • 纳税人必须熟知什么
  • 如何找确定劳动关系的证据
  • 跨区域个人所得税延期情况说明
  • 长期待摊费用多少钱
  • 购买原材料并作会计分录
  • 机打发票怎么申请流程
  • 出口0税率是免抵退还是免税
  • 王者荣耀怎么快速获得金币
  • 库存现金的主要内容有哪些
  • 奖励先进个人计划怎么写
  • cmos密码和bios密码
  • 苹果怎么设置屏保和壁纸
  • php时间戳相减
  • 任务栏没反应怎么重启
  • 网页视频播放不流畅原因
  • 委托加工物资企业原材料都是自己采购
  • 递延性负债
  • 生产企业出口退税的计算方法
  • php curl命令详解
  • 企业退货产生的损失谁承担
  • 员工宿舍装宽带
  • 工会经费和残保金的缴纳比例
  • java图片转换成文件流
  • html游戏大全
  • 增值税普通发票有什么用
  • 工业企业总产值怎么算
  • 只有进项发票,没有销项可以吗
  • 金税盘怎么增加收款人和复核人
  • 一般纳税人增值税怎么做账务处理
  • 研发费用凭证是发票吗
  • 基本户不注销会扣钱吗
  • 程序员35岁 知乎
  • 删除python包
  • 费用报销重复了怎么写情况说明
  • 个人所得税专项附加扣除2023
  • 固定资产基本特点
  • 提取法定盈余公积金会计分录
  • 开发无形资产的支出
  • 预收账款变成了什么
  • 购房增值税发票是购房发票吗
  • 红字更正法的使用范围是什么
  • mysql优化表命令
  • T-SQL中使用正则表达式函数
  • win7系统如何提升性能
  • macos 修改mac
  • bios是什么意思的
  • win10显示win8
  • win10网卡驱动不正常连不上网怎么办
  • Win8.1 32位和64位有什么区别 Win8.1 32位和64区别详细介绍
  • jquery炫酷效果
  • shell脚本用法
  • 增强现实的三个特征
  • jquery网页设计
  • python 设计
  • 表单验证js
  • javascript学习指南
  • js的调用函数
  • 《javascript高级程序设计》
  • python讲解
  • 苏州税务中心
  • 进口麦片销售公司
  • 会计开票要填哪些信息
  • 南川大观薰衣草花期
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设