位置: 编程技术 - 正文

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

编辑:rootadmin

推荐整理分享awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:awk实现文件中45列交换,awk实现for循环按行遍历,awk实现for循环按行遍历,awk实现group by,awk实现for循环的写法,awk实现wc功能,awk实现for循环的写法,awk实现字符串拼接,内容如对您有帮助,希望把文章链接给更多的朋友!

最近看到论坛里面有几个不错的小例子,对于学习awk还是有帮助,在这儿详细的说一下

一、类似数据库中的left join查询

要求输出结果是,aaa,,,ddd,rts,

实现方法:

解释:当NR和FNR相同时,这就说明在对第一个文件进行操作,a[$1]=$2表示,建立一个数组,以第一个字段为下标,第二个字段为值。当NR!=FNR时,说明在对第二个文件进行操作,注意:这个时候的$1和前面的$1不是同一个东西了,前面的$1表示的是a.txt的第一个字段,而后面的$1表示的是b.txt的第一个字段。a[$1]表示以b.txt中第一个字段的为下标的值,如果a[$1]有值的话,说明也存在于a.txt文件中,这样就把数据print出来就行了。

实现方法2:

解释:-v OFS=","这个是设置输出时的列分割符,$1 in a这个是b.txt文件中的第一列的值是不是在数组a的key中,这个对做程序的来说很好理解,各种语言当中都有这样的用法,或者函数。例如,php中有in_array函数。比较一下,方法1和方法2中的print,方法1我加了双引号,方法2我却没有加,但是输出的效果却是一样的。

二、去除重复的值

如果有a,b和b,a这样的情况,就删除b,a,当然数字也一样;

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

实现方法1:

解释:for(i=1;i<=NF;i++)a[i]=$i;将每一列中的二个字段放到数组中,asort(a),这个数组进行排序,后面的代码是将数组数据输出来,通sort命令对输入的数据进行排序,相同数据会排在一起,通过uniq来进行去除相同的列。这种方法比较有通用性,不光适合二列,三列,四列都行。不过效率差了点。

实现方法2:

解释:方法2的二种写法,出来的结果是一样的,a[$0];没有赋值也没有报错,为什么呢?awk在遇到这样没有定义的变量时,会给它一个初值。if (!($2 OFS $1 in a))表示返转字段不在数组a中,这里所说的在,表示key是不是存在,不是值。print 不写默认是一行。

实现方法3:

解释:!a[$1_$2]++&&!a[$2_$1]++等于if(!a[$1_$2]++&&!a[$2_$1]++),对于首次出现的记录,a[$2_$1]的值是未定义的,由于后面的 ++ 是数学计算,所以a[$2_$1]会被赋值成数字0,也是由于 ++ 操作符,会先取值,再计算,从左到右 ++ 运算符的优先级大于!运算符的,所以对于第一行记录实际上是if(! 0) print $0 ! 是取反,0 是假,! 0 就是真,那么就会执行后面的 print $0对于后面出现的重复记录,a[$0] 经过 ++ 的计算已经变为 1、2、3 。。。而 ! 1 ! 2 ! 3 ... 都为假,不会打印。

三、awk的局部变量

这个例子来说明一下,awk怪异的局部变量

把都是数字的行,最大的那个数字加起来,第一行是2,第二行是3,每四行是3,第五行是4,总和是

在max方法里面,变量sum是会影响外面的,这里的sum是全局的。[root@krlcgcms mytest]# awk -f add.sh sumsum=

[root@krlcgcms mytest]# awk -f add.sh sumsum=

shell自定义函数的6个特点总结 最近系统的学习了一下shell的函数,总体感觉根其他语言的函数差不多,不过它也有自身的特点一,调用函数必须在定义函数的后,不然会报错的funfun(){

shell备份文件、重命名文件、删除指定文件的3个脚本分享 因为经常会用到shell脚本,所以经常会写一些,但是我从来没有系统的学习过shell脚本,遇到问题,就去看手册,或者google一下,到了一定的程度才发现

总结的7个shell字符串操作方法和实例分享 每一种语言都有他独自的字符串操作方法,shell也一样,下面以以例子的方式,简单介绍常用方法。1,取得字符串长度string=abc//等号二边不要有空

标签: awk实现wc功能

本文链接地址:https://www.jiuchutong.com/biancheng/371588.html 转载请保留说明!

上一篇:shell中的循环语句、判断语句实例(shell中的循环语句有哪些)

下一篇:shell自定义函数的6个特点总结(shell自定义命令)

  • 发票收款人和复核没写可以用吗
  • 应付销货方代垫运费计入什么科目
  • 民办学校房屋要求
  • 预计净残值影响减值准备吗
  • 利润表季度怎么填写
  • 出租车发票可以重新开吗
  • 无形资产的出售的会计处理
  • 法人存到公司账户的钱怎么记账
  • 成立小规模纳税人注册资金多少
  • 子公司注销应收母公司往来款
  • 存在问题的具体表现和产生问题的原因分析
  • 受托代销商品手续费会计分录
  • 行政单位明细账包括哪些
  • 预收购货单位货款
  • 公司内帐和外账的区别
  • 补交以前年度印花税记到哪个会计科目
  • 房屋所有权变更登记证书
  • 上市公司发行股票可以自行销售吗
  • 出口退税报关单解密在哪下载
  • 小微企业按季度预缴企业所得税
  • 金税是干什么的
  • 货币资金闲置对企业偿债能力的影响
  • 超市预付卡发票怎么开
  • 往来款项分为哪两类
  • 备用金借款单怎么写
  • 销售回款率的具体指标
  • 税金及附加多计提所得税年报怎么更正
  • 使用php进行mysql数据库编程的基本步骤
  • 其他业务收入怎么申报增值税
  • php二维数组的遍历
  • php保存数据
  • 公司报销客户的差旅费
  • 如果企业亏损要交企业所得税吗
  • android_app.intro
  • 弃置费用预计负债递延所得税怎么处理
  • php制作留言板包含登录和功能实现
  • php获取浏览器ua
  • 出差补贴应该怎么入账
  • python中生成器的作用
  • 旅行社专票开票内容的规定
  • 帝国cms视频教程
  • 预收账款发货
  • phpcms官网打不开
  • 资产负债率如何
  • 职工薪酬包括哪几类
  • 以摊余成本计量的债权投资与以公允价值计量且其变动
  • 招标押金有规定吗
  • 月末需要计提
  • 投资公司的投资收益算主营业务收入吗
  • 利润分配和所有者权益的关系
  • 应收账款冲销是什么意思
  • 收到公益性捐赠计入什么科目
  • 费用科目入错了
  • 代收代缴水电费协议
  • 生产成本直接人工怎么算
  • 收入支出结余怎么记账
  • 长期股权投资的初始计量
  • 医药进销存管理系统
  • 总公司是否可以注销分公司
  • 小企业会计准则主要按照什么计量
  • asm是啥
  • qtzgacer.exe - qtzgacer进程是什么文件 .作用是什么
  • 新手教程进不去
  • win7如何格式化D盘
  • win10预览版21301bug
  • oracle linux版
  • 编辑器ui
  • 简单谈谈你的入党动机
  • ubuntu搭建ftp服务器的步骤
  • 学习英语
  • python基础开发
  • unable to instantiate decoder
  • android圆环进度条渐变
  • 医保电子缴费凭证怎么查询
  • 独资企业变更法人
  • 湖北税务报税系统官网
  • 新车购置税最低多少钱
  • 国家税务总局网站登录入口官网
  • 临时增版
  • 税务检查企业所得税案例
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设