位置: 编程技术 - 正文

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

编辑:rootadmin

推荐整理分享awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:awk实现文件中45列交换,awk实现for循环按行遍历,awk实现for循环按行遍历,awk实现group by,awk实现for循环的写法,awk实现wc功能,awk实现for循环的写法,awk实现字符串拼接,内容如对您有帮助,希望把文章链接给更多的朋友!

最近看到论坛里面有几个不错的小例子,对于学习awk还是有帮助,在这儿详细的说一下

一、类似数据库中的left join查询

要求输出结果是,aaa,,,ddd,rts,

实现方法:

解释:当NR和FNR相同时,这就说明在对第一个文件进行操作,a[$1]=$2表示,建立一个数组,以第一个字段为下标,第二个字段为值。当NR!=FNR时,说明在对第二个文件进行操作,注意:这个时候的$1和前面的$1不是同一个东西了,前面的$1表示的是a.txt的第一个字段,而后面的$1表示的是b.txt的第一个字段。a[$1]表示以b.txt中第一个字段的为下标的值,如果a[$1]有值的话,说明也存在于a.txt文件中,这样就把数据print出来就行了。

实现方法2:

解释:-v OFS=","这个是设置输出时的列分割符,$1 in a这个是b.txt文件中的第一列的值是不是在数组a的key中,这个对做程序的来说很好理解,各种语言当中都有这样的用法,或者函数。例如,php中有in_array函数。比较一下,方法1和方法2中的print,方法1我加了双引号,方法2我却没有加,但是输出的效果却是一样的。

二、去除重复的值

如果有a,b和b,a这样的情况,就删除b,a,当然数字也一样;

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

实现方法1:

解释:for(i=1;i<=NF;i++)a[i]=$i;将每一列中的二个字段放到数组中,asort(a),这个数组进行排序,后面的代码是将数组数据输出来,通sort命令对输入的数据进行排序,相同数据会排在一起,通过uniq来进行去除相同的列。这种方法比较有通用性,不光适合二列,三列,四列都行。不过效率差了点。

实现方法2:

解释:方法2的二种写法,出来的结果是一样的,a[$0];没有赋值也没有报错,为什么呢?awk在遇到这样没有定义的变量时,会给它一个初值。if (!($2 OFS $1 in a))表示返转字段不在数组a中,这里所说的在,表示key是不是存在,不是值。print 不写默认是一行。

实现方法3:

解释:!a[$1_$2]++&&!a[$2_$1]++等于if(!a[$1_$2]++&&!a[$2_$1]++),对于首次出现的记录,a[$2_$1]的值是未定义的,由于后面的 ++ 是数学计算,所以a[$2_$1]会被赋值成数字0,也是由于 ++ 操作符,会先取值,再计算,从左到右 ++ 运算符的优先级大于!运算符的,所以对于第一行记录实际上是if(! 0) print $0 ! 是取反,0 是假,! 0 就是真,那么就会执行后面的 print $0对于后面出现的重复记录,a[$0] 经过 ++ 的计算已经变为 1、2、3 。。。而 ! 1 ! 2 ! 3 ... 都为假,不会打印。

三、awk的局部变量

这个例子来说明一下,awk怪异的局部变量

把都是数字的行,最大的那个数字加起来,第一行是2,第二行是3,每四行是3,第五行是4,总和是

在max方法里面,变量sum是会影响外面的,这里的sum是全局的。[root@krlcgcms mytest]# awk -f add.sh sumsum=

[root@krlcgcms mytest]# awk -f add.sh sumsum=

shell自定义函数的6个特点总结 最近系统的学习了一下shell的函数,总体感觉根其他语言的函数差不多,不过它也有自身的特点一,调用函数必须在定义函数的后,不然会报错的funfun(){

shell备份文件、重命名文件、删除指定文件的3个脚本分享 因为经常会用到shell脚本,所以经常会写一些,但是我从来没有系统的学习过shell脚本,遇到问题,就去看手册,或者google一下,到了一定的程度才发现

总结的7个shell字符串操作方法和实例分享 每一种语言都有他独自的字符串操作方法,shell也一样,下面以以例子的方式,简单介绍常用方法。1,取得字符串长度string=abc//等号二边不要有空

标签: awk实现wc功能

本文链接地址:https://www.jiuchutong.com/biancheng/371588.html 转载请保留说明!

上一篇:shell中的循环语句、判断语句实例(shell中的循环语句有哪些)

下一篇:shell自定义函数的6个特点总结(shell自定义命令)

  • 应交税费是什么类
  • 预付加油充值卡可以报销吗
  • 2021年销售农机免增值税吗
  • 小规模纳税人可以开数电专票吗
  • 关联企业债资比 企业所得税
  • 用友取消操作在哪里
  • 销售额负数怎么报税
  • 财务报表和信息的区别
  • 租房违约金怎么计算,怎么写
  • 1元转让股权账务实
  • 关联的公司
  • 开具简易计税房租发票怎样填写增值税申报表
  • 银行收到一笔款可以分开入账吗
  • 银行付款退汇怎么做账
  • 公司银行社保代缴怎么交
  • 餐饮管理公司设哪些科目
  • 为什么利润表的财务费用与利息费用逻辑不对
  • 计提增值税附加税的会计科目
  • 对公账户的利息收入如何入账
  • 运输服务费和运输费分别计入什么科目
  • 房租押金未全额缴纳
  • 电脑怎么设置色盲模式
  • 鼠标怎么设置为右键功能
  • kjournald是什么进程
  • linux字体不清晰
  • nicconfigsvc.exe - nicconfigsvc是什么进程 有什么用
  • php初学者用什么软件
  • 企业合并按合并的法律形式分类
  • 收到的担保费如何记账
  • 出口退税科目 月底如何结转
  • 公转私备注用途
  • 货币资金属于
  • 作废的专票能认证过去吗
  • 商家为消费者提供餐具
  • 图像深度算法
  • vue.js如何安装
  • 织梦怎么导入数据库
  • 企业什么时候才能按工龄退休
  • 金融企业会计科目有哪些
  • 异地工作人员管理
  • 个体户营业额一般填多少
  • 进项税额转出忘记申报咋办
  • 免税农产品发票需要勾选吗
  • mysql的环境配置
  • 补缴以前年度的印花税会计分录
  • 合作社收到政府补贴会计分录
  • 哪些合同不需要缴纳印花税的通知
  • 公共电话亭设计案例
  • 如果企业长期股票怎么办
  • 记账凭证错误要重开吗
  • 小规模年末怎么做账
  • 房产税减免退税怎么操作
  • 代驾服务费属于哪个税收编码
  • 什么是批发零售市场
  • 什么是开办费包括
  • 财产清查存在的问题及原因分析
  • mysql2003错误如何解决10061
  • 主板不支持u盘装系统怎么办
  • rundll32.exe在哪个文件夹
  • 苹果电脑mac系统怎么升级
  • mac邮件应用规则
  • 如何限制网速不让孩子玩游戏
  • win10开机黑屏进入不了系统界面
  • win8怎么改文件格式
  • WIN10系统如何修复
  • win8如何切换用户登录
  • window10 360
  • win10新版磁贴
  • jquery实战
  • IE6,IE7和firefox对DIV的支持区别
  • jquery滚动条滚动到指定位置
  • 批处理系统定义
  • unity一运行就停止工作
  • 利用python中的scikit-learn对疫情数据挖掘
  • 欢迎使用本公司智能语音电动车
  • jQuery插件是什么
  • 税务所是县级机构吗
  • 广东佛山超市排名
  • 宾馆增值税专用发票可以抵扣
  • 如何下载电子国税app
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设