位置: 编程技术 - 正文

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

编辑:rootadmin

推荐整理分享awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:awk实现文件中45列交换,awk实现for循环按行遍历,awk实现for循环按行遍历,awk实现group by,awk实现for循环的写法,awk实现wc功能,awk实现for循环的写法,awk实现字符串拼接,内容如对您有帮助,希望把文章链接给更多的朋友!

最近看到论坛里面有几个不错的小例子,对于学习awk还是有帮助,在这儿详细的说一下

一、类似数据库中的left join查询

要求输出结果是,aaa,,,ddd,rts,

实现方法:

解释:当NR和FNR相同时,这就说明在对第一个文件进行操作,a[$1]=$2表示,建立一个数组,以第一个字段为下标,第二个字段为值。当NR!=FNR时,说明在对第二个文件进行操作,注意:这个时候的$1和前面的$1不是同一个东西了,前面的$1表示的是a.txt的第一个字段,而后面的$1表示的是b.txt的第一个字段。a[$1]表示以b.txt中第一个字段的为下标的值,如果a[$1]有值的话,说明也存在于a.txt文件中,这样就把数据print出来就行了。

实现方法2:

解释:-v OFS=","这个是设置输出时的列分割符,$1 in a这个是b.txt文件中的第一列的值是不是在数组a的key中,这个对做程序的来说很好理解,各种语言当中都有这样的用法,或者函数。例如,php中有in_array函数。比较一下,方法1和方法2中的print,方法1我加了双引号,方法2我却没有加,但是输出的效果却是一样的。

二、去除重复的值

如果有a,b和b,a这样的情况,就删除b,a,当然数字也一样;

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

实现方法1:

解释:for(i=1;i<=NF;i++)a[i]=$i;将每一列中的二个字段放到数组中,asort(a),这个数组进行排序,后面的代码是将数组数据输出来,通sort命令对输入的数据进行排序,相同数据会排在一起,通过uniq来进行去除相同的列。这种方法比较有通用性,不光适合二列,三列,四列都行。不过效率差了点。

实现方法2:

解释:方法2的二种写法,出来的结果是一样的,a[$0];没有赋值也没有报错,为什么呢?awk在遇到这样没有定义的变量时,会给它一个初值。if (!($2 OFS $1 in a))表示返转字段不在数组a中,这里所说的在,表示key是不是存在,不是值。print 不写默认是一行。

实现方法3:

解释:!a[$1_$2]++&&!a[$2_$1]++等于if(!a[$1_$2]++&&!a[$2_$1]++),对于首次出现的记录,a[$2_$1]的值是未定义的,由于后面的 ++ 是数学计算,所以a[$2_$1]会被赋值成数字0,也是由于 ++ 操作符,会先取值,再计算,从左到右 ++ 运算符的优先级大于!运算符的,所以对于第一行记录实际上是if(! 0) print $0 ! 是取反,0 是假,! 0 就是真,那么就会执行后面的 print $0对于后面出现的重复记录,a[$0] 经过 ++ 的计算已经变为 1、2、3 。。。而 ! 1 ! 2 ! 3 ... 都为假,不会打印。

三、awk的局部变量

这个例子来说明一下,awk怪异的局部变量

把都是数字的行,最大的那个数字加起来,第一行是2,第二行是3,每四行是3,第五行是4,总和是

在max方法里面,变量sum是会影响外面的,这里的sum是全局的。[root@krlcgcms mytest]# awk -f add.sh sumsum=

[root@krlcgcms mytest]# awk -f add.sh sumsum=

shell自定义函数的6个特点总结 最近系统的学习了一下shell的函数,总体感觉根其他语言的函数差不多,不过它也有自身的特点一,调用函数必须在定义函数的后,不然会报错的funfun(){

shell备份文件、重命名文件、删除指定文件的3个脚本分享 因为经常会用到shell脚本,所以经常会写一些,但是我从来没有系统的学习过shell脚本,遇到问题,就去看手册,或者google一下,到了一定的程度才发现

总结的7个shell字符串操作方法和实例分享 每一种语言都有他独自的字符串操作方法,shell也一样,下面以以例子的方式,简单介绍常用方法。1,取得字符串长度string=abc//等号二边不要有空

标签: awk实现wc功能

本文链接地址:https://www.jiuchutong.com/biancheng/371588.html 转载请保留说明!

上一篇:shell中的循环语句、判断语句实例(shell中的循环语句有哪些)

下一篇:shell自定义函数的6个特点总结(shell自定义命令)

  • 什么是虚开增票
  • 汇算清缴补交所得税怎么做凭证
  • 坏账核销抵税
  • 自己开车差旅费报销流程怎么写
  • 零余额账户出纳做什么
  • 成本核算的三种基本方法
  • 外国人在中国工作签证
  • 个体工商户每月需要申报个税吗
  • 零申报失败什么原因
  • 索赔费用项目
  • 收到其他与筹资活动有关的现金计算公式
  • 投资企业应确认投资收益的有
  • 汇算清缴补交需要调报表吗
  • 复利现值系数和普通年金现值系数关系
  • 文化事业建设税怎么申报
  • 关于增值税专用发票
  • 小微企业免税销售额怎么算
  • 国家税务总局2017 11号
  • 如果工程款要不到的话怎么办
  • 外汇风险怎么规避
  • 施工企业原材料用于
  • iphone无法打开网页怎么办
  • m1 mac 恢复出厂
  • 自产原材料
  • 财务软件上线需注意什么
  • 交城建税的滞纳金是多少
  • 平安树的养殖方法和浇水时间
  • 购进的货物
  • php延迟2秒执行
  • 国有土地使用证到期了怎么办
  • 小规模纳税人增值税免税政策
  • web实训报告怎么写
  • 文心一言中国版
  • 用友u8反结账反记账的操作步骤
  • 计提本月银行存款应收利息会计分录
  • 百度地图api3.0
  • 印花税按金额还是价税合计交
  • 小规模超过30万怎么交增值税
  • 应税项目和非应税项目分类
  • sql默认路径在哪里
  • 电脑访问另一台电脑访问权限
  • 企业会计本年利润
  • 购买空调报销单怎么填
  • 以固定资产换入库存商品
  • 月末无收入如何申请补贴
  • 存货科目计算公式是什么
  • 损益类科目如何记忆
  • 小规模纳税人公司注册条件
  • 租写字楼可以办个体户吗
  • 银行存款负数如何计算
  • 免征增值税进项税额不得抵扣
  • 房地产会计核算地上地下成本分摊
  • rpm方式安装samba软件
  • freebsd常用命令
  • linux常用命令top
  • 意大利的福利政策
  • ubuntu下安装windows
  • auto mac
  • 如何在linux
  • xp如何升级到sp3
  • linux命令速记
  • netddeclnt.exe - netddeclnt是什么进程 有什么用
  • windows适配器未连接
  • windows7电脑无法正常运行
  • win7如何使用usb无线网卡
  • linux系统如何安装软件包
  • cocos creator 资源加密
  • dos批处理实例
  • javascript常用语句
  • jQuery实现ajax调用WCF服务的方法(附带demo下载)
  • TypeScript Type Innference(类型判断)
  • js日期格式化方法
  • javascript获取html元素的方法
  • python 汉诺塔
  • javascript中的匿名函数
  • 安徽税务网上申报领取发票
  • 广东智慧团建登录不上去怎么回事
  • 中国移动的电子协议推送服务是什么
  • 推进社会治理的路径
  • 公司借款给员工是否合法
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设