04-08 18:47 长春工业大学测试工程师发布于黑龙江

关注

在 Shell 中，如何使用 awk 命令处理文本文件？

在Shell环境中，awk是一种强大的文本处理工具，适用于结构化文本的逐行处理。以下是awk的核心用法及典型场景：

一、基础语法结构

awk 'pattern {action}' [input_file]

pattern：匹配条件（可省略，默认处理所有行）
action：执行操作（需用{}包裹）
支持多命令组合：awk 'BEGIN{} /pattern/ {action1; action2} END{}'

二、核心处理能力

字段提取

# 提取第1列和第3列（默认空格/TAB分隔）
awk '{print $1, $3}' file.txt

# 自定义分隔符（-F参数）
awk -F',' '{print $2}' data.csv  # CSV文件取第二列

条件过滤

# 筛选第3列大于100的行
awk '$3 > 100 {print $0}' data.txt

# 正则匹配（包含"error"的行）
awk '/error/ {print NR ":" $0}' log.txt  # NR表示当前行号

数学运算

# 求第2列总和
awk '{sum+=$2} END {print "Total:", sum}' sales.dat

# 计算平均值
awk '{sum+=$3; count++} END {printf "Avg: %.2f\n", sum/count}' data.txt

内置变量

NR：已读记录数（行号）
NF：当前行的字段数量
FS：输入字段分隔符（默认为空格）
OFS：输出字段分隔符（默认为空格）

三、高级功能示例

预处理与后处理

# 输出表头（BEGIN块）
awk 'BEGIN {print "Name\tSalary"} $2 > 5000 {print $1, $2}' employees.txt

# 结果汇总（END块）
awk '{sum+=$4} END {print "季度总销售额:", sum}' Q1_sales.txt

字段重组

# 倒序输出字段
awk '{for(i=NF; i>=1; i--) printf "%s ", $i; print ""}' text.txt

关联数组统计

# 统计不同IP访问次数
awk '{ip_count[$1]++} END {for(ip in ip_count) print ip, ip_count[access.log]}'

四、实用技巧

多文件处理

awk '{print FILENAME ":" NR, $0}' file1.txt file2.txt  # 显示文件名+行号

字段修改

# 将第三列转为大写
awk '{$3 = toupper($3); print}' data.txt

复杂分隔符

# 处理多字符分隔符（如"|||"）
awk -F'\\|\\|\\|' '{print $2}' multiline.log

建议通过man awk查看完整手册，掌握模式匹配、自定义函数、多文件处理等进阶功能。对于复杂文本处理任务，awk的执行效率通常优于纯Shell脚本实现。

全部评论

推荐最新楼层

04-09 15:03

西安交通大学

币圈项目包装与区块链推广：从0到1打造现象级数字资产的终极指南

引言：在数字丛林中，如何让你的项目成为闪耀的星辰？当全球每天新增数十个区块链项目时，如何在信息洪流中脱颖而出？项目包装与推广已成为币圈生存的“元技能”。本文将从叙事构建、技术包装、社区运营到跨界破圈，揭示区块链项目爆红的底层逻辑，并解码未来推广新趋势。一、项目包装：用故事和技术编织价值网络1. 叙事赋能：从“代码仓库”到“数字宗教”痛点叙事：如Filecoin讲述“Web3.0存储革命”，将IPFS技术包装为对抗中心化垄断的武器愿景叙事：Solana以“区块链的操作系统”为愿景，吸引开发者共建生态价值观叙事：Uniswap的“金融自由”口号，将去中心化交易升华为数字时代的权利宣言案例拆解：Ax...

我的失利项目复盘简历中的项目经历要怎么写

点赞评论收藏

04-07 14:11

中南大学前端工程师

美团二面换岗位了

美团第二次面试换了岗位业务，这意思是重新一面嘛 #美团#

点赞评论收藏

03-28 22:31

门头沟学院 Java

美团timeline

3.3 投简历3.15 笔试3.20 一面3.25 二面3.27 OC3.28 offer

求求了给鼠鼠个offer吧：佬什么bg啊

点赞评论收藏

03-29 02:03

滴滴出行_做梦中(实习员工)

3.29许愿

许愿腾讯oc咏鹅有鹅选鹅，无鹅延毕，明年再鹅，延毕还无，建议读硕，毕业再鹅，无鹅延毕，明年再鹅，若再无鹅，建议读博，毕业再鹅，无鹅延毕，明年再鹅，延毕还无，博后可读，出站再鹅，若再无鹅，入校拼搏，评上教授，还能再鹅。已老实

点赞评论收藏

04-04 21:48

已编辑

东南大学 Java

2025.4.3 美团暑期二面 1h03min

许愿oc这个面试官也很好，上来先介绍业务，然后每次我说完了一些他觉得是合理的都会说一句没问题主要是通过简历上的项目引出了一些场景和八股问了一些实习上的东西实习项目引出场景题假设群聊表数据千万级别的，逻辑删除会使表越来越大，现在要你删除这些逻辑删除的群聊你会怎么考虑？说了两个方案 要求写出sql来给了个sql问怎么键索引？为什么？引出B+树，对比红黑树，平衡二叉树，B树？讲了下优势和原因不考虑IO问题，查一条数据用哪个数据结构更快？说了分情况，范围查询和单条数据kafka网络原因乱序问题 说了可以在消息体加一个版本号，只消费版本号大于当前标签版本号的消息redis一般可以在什么...

查看10道真题和解析

点赞评论收藏

全站热榜

拼多多信息确认

热聊中

创作者周榜

正在热议

# 正在实习的你，在做dirty work吗 #