学习grep(参数)选项

2023-10-29

grep一般格式为:
grep [选项] 基本正则表达式 [文件]
这里基本正则表达式可为字符串。
1.1 双引号引用
   在grep命令中输入字符串参数时,最好将其用双引号括起来。例如:“m y s t r i n g”。这样做有两个原因,一是以防被误解为s h e l l命令,二是可以用来查找多个单词组成的字符串,例如:
“jet plane”,如果不用双引号将其括起来,那么单词p l a n e将被误认为是一个文件,查询结果
将返回“文件不存在”的错误信息。
   在调用变量时,也应该使用双引号,诸如: grep“$ M Y VA R”文件名,如果不这样,将
没有返回结果。
   在调用模式匹配时,应使用单引号。
1.2 grep选项
常用的grep选项有:
-c 只输出匹配行的计数。
-i 不区分大小写(只适用于单字符)。
-h 查询多文件时不显示文件名。
-l 查询多文件时只输出包含匹配字符的文件名。
-n 显示匹配行及行号。
-s 不显示不存在或无匹配文本的错误信息。
-v 显示不包含匹配文本的所有行。
1.3 查询多个文件
   如果要在当前目录下所有.doc文件中查找字符串"sort",方法如下:
$ grep "sort"*.doc
   或在所有文件中查询单词“ sort it”
$ grep "sort it" *
现在讲述在文本文件中grep选项的用法。
(假如有文本文件data.f,内容如下:
47 Oct 3zl1998 LPSX 43.00 kvm90 512
48 Dec 3BC1997 LPSX 68.00 LVX2A 138
219 Dec 2cc1999 CAD 23.00 PLV2C 68
216 sept 3zl1998 usp 86.00 kvm9m 234
483 Sept 5ap1996 USP 65.00 LVX2C 189
484 nov 7pl1996 CAD 49.00 PLV2C 234
483 MAY 5PA1998 USP 37.00 KVM90 644
)
1.4 行匹配
$ grep -c "48" data.f
$ 4
grep返回数字4,意义是有4行包含字符串“48”。
现在显示包含"48"字符串的4行文本:
$ grep "48" data.f
48 Dec 3BC1997 LPSX 68.00 LVX2A 138
483 Sept 5ap1996 USP 65.00 LVX2C 189
484 nov 7pl1996 CAD 49.00 PLV2C 234
483 MAY 5PA1998 USP 37.00 KVM90 644
1.5 行数
显示满足匹配模式的所有行行数:
$ grep -n "48" data.f
1:48 Dec 3BC1997 LPSX 68.00 LVX2A 138
2:483 Sept 5ap1996 USP 65.00 LVX2C 189
3:484 nov 7pl1996 CAD 49.00 PLV2C 234
4:483 MAY 5PA1998 USP 37.00 KVM90 644
行数在输出第一列,后跟包含4 8的每一匹配行。
1.6 显示非匹配行
显示所有不包含48的各行:
$ grep -v "48" data.f
47 Oct 3zl1998 LPSX 43.00 kvm90 512
219 Dec 2cc1999 CAD 23.00 PLV2C 68
216 sept 3zl1998 usp 86.00 kvm9m 234
1.7 精确匹配
在上例中,抽取字符串"48",返回结果包含诸如484和483等包含"4 8"的其他字符串,实际上应精确抽取只包含48的各行。注意在每个匹配模式中抽取字符串
后有一个<ab>键,所以应操作如下:
$ grep "48<tab>" data.f
48 Dec 3BC1997 LPSX 68.00 LVX2A 138
<Tab>表示点击tab键。
使用grep抽取精确匹配的一种更有效方式是在抽取字符串后加\>。假定现在精确抽取48,方法如下:
$ grep `48\>` data.f
48 Dec 3BC1997 LPSX 68.00 LVX2A 138
1.8 大小写敏感
   缺省情况下, grep是大小写敏感的,如要查询大小写不敏感字符串,必须使用- i开关。在data.f文件中有月份字符Sept,既有大写也有小写,要取得此字符串大小写不敏感查询,方法如下:
$ grep -i "sept" data.f
483 Sept 5ap1996 USP 65.00 LVX2C 189
216 sept 3zl1998 usp 86.00 kvm9m 234

使用正则表达式使模式匹配加入一些规则,因此可以在抽取信息中加入更多选择。使用正则表达式时最好用单引号括起来,这样可以防止g r e p中使用的专有模式与一些s h e l l命令的特殊方式相混淆
2.1 模式范围
   假定要抽取代码为4 8 4和4 8 3的城市位置,上一章中讲到可以使用[ ]来指定字符串范围,这
里用4 8开始,以3或4结尾,这样抽出4 8 4或4 8 3。
$ grep '48[34]' data.f
483 Sept 5ap1996 USP 65.00 LVX2C 189
484 nov 7pl1996 CAD 49.00 PLV2C 234
483 MAY 5PA1998 USP 37.00 KVM90 644
2.2 不匹配行首
如果要抽出记录,使其行首不是4 8,可以在方括号中使用^记号,表明查询在行首开始。
$ grep '^[^48]' data.f
219 Dec 2cc1999 CAD 23.00 PLV2C 68
216 sept 3zl1998 usp 86.00 kvm9m 234
2.3 设置大小写
   使用- i开关可以屏蔽月份S e p t的大小写敏感,也可以用另一种方式。这里使用[ ]模式抽取
各行包含S e p t和s e p t的所有信息。
$ grep '[Ss]ept' data.f
216 sept 3zl1998 usp 86.00 kvm9m 234
483 Sept 5ap1996 USP 65.00 LVX2C 189
   如果要抽取包含S e p t的所有月份,不管其大小写,并且此行包含字符串4 8 3,可以使用管
道命令,即符号“|”左边命令的输出作为“ |”右边命令的输入。举例如下:
$ grep '[Ss]ept' data.f | grep 483
483 Sept 5ap1996 USP 65.00 LVX2C 189
不必将文件名放在第二个g r e p命令中,因为其输入信息来自于第一个g r e p命令的输出。
2.4 匹配任意字符
如果抽取以L开头,以D结尾的所有代码,可使用下述方法,因为已知代码长度为5个字符:
$ grep 'X...D' data.f
47 Oct 3zl1998 LPSX 43.00 kvm90 512
483 Sept 5ap1996 USP 65.00 LVX2C 189
将上述代码做轻微改变,头两个是大写字母,中间两个任意,并以C结尾:
$ grep '[A-Z][A-Z]...C' data.f
219 Dec 2cc1999 CAD 23.00 PLV2C 68
483 Sept 5ap1996 USP 65.00 LVX2C 189
484 nov 7pl1996 CAD 49.00 PLV2C 234
2.5 日期查询
   一个常用的查询模式是日期查询。先查询所有以5开始以1 9 9 6或1 9 9 8结尾的所有记录。使用模式5..199[6,8]。这意味着第一个字符为5,后跟两个点,接着是1 9 9,剩余两个数字是6或8。
$ grep '5..199[6,8]' data.f
483 Sept 5ap1996 USP 65.00 LVX2C 189
483 MAY 5PA1998 USP 37.00 KVM90 644
   查询包含1 9 9 8的所有记录的另外一种方法是使用表达式[ 0 - 9 ] \ { 3 \ } [ 8 ],含义是任意数字重复3次,后跟数字8,虽然这个方法不像上一个方法那么精确,但也有一定作用。
$ grep '[0-9]\(3\)[8]' data.f
47 Oct 3zl1998 LPSX 43.00 kvm90 512
216 sept 3zl1998 usp 86.00 kvm9m 234
483 Sept 5ap1996 USP 65.00 LVX2C 189
2.6 范围组合
必须学会使用[]抽取信息。假定要取得城市代码,第一个字符为任意字符,第二个字符在0到5之间,第三个字符在0到6之间,使用下列模式即可实现。
$ grep '[0-9][0-5][0-6]' data.f
47 Oct 3zl1998 LPSX 43.00 kvm90 512
48 Dec 3BC1997 LPSX 68.00 LVX2A 138
219 Dec 2cc1999 CAD 23.00 PLV2C 68
216 sept 3zl1998 usp 86.00 kvm9m 234
483 Sept 5ap1996 USP 65.00 LVX2C 189
484 nov 7pl1996 CAD 49.00 PLV2C 234
483 MAY 5PA1998 USP 37.00 KVM90 644
   这里返回很多信息,有想要的,也有不想要的。参照模式,返回结果是正确的,因此这里还需要细化模式,可以以行首开始,使用^符号:
$ grep '^[0-9][0-5][0-6]' data.f
216 sept 3zl1998 usp 86.00 kvm9m 234
这样可以返回一个预期的正确结果。
2.7 模式出现机率
抽取包含数字4至少重复出现两次的所有行,方法如下:
$ grep '4\{2,\}' data.f
483 MAY 5PA1998 USP 37.00 KVM90 644
上述语法指明数字4至少重复出现两次。同样,抽取记录使之包含数字9 9 9(三个9),方法如下:
$ grep '9\{3,\}' data.f
219 Dec 2cc1999 CAD 23.00 PLV2C 68
如果要查询重复出现次数一定的所有行,语法如下,数字9重复出现两次:
$ grep '9\{2\}' data.f
   有时要查询重复出现次数在一定范围内,比如数字或字母重复出现2到6次,下例匹配数字8重复出现2到6次,并以3结尾:
$ grep '6\{2,6}3' myfile
83 - no match
888883 - match
8884 - no match
88883 - match
2.8 使用grep匹配“与”或者“或”模式
   grep命令加- E参数,这一扩展允许使用扩展模式匹配。例如,要抽取城市代码为219或216,方法如下:
$ grep -E '219|216' data.f
219 Dec 2cc1999 CAD 23.00 PLV2C 68
216 sept 3zl1998 usp 86.00 kvm9m 234
2.9 空行
结合使用^和$可查询空行。使用- n参数显示实际行数:
$ grep '^$' myfile
2.10 匹配特殊字符
查询有特殊含义的字符,诸如$ . ' " * [] ^ | \ + ? ,必须在特定字符前加\。假设要查询包含"."的所有行,脚本如下:
$ grep '\.' myfile
或者是一个双引号:
$ grep '\"' myfile
以同样的方式,如要查询文件名conftroll.conf(这是一个配置文件),脚本如下:
$ grep 'conttroll\.conf' myfile
2.11 查询格式化文件名
   使用正则表达式可匹配任意文件名。系统中对文本文件有其标准的命名格式。一般最多六个小写字符,后跟句点,接着是两个大写字符。例如,要在一个包含各类文件名的文件filename.deposit中定位这类文件名,方法如下:
$ grep '[^a-z]\{1,6/}\.[^A-Z]\{1,2/}' myfile
yrend.AS - match
monthdf - nomatch
soa.pp - match
qp.RR - match
2.12 查询IP地址
   查询DNS服务是日常工作之一,这意味着要维护覆盖不同网络的大量I P地址。有时地址I P会超过2 0 0 0个。如果要查看n n n . n n n网络地址,但是却忘了第二部分中的其余部分,只知有两个句点,例如n n n . n n . .。要抽取其中所有nnn.nnn IP地址,使用[0-9]\{3\}\.[0-0\ {3\}\。含义是任意数字出现3次,后跟句点,接着是任意数字出现3次,后跟句点。
$ grep '[0-9]\{3\}\.[0-0\[3\}\.' ipfile

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

学习grep(参数)选项 的相关文章

  • 如何从引用的表达式匹配中获取模块、函数等的 F# 名称

    我继续开发 F 引用表达式的打印机 它不一定是完美的 但我想看看有什么可能 中的活跃模式Microsoft FSharp Quotations Patterns and Microsoft FSharp Quotations Derived
  • F# 引用的另一个限制?

    今天早些时候 我遇到了 F 引用的限制 并在这里提出了一个问题 F 引号 变量可能会转义作用域 https stackoverflow com questions 6414185 f quotations variable may esca
  • 为什么无法在 F# 项目中添加子文件夹?

    在大多数 NET项目中 我可以使用文件夹来组织代码文件 在 C 中 我不能 但过滤器最终会扮演相同的角色 但是 在 Visual Studio 2010 中的 F 中 我不能 每个代码文件都直接显示在项目目录中 为什么这个功能不可用 组织包
  • true 和布尔列表 f# 的长度

    直接使用递归 写一个函数truesAndLength bool list gt int int那 返回列表的长度 在该对的第一个组件中 以及列表的数量 列表中正确的元素 在第二个组件中 你的函数必须只迭代 遍历列表的元素一次 请勿使用 Li
  • obj[] 和 string[] 作为参数

    我在用Microsoft FSharp Reflection FSharpValue MakeUnion这需要一个Reflection UnionCaseInfo and an obj 可以为空 作为参数 但是 我得到了Type misma
  • 如何从 f# 返回一个空元组到 c#? [复制]

    这个问题在这里已经有答案了 我有这个类型正确的 C 函数 static System Tuple
  • 如何使用 WebSharper 在服务器上生成 Google Visualizations 数据

    我的目标是能够在服务器上为 Google Visualizations 生成数据 然后将其作为 java 脚本传递给客户端 以便可以将其呈现为折线图 我下面的示例可以正确编译 但在浏览器中呈现时会产生错误 在服务器上构建 DataCommo
  • Async.AwaitTask 在 f# 中如何工作?

    我知道 f 和 c 异步模型之间的主要区别在于 在 f 中 除非您调用 Async RunSynchronously 之类的内容 否则异步执行不会开始 在 C 中 当方法返回任务时 通常 并非总是 立即在后台线程中开始执行 Async Aw
  • 如何在.NET Core上直接调用F#编译器?

    UPD 我想直接从 NET Core SDK 调用 F 编译器 即 fsc 我了解 dotnet build co 但当我只需要编译一个简单的问题时 即 fsc file fs 就足够的情况下 我不想涉及它们 我尝试在 NET Core S
  • 对 F# 中任意嵌套级别的列表求和

    我正在尝试创建一个 F 函数 它将返回列表的总和int任意嵌套 IE 它将适用于list
  • 使用反射创建 Action<'T> 的实例

    我将如何创建一个实例Action lt T gt 使用反射 这是我所拥有的 let makeAction typ Type f T gt unit let actionType typedefof
  • 为什么我必须将 Async 包装到另一个异步工作流程中并让!它?

    我试图了解 F 中的异步工作流程 但我发现有一部分我真的不明白 下面的代码工作正常 let asynWorkflow async let result Stream TryOpenAsync partition gt Async Await
  • 使用列表匹配绑定值(没有编译器警告)

    假设我有一个需要一些时间的函数int参数 但在其中我将使用float32 我不想使用float32 i无处不在的功能 相反 我想这样做 let x float32 x let y float32 y let w float32 w let
  • 函数式编程是否避免了状态?

    根据维基百科 http en wikipedia org wiki Functional programming 函数式编程是一种编程范式 它将计算视为数学函数的评估避免状态和可变数据 强调我的 这是真的吗 我个人的理解是 它使状态更加明确
  • 我应该强制使用 F# 测量单位的类型吗? [风格与一般性]

    这个问题与 F 相关计量单位 https learn microsoft com en us dotnet fsharp language reference units of measure 我应该为我正在使用的单元强制执行类型吗 例如
  • 使用 WCF 的契约优先 SOA

    这个问题更多的是探索人们在社区中 在实际情况中所做的事情 而不是一个有针对性的问题 我对此进行了相当广泛的搜索 虽然我发现很多博主都提倡契约优先的服务设计 并且有一些评论支持它们 但我还没有找到很多关于使用 WCF 实现契约优先的实用信息
  • .Net 中可用的并行技术

    我是 Net 平台的新手 我查了一下 发现 Net中有几种做并行计算的方法 任务并行库中的并行任务 即 Net 3 5 PLINQ Net 4 0 异步编程 Net 2 0 异步主要用于执行 I O 繁重的任务 F 有简洁的语法支持这一点
  • 如何在 F# 中执行 Seq.takeWhile + 一项

    我想编写一个使用谓词过滤序列的函数 但结果还应该包括谓词返回 false 的第一个项目 如果 F 中有一个break关键字 逻辑将是这样的 let myFilter predicate s seq for item in s do yiel
  • F#:仅对第一个事件执行一次操作,没有可变性/锁定?

    我有这段代码 可以下载文件并在控制台中告诉我该文件有多大 use webClient new WebClient let lockObj new Object let mutable firstProgressEvent true let
  • 您能给我解释一下 OCaml 函子吗? [复制]

    这个问题在这里已经有答案了 可能的重复 在函数式编程中 什么是函子 https stackoverflow com questions 2030863 in functional programming what is a functor

随机推荐

  • Linux中级实战讲解--Mysql-galera集群

    Galera Cluster 介绍 Galera是一个MySQL 也支持MariaDB Percona 的同步多主集群软件 主要功能 同步复制 Active active的多主拓扑结构 真正的multi master 即所有节点可以同时读写
  • Android 10.0 禁用插入耳机时弹出的保护听力对话框

    1 前言 在10 0的系统开发中 在某些产品中会对耳机音量调节过高限制 在调高到最大音量的70 的时候 会弹出音量过高弹出警告 所以产品 开发的需要要求去掉这个音量弹窗警告功能 2 禁用插入耳机时弹出的保护听力对话框的核心类 framewo
  • 什么是物模型?阿里小米京东物模型规则对比

    什么是物模型 物模型是产品数字化的描述 定义了产品的功能 物模型将不同品牌不同品类的产品功能抽象归纳 形成 标准物模型 便于各方用统一的语言描述 控制 理解产品功能 物模型由若干条 参数 组成 参数按描述的功能类型不同 又分为属性 方法和事
  • shc gzexe 将shell脚本转换为二进制的可执行文件

    第一种方法 gzexe 这种加密方式不是非常保险的方法 但是能够满足一般的加密用途 可以隐蔽脚本中的密码等信息 它是使用系统自带的gzexe程序 它不但加密 同时压缩文件 使用方法 gzexe file sh它会把原来没有加密的文件备份为
  • Netty源码解析系列三:Netty与Tomcat的区别

    Netty与Tomcat的区别 作用不同 Tomcat 是 Servlet 容器 可以视为 Web 服务器 而 Netty 是异步事件驱动的网络应用程序框架和工具用于简化网络编程 例如TCP和UDP套接字服务器 协议不同 Tomcat 是基
  • Random.Range 范围

    第一 Random Range随机数问题 时间20141212 今天在开发中用到随机数 差点就错过了 没注意这个问题 for int ooi 0 ooi lt 5000 ooi int hhh Random Range 0 3 if hhh
  • latex 参考文献没有显示_LaTeX 中的参考文献

    LaTeX 的对参考文献的处理实在是非常的方便 我用过几次 有些体会 写出来供大家 参考 当然 自己的功力还不够深 有些地方问题一解决就罢手了 没有细究 LaTeX 对参考文献的处理有这么一些优点 1 可以维护一个 bib 文件 在你的整个
  • 系统架构技能之设计模式-组合模式

    一 上篇回顾 我们上篇主要讲述了结构型模式中的外观模式 外观模式作为结构型模式中的一个简单又实用的模式 外观模式通过封装细节来提供大粒度的调用 直接的好处就是 封装细节 提供了应用写程序的可维护性和易用性 外观模式一般应用在系统架构的服务层
  • 【转】Vector与ArrayList区别

    the following is from http blessed24 javaeye com blog 751336 1 Vector ArrayList 1 Vector的方法都是同步的 Synchronized 是线程安全的 thr
  • 以太坊DAO之时间锁定Multisig

    Decentralized Autonomous Organization 简称DAO 以太坊中重要的概念 一般翻译为去中心化的自治组织 有时候 时间也可以用作一种很好的安全机制 以下代码基于DAO区块链大会 但有不同的变化 不是每个操作需
  • IdWorker---分布式ID工具类

    IdWorker 分布式ID工具类 import java lang management ManagementFactory import java net InetAddress import java net NetworkInter
  • ip地址的转换与递增

    void a void unsigned long addr inet addr 192 168 0 1 addr ntohl addr addr addr htonl addr char a 0x20 in addr in in S un
  • jenkins 发送邮件失败

    jenkins 配置发送邮件 发送测试邮件 邮件发送失败 Failed to send out e mail javax mail MessagingException Could not connect to SMTP host loca
  • C语言中的弱符号与强符号介绍

    弱符号 Weak symbol 是链接器 ld 在生成ELF Executable and Linkable Format 缩写为ELF 可执行和可链接格式 是一种用于可执行文件 目标文件 共享库和核心转储的标准文件格式 ELF文件有两种索
  • Git如何拉项目

    summary 放置 pub文件后 直接clone即可 Git设置SSH命令 ssh keygen t rsa C dong dong是用户名 passphrase是在私钥上又加了一层加码 一般直接回车不用设置 Git拉项目需要在项目服务器
  • JVM优化(OOM,内存溢出),查看线程快照,堆内存情况等问题

    1 堆大小 新生代 老年代 新生代 Young 与老年代 Old 的比例的值为 1 2 该值可以通过参数 XX NewRatio 来指定 2 Xmn参数总是应当小于 Xmx参数 否则就会触发OOM错误 3 jvm优化与查看gc回收情况 gc
  • WDK李宏毅学习笔记第二十周01_Deep Reinforcemen Learning

    Deep Reinforcemen Learning 文章目录 Deep Reinforcemen Learning 摘要 1 Reinforcemen Learning RL 是什么 1 1 RL的做法 1 1 1 Function wi
  • 6.4 PyTorch实现Skipgram模型

    欢迎订阅本专栏 PyTorch深度学习实践 订阅地址 https blog csdn net sinat 33761963 category 9720080 html 第二章 认识Tensor的类型 创建 存储 api等 打好Tensor的
  • [游戏更新]游戏更新框架的设计

    主要是通过文章来记录一下游戏更新流程的框架设计 资源打包 资源下载等 热更新的功能框架使用的是XLua 这里不做详细介绍 流程图 因为是海外游戏 考虑到GooglePlay对包体大小的限制 因此 会有一些资源做成压缩包 在特定时间进行下载
  • 学习grep(参数)选项

    grep一般格式为 grep 选项 基本正则表达式 文件 这里基本正则表达式可为字符串 1 1 双引号引用 在grep命令中输入字符串参数时 最好将其用双引号括起来 例如 m y s t r i n g 这样做有两个原因 一是以防被误解为s