0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Linux中的Grep正則表達式詳細(xì)資料說明

Wildesbeast ? 來源:Linux公社 ? 作者:醉落紅塵 ? 2020-06-21 11:39 ? 次閱讀

grep是Linux中用于文本處理的最有用和功能最強大的命令之一。 grep在一個或多個輸入文件中搜索與正則表達式匹配的行,并將每條匹配的行寫入標(biāo)準(zhǔn)輸出。

在本文中,我們將探討在grep的GNU版本中如何使用正則表達式的基礎(chǔ),大多數(shù)Linux操作系統(tǒng)默認(rèn)情況下都提供此功能。

Grep正則表達式

正則表達式或正則表達式是與一組字符串匹配的模式。模式由運算符,構(gòu)造文字字符和元字符組成,它們具有特殊的含義。 GNU grep支持三種正則表達式語法,Basic,Extended和Perl兼容。

最簡單的形式是,當(dāng)沒有給出正則表達式類型時,grep會將搜索模式解釋為基本正則表達式。要將模式解釋為擴展的正則表達式,請使用-E(或--extended-regexp)選項。

在GNU的grep實現(xiàn)中,基本正則表達式和擴展正則表達式語法之間沒有功能上的區(qū)別。唯一的區(qū)別是,在基本正則表達式中,元字符?,+,{,|,(和)被解釋為文字字符。為了在使用基本正則表達式時保持元字符的特殊含義,必須使用反斜杠()對字符進行轉(zhuǎn)義。稍后我們將解釋這些和其他元字符的含義。

通常,您應(yīng)始終將正則表達式括在單引號中,以避免shell解釋和擴展元字符。

文字匹配

grep命令最基本的用法是在文件中搜索文字字符或一系列字符。例如,要在/ etc / passwd文件中顯示所有包含字符串“ bash”的行,您可以運行以下命令:

[linuxidc@localhost www.linuxidc.com]$ grep bash /etc/passwd

輸出應(yīng)如下所示:

root:x:0:0:root:/root:/bin/bash

linuxidc:x:1000:1000:linuxidc:/home/linuxidc:/bin/bash

在此示例中,字符串“ bash”是由四個文字字符組成的基本正則表達式。 這告訴grep搜索帶有緊隨其后的“ a”,“ s”和“ h”的字符串“ b”。

缺省情況下,grep命令區(qū)分大小寫。 這意味著將大寫和小寫字符視為不同的字符。 要在搜索時忽略大小寫,請使用-i選項(或--ignore-case)。

請務(wù)必注意,grep會將搜索模式作為字符串而不是單詞來查找。 因此,如果您要搜索“ gnu”,則grep還將打印“ gnu”嵌入較大字詞(例如“ cygnus”或“ magnum”)的行。

如果搜索字符串包含空格,則需要將其用單引號或雙引號引起來:

$grep “Gnome Display Manager” /etc/passwd

錨定Anchoring

Anchoring是元字符,可讓您指定必須在該行中找到匹配項的位置。

^(脫字符號)符號與一行開頭的空字符串匹配。 在以下示例中,僅當(dāng)字符串“ linux”出現(xiàn)在行的開頭時才匹配。

$grep ‘^linux’ file.txt

$(美元)符號與行首的空字符串匹配。 要查找以字符串“ linux”結(jié)尾的行,可以使用:

$grep ‘linux$’ file.txt

您還可以使用兩個錨點構(gòu)造一個正則表達式。 例如,要查找僅包含“ linux”的行,請運行:

$grep ‘^linux$’ file.txt

另一個有用的示例是匹配所有空行的^ $模式。

匹配單個字符

。(點)符號是與任何單個字符匹配的元字符。 例如,要匹配以“ kan”開頭,然后有兩個字符并以字符串“ roo”結(jié)尾的任何內(nèi)容,則可以使用以下模式:

$grep ‘kan..roo’ file.txt

括號表達式

方括號表達式允許將一組字符括在方括號[]中來匹配一組字符。 例如,找到包含“ accept”或“ accent”的行,可以使用以下表達式:

$grep ‘a(chǎn)cce[np]t’ file.txt

如果方括號內(nèi)的第一個字符是插入符號^,則它匹配方括號中未包含的任何單個字符。 以下模式將匹配以“ co”開頭的字符串的任意組合,后接除“ l”之后為“ la”的任何字母(例如“ coca”,“ cobalt”等),但不匹配包含“ cola”的行 ”:

$grep ‘co[^l]a’ file.txt

您可以在方括號內(nèi)指定一系列字符,而不是一個一個地放置字符。 通過指定以連字符分隔的范圍的第一個和最后一個字符來構(gòu)造范圍表達式。 例如,[a-a]等效于[abcde],[1-3]等效于[123]。

以下表達式匹配以大寫字母開頭的每一行:

$grep ‘^[A-Z]’ file.txt

grep還支持括號中預(yù)定義的字符類。 下表顯示了一些最常見的字符類:

QuantifierCharacter Classes

[:alnum:]字母數(shù)字字符。

[:alpha:]字母字符。

[:blank:]空格和制表符。

[:digit:]數(shù)字。

[:lower:]小寫字母。

[:upper:]大寫字母。

有關(guān)所有字符類別的完整列表,請參閱Grep手冊。

量詞

量詞Quantifier允許您指定要出現(xiàn)的匹配項必須出現(xiàn)的項數(shù)。 下表顯示了GNU grep支持的量詞:

Quantifier描述

*匹配上一項零次或多次。

?匹配上一項零或一次。

+將上一項匹配一次或多次。

{n}將前一項精確匹配n次。

{n,}至少匹配n個項目。

{,m}最多匹配m次以上項。

{n,m}將前一項匹配n至m次。

*(星號)字符與前面的項目匹配零次或多次。 以下將匹配“right”,“sright”,“ssright”等等。

$grep ‘s*right’

下面是更高級的模式,它匹配所有以大寫字母開頭,以句點或逗號結(jié)尾的行。 .* 正則表達式匹配任意數(shù)量的任何字符:

$grep -E ‘^[A-Z].*[。,]$’ file.txt

? (問號)字符使前一項為可選,并且只能匹配一次。 以下將同時匹配“bright”和“right”。 ? 字符以反斜杠轉(zhuǎn)義,因為我們使用的是基本正則表達式:

$grep ‘b?right’ file.txt

下面是使用擴展正則表達式的同一個正則表達式:

$grep -E ‘b?right’ file.txt

+(加號)字符與前面的項目匹配一次或多次。 以下將匹配“sright”和“ssright”,但不匹配“right”:

$grep -E ‘s+right’ file.txt

大括號字符{}使您可以指定確切的數(shù)字,上限或下限或發(fā)生匹配必須發(fā)生的范圍。

以下內(nèi)容匹配3到9位之間的所有整數(shù):

$grep -E ‘[[:digit:]]{3,9}’ file.txt

交替Alternation

交替是一個簡單的“或”。替換操作符| (pipe)允許您指定不同的可能匹配,可以是文字字符串或表達式集。該操作符在所有正則表達式操作符中優(yōu)先級最低。

在下面的例子中,我們搜索Nginx日志錯誤文件中出現(xiàn)的所有單詞fatal, error和critical:

$grep ‘fatal|error|critical’ /var/log/nginx/error.log

如果使用擴展正則表達式,則不應(yīng)轉(zhuǎn)義運算符|,如下所示:

$grep -E ‘fatal|error|critical’ /var/log/nginx/error.log

分組

分組是正則表達式的一項功能,可讓您將模式分組在一起并將其作為一項引用。 使用括號()創(chuàng)建組。

使用基本正則表達式時,必須用反斜杠()對括號進行轉(zhuǎn)義。

下面的示例同時匹配“ fearless”和“ less”。 ? 量詞使(fear)組成為可選的:

$grep -E ‘(fear)?less’ file.txt

反斜杠特殊表達式

GNU grep包含幾個元字符,由反斜杠和常規(guī)字符組成。 下表顯示了一些最常見的特殊反斜杠表達式:

ExpressionDescription

單詞鎖定符

《在單詞開頭匹配一個空字符串。

》在單詞末尾匹配一個空字符串。

w匹配一個單詞。

s匹配一個空格。

以下模式將匹配單獨的單詞“ abject”和“ object”。 如果嵌入較大的單詞,則不會匹配這些單詞:

$grep ‘[ao]bject’ file.txt

總結(jié)

正則表達式用于文本編輯器,編程語言和命令行工具,例如grep,sed和awk。 在搜索文本文件,編寫腳本或過濾命令輸出時,了解如何構(gòu)造正則表達式將非常有幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11171

    瀏覽量

    208475
  • GNU
    GNU
    +關(guān)注

    關(guān)注

    0

    文章

    143

    瀏覽量

    17434
收藏 人收藏

    評論

    相關(guān)推薦

    nginx正則表達式和location路徑匹配指南

    前言,我這里驗證的nginx-v1.23.2單機環(huán)境下的nginx正則表達式、location路徑匹配規(guī)則和優(yōu)先級。
    的頭像 發(fā)表于 09-29 16:02 ?192次閱讀
    nginx<b class='flag-5'>中</b>的<b class='flag-5'>正則表達式</b>和location路徑匹配指南

    求助,以下恒流源電路Io的計算表達式怎么計算?

    這個恒流源電路Io的計算表達式怎么計算,求給出詳細(xì)計算過程
    發(fā)表于 08-22 08:16

    鴻蒙原生應(yīng)用元服務(wù)開發(fā)-倉頡基本概念表達式(二)

    。for-in 表達式的基本形式為: for (迭代變量 in 序列) { 循環(huán)體 } 其中“循環(huán)體”是一個代碼塊。“迭代變量”是單個標(biāo)識符或由多個標(biāo)識符構(gòu)成的元組,用于綁定每輪遍歷由迭代器指向的數(shù)據(jù),可以
    發(fā)表于 08-09 14:26

    鴻蒙原生應(yīng)用元服務(wù)開發(fā)-倉頡基本概念表達式(一)

    實參等。此外,因為倉頡是強類型的編程語言,所以倉頡表達式不僅可求值,還有確定的類型。 倉頡編程語言的各種表達式將在后續(xù)章節(jié)逐一介紹,本節(jié)介紹最常用的條件表達式、循環(huán)
    發(fā)表于 08-08 10:27

    求助,有關(guān)表達式選項卡(ADS)的問題求解

    你好。 我看不到表達式選項卡的某些變量值。 數(shù)組的大小顯然是 256,但我最多只能看到 100。 請問問題出在哪里? 謝謝。
    發(fā)表于 06-03 06:23

    mapgis屬性篩選表達式

    篇文章,我們將詳細(xì)討論MapGIS的屬性篩選表達式,包括語法、操作符和函數(shù)等。 屬性篩選表達式是一種在MapGIS中用于指定要素選擇條件的代碼。它由一組操作符、函數(shù)和屬性字段組成,用
    的頭像 發(fā)表于 02-25 10:58 ?1291次閱讀

    西門子博途的算術(shù)表達式

    算術(shù)表達式既可以是一個數(shù)字值,也可以是由帶有算術(shù)運算符的兩個值或表達式組合而成。 算術(shù)運算符可以處理當(dāng)前 CPU 所支持的各種數(shù)據(jù)類型。如果在該運算中有 2 個操作數(shù),那么可根據(jù)以下條件來確定結(jié)果的數(shù)據(jù)類型。
    的頭像 發(fā)表于 01-24 11:36 ?870次閱讀

    你還不會gvim正則表達式?一文搞懂!

    gvim正則表達式常在命令行模式下使用,一般用于文本文件字符串的替換、刪除等操作。
    的頭像 發(fā)表于 01-19 16:47 ?1042次閱讀

    Linux常用命令自學(xué)手冊》+Linux簡單指令筆記

    --verbose:顯示復(fù)制過程詳細(xì)信息。 此外,cp命令還有其他選項,如-a、-b、-d、-l等。 grep命令: grep命令是一種強大的文本搜索工具,能夠使用
    發(fā)表于 01-05 08:44

    更快的tsv解析代碼分享

    使用正則解析的正則表達式很簡單, 這里直接給代碼, 為了避免重復(fù)編譯正則表達式和重新分配內(nèi)存報錯結(jié)果列表, 這里將她們作為參數(shù)傳給解析函數(shù).
    的頭像 發(fā)表于 12-29 09:45 ?371次閱讀
    更快的tsv解析代碼分享

    GVIM正則表達式介紹和使用示例

    的Ken Thompson借用這個概念并將它應(yīng)用到了文本編輯器。后面正則表達式的說法進入到了大家常用的vi、vim、gvim當(dāng)中。
    的頭像 發(fā)表于 12-18 15:09 ?1034次閱讀
    GVIM<b class='flag-5'>正則表達式</b>介紹和使用示例

    一文詳解Java表達式引擎選型

    AviatorScript 是一門高性能、輕量級寄宿于 JVM 之上的腳本語言。AviatorScript 可將表達式編譯成字節(jié)碼。它原來的定位一直只是一個表達式引擎,不支持 if/else 條件
    的頭像 發(fā)表于 12-06 10:57 ?1702次閱讀
    一文詳解Java<b class='flag-5'>表達式</b>引擎選型

    SIMATIC S7-1500 PLC S7-SCL表達式詳解

    表達式為了計算一個終值所用的公式,它由地址(變量)和運算符組成。表達式的規(guī)則如下。
    的頭像 發(fā)表于 11-28 09:36 ?951次閱讀
    SIMATIC S7-1500 PLC S7-SCL<b class='flag-5'>表達式</b>詳解

    linux正則表達式匹配字符串

    是非常重要的。本文將詳細(xì)介紹Linux正則表達式的基本語法和常見用法,幫助讀者深入了解并靈活運用正則表達式。 第一部分:正則表達式的基本語法
    的頭像 發(fā)表于 11-23 10:26 ?650次閱讀

    什么是正則表達式正則表達式如何工作?哪些語法規(guī)則適用正則表達式?

    正則表達式又稱規(guī)則表達式(Regular Expression,在代碼中常簡寫為 regex、regexp 或 RE),是一種用于匹配、查找、替換文本的強大工具。它能夠以特定的模式匹配字符串,從而
    的頭像 發(fā)表于 11-03 14:41 ?2295次閱讀
    什么是<b class='flag-5'>正則表達式</b>?<b class='flag-5'>正則表達式</b>如何工作?哪些語法規(guī)則適用<b class='flag-5'>正則表達式</b>?