- 相關(guān)推薦
如何在Linux中使用GNU sed
導(dǎo)語(yǔ):如何在Linux中使用GNU sed,下面是小編給大家提供的使用方法,大家可以參考閱讀,更多詳情請(qǐng)關(guān)注應(yīng)屆畢業(yè)生考試網(wǎng)。
處理 Linux 中的文本流
Linux 將程序中的輸入和輸出當(dāng)成字符流或者字符序列。在開(kāi)始理解重定向和管道之前,我們必須先了解三種最重要的I/O(輸入和輸出(Input and Output))流,事實(shí)上,它們都是特殊的文件(根據(jù) UNIX 和 Linux 中的約定,數(shù)據(jù)流和外圍設(shè)備(設(shè)備文件)也被視為普通文件)。
在 > (重定向操作符) 和 | (管道操作符)之間的區(qū)別是:前者將命令與文件相連接,而后者將命令的輸出和另一個(gè)命令相連接。
# command >file
# command1 | command2
由于重定向操作符會(huì)靜默地創(chuàng)建或覆蓋文件,我們必須特別小心謹(jǐn)慎地使用它,并且永遠(yuǎn)不要把它和管道混淆起來(lái)。在 Linux 和 UNIX 系統(tǒng)上管道的優(yōu)勢(shì)是:第一個(gè)命令的輸出不會(huì)寫(xiě)入一個(gè)文件而是直接被第二個(gè)命令讀取。
在下面的操作練習(xí)中,我們將會(huì)使用這首詩(shī)——《A happy child》(作者未知)
使用 sed
sed 是流編輯器(stream editor)的縮寫(xiě)。為那些不懂術(shù)語(yǔ)的人額外解釋一下,流編輯器是用來(lái)在一個(gè)輸入流(文件或者管道中的輸入)執(zhí)行基本的文本轉(zhuǎn)換的工具。
sed 最基本的用法是字符替換。我們將通過(guò)把每個(gè)出現(xiàn)的小寫(xiě) y 改寫(xiě)為大寫(xiě) Y 并且將輸出重定向到 ahappychild2.txt 開(kāi)始。g 標(biāo)志表示 sed 應(yīng)該替換文件每一行中所有應(yīng)當(dāng)替換的實(shí)例。如果這個(gè)標(biāo)志省略了,sed 將會(huì)只替換每一行中第一次出現(xiàn)的實(shí)例
基本語(yǔ)法:
#sed's/term/replacement/flag'file
我們的樣例:
#sed's/y/Y/g' ahappychild.txt > ahappychild2.txt
如果你要在替換文本中搜索或者替換特殊字符(如 /,\,&),你需要使用反斜杠對(duì)它進(jìn)行轉(zhuǎn)義。
例如,我們要用一個(gè)符號(hào)來(lái)替換一個(gè)文字,與此同時(shí)我們將把一行最開(kāi)始出現(xiàn)的第一個(gè) I 替換為 You。
#sed's/and/\&/g;s/^I/You/g' ahappychild.txt
在上面的命令中,眾所周知 ^(插入符號(hào))是正則表達(dá)式中用來(lái)表示一行開(kāi)頭的符號(hào)。
正如你所看到的,我們可以通過(guò)使用分號(hào)分隔以及用括號(hào)包裹來(lái)把兩個(gè)或者更多的替換命令(并在它們中使用正則表達(dá)式)連接起來(lái)。
另一種 sed 的用法是顯示或者刪除文件中選中的一部分。在下面的樣例中,將會(huì)顯示 /var/log/messages 中從6月8日開(kāi)始的頭五行。
#sed-n '/^Jun 8/ p'/var/log/messages |sed-n 1,5p
請(qǐng)注意,在默認(rèn)的情況下,sed 會(huì)打印每一行。我們可以使用 -n 選項(xiàng)來(lái)覆蓋這一行為并且告訴 sed 只需要打印(用 p來(lái)表示)文件(或管道)中匹配的部分(第一個(gè)命令中指定以“Jun 8” 開(kāi)頭的行,第二個(gè)命令中指定一到五行)。
最后,可能有用的技巧是當(dāng)檢查腳本或者配置文件的時(shí)候可以保留文件本身并且刪除注釋。下面的單行 sed 命令刪除(d)空行或者是開(kāi)頭為#的行(| 字符對(duì)兩個(gè)正則表達(dá)式進(jìn)行布爾 OR 操作)。
#sed'/^#\|^$/d' apache2.conf
uniq 命令
uniq 命令允許我們返回或者刪除文件中重復(fù)的行,默認(rèn)寫(xiě)到標(biāo)準(zhǔn)輸出。我們必須注意到,除非兩個(gè)重復(fù)的行相鄰,否則uniq 命令不會(huì)刪除他們。因此,uniq 經(jīng)常和一個(gè)前置的 sort 命令(一種用來(lái)對(duì)文本行進(jìn)行排序的算法)搭配使用。默認(rèn)情況下,sort 使用第一個(gè)字段(用空格分隔)作為關(guān)鍵字段。要指定一個(gè)不同的關(guān)鍵字段,我們需要使用 -k 選項(xiàng)。
樣例
du –sch /path/to/directory/* 命令將會(huì)以人類(lèi)可讀的格式返回在指定目錄下每一個(gè)子文件夾和文件的磁盤(pán)空間使用情況(也會(huì)顯示每個(gè)目錄總體的情況),而且不是按照大小輸出,而是按照子文件夾和文件的名稱(chēng)。我們可以使用下面的命令來(lái)讓它通過(guò)大小排序。
#du-sch /var/* | sort -h
你可以通過(guò)使用下面的命令告訴 uniq 比較每一行的前6個(gè)字符(-w 6)(這里是指定的日期)來(lái)統(tǒng)計(jì)日志事件的個(gè)數(shù),而且在每一行的開(kāi)頭輸出出現(xiàn)的次數(shù)(-c)。
#cat/var/log/mail.log |uniq-c -w6
grep 命令
grep 在文件(或命令輸出)中搜索指定正則表達(dá)式,并且在標(biāo)準(zhǔn)輸出中輸出匹配的行。
樣例
顯示文件 /etc/passwd 中用戶(hù) gacanepa 的信息,忽略大小寫(xiě)。
#grep-i gacanepa /etc/passwd
顯示 /etc 文件夾下所有 rc 開(kāi)頭并跟隨任意數(shù)字的內(nèi)容。
#ls-l /etc |grep rc[0-9]
tr 命令使用技巧
tr 命令可以用來(lái)從標(biāo)準(zhǔn)輸入中轉(zhuǎn)換(改變)或者刪除字符,并將結(jié)果寫(xiě)入到標(biāo)準(zhǔn)輸出中。
樣例
把 sortuniq.txt 文件中所有的小寫(xiě)改為大寫(xiě)。
#cat sortuniq.txt |tr[:lower:][:upper:]
壓縮ls –l輸出中的分隔符為一個(gè)空格。
#ls-l |tr-s ' '
cut 命令使用方法
cut 命令可以基于字節(jié)(-b選項(xiàng))、字符(-c)或者字段(-f)提取部分輸入(從標(biāo)準(zhǔn)輸入或者文件中)并且將結(jié)果輸出到標(biāo)準(zhǔn)輸出。在最后一種情況下(基于字段),默認(rèn)的字段分隔符是一個(gè)制表符,但可以由 -d 選項(xiàng)來(lái)指定不同的分隔符。
樣例
從 /etc/passwd 中提取用戶(hù)賬戶(hù)和他們被分配的默認(rèn) shell(-d 選項(xiàng)允許我們指定分界符,-f 選項(xiàng)指定那些字段將被提取)。
#cat/etc/passwd|cut-d:-f1,7
將以上命令結(jié)合起來(lái),我們將使用 last 命令的輸出中第一和第三個(gè)非空文件創(chuàng)建一個(gè)文本流。我們將使用 grep 作為第一過(guò)濾器來(lái)檢查用戶(hù) gacanepa 的會(huì)話(huà),然后將分隔符壓縮至一個(gè)空格(tr -s ' ')。下一步,我們將使用 cut 來(lái)提取第一和第三個(gè)字段,最后使用第二個(gè)字段(本樣例中,指的是IP地址)來(lái)排序之后,再用 uniq 去重。
#last|grep gacanepa |tr-s ‘‘|cut-d’‘-f1,3|sort-k2 |uniq
上面的命令顯示了如何將多個(gè)命令和管道結(jié)合起來(lái),以便根據(jù)我們的要求得到過(guò)濾后的數(shù)據(jù)。你也可以逐步地使用它以幫助你理解輸出是如何從一個(gè)命令傳輸?shù)较乱粋(gè)命令的(順便說(shuō)一句,這是一個(gè)非常好的學(xué)習(xí)經(jīng)驗(yàn)!)
【如何在Linux中使用GNU sed】相關(guān)文章:
Linux sed多行處理詳細(xì)總結(jié)09-26
linux中ipcs命令使用詳解10-30
如何在Linux系統(tǒng)下正確使用tar命令10-18
關(guān)于linux中tail 命令使用詳解05-20
Linux系統(tǒng)中smbclient命令的使用方法08-02
Linux下Git的使用08-02
linux 切換路徑怎么使用08-15