Chinaunix首页 | 论坛 | 博客
  • 博客访问: 871008
  • 博文数量: 190
  • 博客积分: 7021
  • 博客等级: 少将
  • 技术积分: 1752
  • 用 户 组: 普通用户
  • 注册时间: 2010-05-17 19:26
文章分类

全部博文(190)

文章存档

2014年(9)

2011年(32)

2010年(149)

我的朋友

分类: LINUX

2010-06-30 22:30:28

4.1 s  
引用:   函數參數 s 表示替換(substitute)文件內字串。其指令格式如下 :  
[address1[ ,address2]] s/pattern/replacemen/[flag]  
對上述格式有下面幾點說明 :  

函數參數 s 最多與兩個位址參數配合。  
關於 "s/pattern/replacement/[flag]"(註解[12]) 有下面幾點說明:  
pattern : 它為 reguler expression 字串。它表示文件中要被替換的字串。  
replacement : 它為一般字串。但其內出現下列字元有特別意義 :  

& : 代表其前 pattern 字串。例如  
sed -e 's/test/& my car/' 資料檔名     

指令中 , & 代表 pattern 字串 "test"。故執行後 , 資料檔的 "test" 被替換成 "test my car"。  
\n : 代表 pattern 中被第 n 個 \( 、\)(參照[附錄 A]) 所括起來的字串。例如  
sed -e  's/\(test\) \(my\) \(car\)/[\2 \3 \1]/' 資料檔名     

指令中 , \1 表示 "test"、\2 表示 "my"、\1 表示 "car" 字串。故執行後 , 資料檔的 "test my car" 被替換成 "[my car test]"。  
\ : 可用它來還原一些特殊符號(如上述的 & 與 \ )本身字面上的意義 , 或用它來代表換行。  
flag : 主要用它來控制一些替換情況 :  
當 flag 為 g 時 , 代表替換所有符合(match)的字串 。  
當 flag 為十進位數字 m 時 , 代表替換行內第 m 個符合的字串。  
當 flag 為 p 時 , 代表替換第一個符合 pattern 的字串後 , 將資料輸出標準輸出檔。  
當 flag 為 w wfile 時 , 代表替換第一個符合 pattern 的字串後 , 輸出到 wfile 檔內(如果 wfile 不存在 , 則會重新開啟名為 wfile 的檔案)。  
當沒有 flag 時 , 則將資料行內第一個符合 pattern 的字串以 replacement 字串來替換 。  
delimiter : 在 "/pattern/replace/[flag] " 中 "/" 被當成一 delimiter。除了空白(blank)、換行(newline) 之外 , 使用者可用任何字元作為 delimiter。例如下述編輯指令  
        s#/usr#/usr1#g 

上述命令中 \verb|#| 為 delimiter。如果用 "/" 做 delimiter , 則 sed 會將 pattern 與 replacement 中的 "/" 當成 delimiter 而發生錯誤。  
範例:  
題目 : 替換 input.dat 檔(後面如果沒有特別指定 , 均假設文件檔名為 input.dat)內 "1996" 字串成 "1997" , 同時將這些資料行存入 year97.dat 檔內。  
說明 : 用函數參數 s 指示 sed 將 "1996" 字串替換成 "1997" , 另外用 s argument 中的 flag w 指示 sed 將替換過的資料行存入 year97.dat 檔內。  
sed 命令列:  
sed -e 's/1996/1997/w year97.dat' input.dat



4.2 d 
引用: 
函數參數 d 表示刪除資料行 , 其指令格式如下: 

       [address1[ ,address2]] d  


對上述格式有下面幾點說明:  

函數參數 d 最多與兩個位址參數配合。  
sed 執行刪除動作情況如下 :  
將 pattern space 內符合位址參數的資料刪除。  
將下一筆資料讀進 pattern space 。  
重新執行 sed script。  
範例 : 可參考 section 3.3。 



4.3 a  
引用:函數參數 a 表示將資料添加到文件中。其指令格式如下:  

       [address1] a\        使用者所輸入的資料  

對上述格式有下面幾點說明: 


函數參數 a 最多與一個位址參數配合。  
函數參數 a 緊接著 "\" 字元用來表示此行結束 , 使用者所輸入的資料必須從下一行輸入。如果資料超過一行 , 則須在每行的結尾加入"\"。  
sed 執行添加動作情況如下 : 當 pattern space 內資料輸出後 , sed 跟著輸出使用者所輸入的資料。  
範例 :  
題目: 添加 "多工作業系統" 在含 "UNIX" 字串的資料行後。假設 input.dat 檔的內容如下 :  
UNIX 

說明: 用函數參數 a 將所輸入的資料添加在含 "UNIX" 字串的資料行後。  
sed 命令列如下 :  
sed -e '/UNIX/a\ 
多工作業系統 
' input.dat  

執行上述命令後 , 其輸出結果如下 :  
UNIX 
多工作業系統



4.4 i  
引用:函數參數 i 表示將資料插入文件中。其指令格式如下:  
       [address1] i\        使用者所輸入的資料 


對上述格式有下面幾點說明:  

函數參數 i 最多與一個位址參數配合。  
函數參數 i 緊接著 "\" 字元用來表示此行結束 , 使用者所輸入的資料必須從下一行輸入。如果資料超過一行 , 則須在每行的結尾加入"\"。  
sed 執行插入動作的情況如下 : 在 pattern space 內資料輸出前 , sed 先輸出使用者所輸入的資料。  
範例 :  
題目: 將 "文章版權屬於中央研究院" 插在 input.dat 檔中含 "院長 : 李遠哲" 的資料行之前。假設 input.dat 檔內容如下 :  
院長 : 李遠哲 

說明: 用函數參數 i 將資料行 "文章版權屬於中央研究院" 插在含 "院長 : 李遠哲" 的資料行之前。  
sed 命令列如下:  
sed -e '/院長 : 李遠哲/i\ 
文章版權屬於中央研究院 
' input.dat 

執行上述命令後的輸出如下 :  
文章版權屬於中央研究院 
院長 : 李遠哲



4.5 c  
引用:函數參數 c 表示改變文件中的資料。其格式如下:  
     [address1[ ,address2]]c\      使用者所輸入的資料 


對上述格式有下面幾點說明:  

函數參數 c 最多與兩個位址參數配合。  
函數參數 c 緊接著 "\" 字元用來表示此行結束 , 使用者所輸入的資料必須從下一行輸入。如果資料超過一行 , 則須在每行的結尾加入"\"。  
sed 執行改變動作的情況 : 在 pattern space 內資料輸出時 , sed 改變它成為使用者所輸入的資料。  
範例 : 參考 section 3.1 之例二、三。 



4.6 p  
引用:函數參數 p 表示印出資料。其指令格式如下 :  
     [address1[ , address2]] p  


對於上述格式有下面幾點說明 :  

函數參數 p 最多與兩個位址參數配合。  
sed 執行印出動作的情況如下 : sed 拷備一份 pattern space 內容至標準輸出檔。  
範例 : 參考 section 3.4 開頭的內容。 



4.7 l  
引用:函數參數 l , 除可將資料中的 nonprinting character 以 ASCII碼列出外 , 其於均與函數參數 p 相同。例如 , 將下面 input.dat 檔中的 ^[ 以 ASCII 碼印出  

The Great ^[ is a movie starring Steve McQueen. 

執行命令 sed -e 'l' input.dat 後 , 則輸出結果如下 :  
The Great \003 is a movie starring Steve McQueen. 
The Great     is a movie starring Steve McQueen. 

上述第二行資料為 sed 的自動輸出(請參照註解[]。 




4.8 r  
引用:函數參數 r 表示讀入它檔案內容到文件中。其指令格式如下 :  

       [address1] r 它檔名稱 


對於上述格式有下面幾點說明 :  

函數參數 r 最多與一個位址參數配合。  
在指令中 , 函數參數 r 與它檔名稱間 , 只能有一空格。  
sed 執行讀入動作的情況如下 : 在 pattern space 內資料輸出後 , sed 讀出它檔的內容跟著輸出。當它檔不存在時 , sed 照樣執行其它指令而不會有任何錯誤訊息產生。 
範例 : 參考 section 3.1 之例三。 




4.9 w  
引用:函數參數 w 表示將文件中的寫到它檔內。其指令格式如下 :  

     [address1[ ,address2]] w 它檔名稱 


對於上述格式有下面幾點說明 :  

函數參數 w 最多與兩個位址參數配合。  
在指令中 , 函數參數 w 與它檔名稱間 , 只能有一空格。  
sed 執行寫出動作的情況如 : 將 pattern space 內資料寫到它檔內。資料寫入時 , 會取代(overwrite)原來檔案內的資料。另外 , 當它檔不存在時 , sed 會重新產生(creat)它。  
範例:參考 section 3.1 之例二。 




4.10 y  
引用:函數參數 y 表示轉換資料中的字元。其指令格式如下 :  

     [address1[ ,address2]]y /xyz.../abc.../ 


對於上述格式有下面幾點說明 :  

函數參數最多配合兩個位址參數。  
指令中 , /abc.../xyz.../(x、y、z、a、b、c 代表某些字元) 為 y 的 argument 。其中 abc... 與 xyz... 的字元個數必須相同。  
sed 執行轉換時 , 將 pattern space 內資料內的 a 字元轉換成 x 字元 、b 字元轉換成 y 字元 、c 字元轉換成 z 字元 ...。  
範例:  
題目: 將 input.dat 檔中的小寫字母改成大寫。假設 input.dat 檔的內容如下 :  
Sodd's Second Law: 
        Sooner or later, the worst possible set of  
        circumstances is bound to occur. 

說明:利用函數參數 y 指示 sed 做字母大小的轉換。  
sed 命令列如下 :  
 sed -e ' 
y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/ 
' input.dat 

執行上述命令輸出結果如下 :  
SODD'S SECOND LAW: 
        SOONER OR LATER, THE WORST POSSIBLE SET OF  
        CIRCUMSTANCES IS BOUND TO OCCUR.




4.11 !  
引用:函數參數 ! 表示不執行函數參數。當有如下指令時 ,  

     [address1[ , address2]] ! 函數參數 


表示 , 對符合位址參數之資料不執行函數參數。例如刪除 , 除了含 "1996" 字串 , 所有資料行 , 則執行如下命令  

sed -e '/1996/!d' input.dat




4.12 n  
引用:函數參數 n 表示讀入下一行資料。其指令格式如下:  

     [address1[ ,address2]] n  


對上述格式有下面幾點說明 :  

函數參數 n 最多配合兩個位址參數。  
sed 執行讀入下一行動作的情況如下 :  
輸出在 pattern space 的資料。  
將下一筆資料讀到 pattern space。  
執行下一個編輯指令。  
範例(可與[section4.18]中的範例比較):  
題目 : 輸出 input.dat 檔內偶數行資料。假設 input.dat 檔內容如下:  
The 
UNIX 
Operation 
System 

說明: 在命令列上  
以選項 -n , 將資料輸出的控制權(參照[section2.5])轉給指令。  
利用函數參數 n 將下一行資料(偶數行)取代 pattern space 內的資料行(奇數行)。  
利用函數參數 p 將 pattern space 內的資料(偶數行)輸出。  
最後 , 整個輸出只有原先檔內的偶數行資料。  
sed 命令列如下 :  
sed -n -e 'n' -e 'p' infro.dat 

執行上述命令後 , 輸出的結果如下 :  
UNIX 
System



4.13 q  
引用:函數參數 q 表示跳離 sed 。其指令格式如下:  

     [address1] q  




對上述格式有下面幾點說明 :  

函數參數 q 最多配合一個位址參數。  
sed 執行跳離動作時 , 它停止輸入 pattern space 資料 , 同時停止資料送到標準輸出檔。  
範例 :  
題目: 對文件檔執行 script_file 內的編輯指令 , 除非遇到 "Linux" 字串。  
說明: 無論 script_file 內是何種指令 , 使用者只要在命令列上用指令/Linux/q , 函數參數 q 會強迫 sed 遇到 "Linux" 時做跳離動作。  
sed 命令列如下 :  
sed -e '/Linux/q' -f script_file  input.dat



4.14 =  
引用:函數參數 = 表示印出資料的行數。其指令格式如下:  

     [address1 ,[address2]] =  


對上述格式有下面幾點說明 :  

函數參數 = 最多配合兩個位址參數。  
執行時 , 行數將在資料輸出前先輸出。  
範例 :  
題目: 印出 input.dat 檔內資料行數。假設 input.dat 的內容如下 :  
The UNIX 
Operating System 

說明 : 用函數參數 = 來印出資料的行數。  
sed 命令列如下 :  
 sed -e '=' input.dat 

執行上述命令後 , 輸出的結果如下 :  

The UNIX 

Operating System


[
 本帖最后由 mocou 于 2005-12-21 20:42 编辑 ]



  回复于:2005-12-21 17:39:47

4.15 #  
引用:在 script file 內 , 函數參數 # 後的文字為注解。當注解文字超過多行時 , 其行間須以 "\" 換行字元相隔。



4.16 N  
引用:函數參數 N 表示添加下一筆資料在 pattern space 內。其指令格式如下:  

     [address1 ,[address2]] N  


對上述格式有下面幾點說明 :  

函數參數 N 最多配合兩個位址參數。  
sed 執行時 , 將下一行資料讀入並添加在 pattern space 內 , 資料行間以換行字元(embedded newline character)分隔。此外 , 在替換時 , 換行字元可用 \n 來 match。  
範例 :  
題目: 將下述兩行資料合併。假設 input.dat 的內容如下 :  
The UNIX 
Operating System 

說明 : 先利用函數參數 N 將兩行資料置於 pattern space 內 , 在利用函數參數 s/\n/ / 將兩行資料間的分隔號 \n 以空白替代 , 如此兩行資料變成一行輸出。  
sed 命令列如下 :  
 sed -e 'N' -e 's/\n/ /' input.dat 

執行上述命令後 , 其輸出的結果如下:  
The UNIX Operating System



4.17 D  
引用:函數參數 D 表示刪除 pattern space 內的第一行資料。其指令格式如下:  

     [address1,address2]D 


對上述格式有下面幾點說明 :  

函數參數 D 最多配合兩個位址參數。  
函數參數 D 與 d 的比較如下 :  
當 pattern space 內只有一資料行時 , D 與 d 作用相同。  
當 pattern space 內有多行資料行時  
D 表示只刪除 pattern space 內第一行資料 ; d 則全刪除。  
D 表示執行刪除後 , pattern space 內不添加下一筆資料 , 而將剩下的資料重新執行 sed script ; d 則讀入下一行後執行 sed script。  
範例 : 參考 section 3.3 的第二個例子。 




4.18 P  
引用:函數參數 P 表示印出 pattern space 內的第一行資料。其指令格式如下:  

     [address1,address2] P  


對上述格式有下面幾點說明 :  

函數參數 P 最多配合兩個位址參數。  
P 與 p , 除了面對的 pattern space 內的資料行數不同外 , 其它均相同。  
範例(可與[section4.12]中的範例):  
題目 : 輸出 input.dat 檔內奇數行資料。假設 input.dat 檔內容如下:  
The 
UNIX 
System 

說明: 在命令列上  
以選項 -n , 將資料輸出的控制權(參照[section2.5])轉給指令。  
利用函數參數 N 將偶數行添加至 pattern space 內奇數行後。  
利用函數參數 P 將 pattern space 內的第一行(奇數行)輸出。  
在奇數行輸出後 , pattern space 內剩下的資料行(偶數行)則被放棄輸出。最後 , 整個輸出只有原先的奇數行資料。  
sed 命令列 :  
sed -n -e 'N' -e 'P' infro.dat 

執行上述命令後 , 輸出的結果如下 :  
The 
System




4.19 h  
引用:函數參數 h 表示暫存 pattern space 的資料至 hold space。其指令格式如下:  

     [address1 ,[address2]] h  


對上述格式有下面幾點說明 :  

函數參數 h 最多配合兩個位址參數。  
sed 執行暫存動作時 , 會蓋掉(overwrite) hold space 內原來的資料。  
當 sed 全部執行結束時 , hold space 內資料會自動清除。  
範例 :參考 section 3.4 的例子。 




4.20 H  
引用:函數參數 H 與 h 唯一差別是 , sed 執行 h 時 , 資料蓋掉(overwrite) hold space 內原來的資料 , 而 H , 資料則是 "添加(append)" 在 hold space 原來資料後。例題請參考 section 3.2 之例一。 



4.21 g  
引用:   函數參數 g 表示與函數參數 h 相反的動作 , 它表示將 hold space 內資料放回 pattern space 內。其指令格式如下 :  

     [address1,address2]g 




函數參數 g 最多配合兩個位址參數。  
sed 執行放回動作時 , 資料蓋掉(overwrite)(註解[13]) pattern space 內原來的資料。  
例題 :參考 section 3.4 的例子。 




4.22 G  
引用:函數參數 G 與 g 唯一差別是 , sed 執行 g 時 , 資料蓋掉(overwrite) pattern space 內原來的資料 , 而 G , 資料則是 "添加(append)" 在 pattern space 原來資料後。例子請參考 section 3.2 例一。 



4.23 x  
引用:   函數參數 x 表示交換 hold space 與 pattern space 內的資料。其指令格式如下 :  

     [address1 ,[address2]] x  


函數參數 x 大部份與其它處理 hold space 的函數參數一起配合。例如 , 將 input.dat 檔內第 1 行資料取代第 3 行資料。此時 , 用函數參數 h 與 x 來配合。其中 , 以函數參數 h 將第 1 資料存入 hold space ; 當第 3 行資料出現在 pattern space , 以函數參數 x 交換 hold space 與 pattern space 的內容。如此 , 第 3 行資料就被第 1 資料替代。其命令列如下:  

sed -e '1h' -e '3x' input.dat




4.24 b、:label  
引用:函數參數 : 與函數參數 b 可在 sed script 內建立類似 BASIC 語言中 GOTO 指令的功能。其中 , 函數參數 : 建立標記;函數參數 b 將下一個執行的指令 branch 到標記處執行。函數參數 : 與 b , 在 script file 內配合的情況如下  
     
                   . 
                   . 
                   . 
              編輯指令m1 
              :記號 
              編輯指令m2 
                   . 
                   . 
                   .                
              [address1,[address2]]b [記號]                   

其中 , 當 sed 執行至指令 [address1,[address2]]b [記號] 時 , 如 pattern space 內的資料符合位址參數 , 則 sed 將下一個執行的位置 branch 至由 :記號(註解[14])設定的標記處 , 也就是再由 "編輯指令m2" ... 執行。另外 , 如果指令中函數參數 b 後沒有記號 , 則 sed 將下一個執行的指令 branch 到 script file 的最後 , 利用此可使 sed script 內有類似 C 語言中的 case statement 結構。
範例 :  
題目: 將 input.dat 檔內資料行的開頭字母重覆印 40 次。假設 input.dat 檔的內容如下 : 





說明: 用指令 b p1 與 :p1 構成執行增加字母的迴圈(loop) , 同時在字母出現 40 個時 , 也用指令 b 來跳出迴圈。下面就以檔內第一行資料 "A" 為例 , 描述它如何連續多添加 39 個 "A" 在同一行:  
用指令 s/A/AA/(參照 section4.1)將 "A" 替換成 "AA"。  
用指令 b p1 與 :p1 構成迴圈(loop) , 它目的使上述動作被反覆的執行。每執行一次迴圈 , 則資料行上的 "A" 就多出一個。例如 , 第一次迴圈資料行變成 "AA" , 第二次迴圈資料行變成 "AAA" ...。  
用指令 [ABC]\{40\}/b(註解[15]) 來作為停止迴圈的條件。當資料行有連續 40 個 A 出現時 , 函數參數 b 將執行的指令跳到最後 , 停止對此行的編輯。  
同樣 , 對其它資料行也如同上述的方式執行。  
sed 命令列如下 :  
sed -e '{ 
:p1 
/A/s/A/AA/ 
/B/s/B/BB/ 
/C/s/C/CC/ 
/[ABC]\{40\}/b 
b p1 
}' input.dat



4.25 t  
引用:基本上 , 函數參數 t 與 函數參數 b 的功能類似 , 除了在執行 t 的 branch 前 , 會先去測試其前的替換指令有沒有執行替換成功外。在 script file 內的情況如下:  
                   . 
                   . 
                   . 
              編輯指令m1 
              :記號 
              編輯指令m2 
                   . 
                   . 
                   . 
              s/.../.../ 
              [address1,[address2]]t [記號] 
              編輯指令m3 

其中 , 與函數參數 b 不同處在於 , 執行函數參數 t branch 時 , 會先檢查其前一個替換指令成功與否。如成功 , 則執行 branch ; 不成功 , 則不 branch , 而繼續執行下一個編輯指令 , 例如上面的編輯指令m3。  
範例:  
題目 : 將 input.dat 檔中資料 A1 替換成 C1、C1 替換成 B1、B1 替換成 A1。input.dat 檔的內容如下:  
代號 
 B1 
 A1 
 B1 
 C1  
 A1 
 C1 

說明 : input.dat 檔中全部資料行只需要執行一次替換動作 , 但為避免資料被替換多次 , 所以利用函數參數 t 在 sed script 內形成一類似 C 語言中 case statement 結構 , 使每行資料替換一次後能立即用函數參數 t 跳離替換編輯。  
sed 命令列 :  
sed -e '{ 
s/A1/C1/ 

s/C1/B1/ 

s/B1/A1/ 

}' input.dat



-------------------------------------------- 
常用的 regular expression 


-------------------------------------------------------------------------------- 

引用:常用的 regular expression  
普通字元  由普通字元所組成的 regular expression 其意義與原字串字面意義相同。   
^字串  限制字串必須出現於行首 。  
$字串  限制字串必須出現行尾。   
.  表示任意一字元。  
[...]  字元集合, 用以表示兩中括號間所有字元當中的任一個 ,如 [^...]表示兩中括號間所有字元以外的字元。  
-&  字元集合中可用"&"指定字元的範圍。   
*  用以形容其前的字元(或字元集合)可重覆任意多次 。  
\n  表示嵌入新行字元(imbedded new line character)。   
\(...\)  於 regular expression 中使用"\(" "\)"來括住一部份的 regular expression ; 其後可用"\1"來表示第一個被"\(" "\)"括住的部份。若 regular expression 中使用數次的"\(" "\)"來括住不同的部份 , 則依次使用"\1","\2","\3",...(最多可到"\9")。
阅读(2272) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~