更新時間:2021-07-09 來源:黑馬程序員 瀏覽量:
如果需要對一個正則表達式重復使用,那么可以使用compile()函數(shù)對其進行預編譯,以避免每次編譯正則表達式的開銷。complie()函數(shù)語法格式如下:
compile(pattern, flags=0)上述格式中的參數(shù)pattern表示一個正則表達式,參數(shù)flags用于指定正則匹配的模式,該參數(shù)的常用取值如表1所示。
表11-1 常用的匹配模式
flags | 說明 |
---|---|
re.I | 忽略大小寫 |
re.L | 做本地化識別(locale-aware)匹配,使預定義字符集\w、\W、\b、\B、\s、\S取決于當前區(qū)域設定 |
re.M | 多行匹配,影響^和$ |
re.S | 使.匹配所有字符,包括換行符 |
re.U | 根據(jù)Unicode字符集解析字符 |
re.A | 根據(jù)ASCII字符集解析字符 |
re.X | 允許使用更靈活的格式(可以是多行、忽略空白字符、可加入注釋)書寫正則表達式,以便表達式更易理解 |
import re regex_obj = re.compile(r'\d')
以上第2行代碼中,通過compile()函數(shù)將正則的匹配模式“\d”預編譯為正則對象regex_obj。
假設當前有一組字符串“Today is March 28, 2019.”,通過正則對象regex_obj的findall()方法就可以查找到所有的匹配結果,示例代碼如下:
words = 'Today is March 28, 2019.' print(regex_obj.findall(words))以上示例中的findall()函數(shù)用于獲取目標文本中所有符合條件的內容。
運行代碼,結果如下所示:
['2', '8', '2', '0', '1', '9']
如果想要匹配一組字符串中所有的英文字母,可通過設置flags參數(shù)忽略英文字母的大小寫,具體代碼如下:
import re regex_one = re.compile(r'[a-z]+', re.I) words = 'Today is March 28, 2019.' print(regex_one.findall(words))
上述代碼中的匹配模式“[a-z]+”表示匹配最少匹配一次小寫英文字母,當設置flags參數(shù)為re.I后該匹配模式便會忽略英文字母的大小寫,匹配結果將會包含字符串words中的所有英文字母。
運行代碼,結果如下所示:
['Today', 'is', 'March']