同時(shí)能夠非常快速精準(zhǔn)的處理一系列比較復(fù)雜的字符串的檢索、替換和提取,具有快速匹配文本進(jìn)行信息抽取的特點(diǎn)。普通字符,非打印字符,通用字符,原子表這些字符組成了正則的基本部分。描述和分析文本內(nèi)容可以適用正則表達(dá)式進(jìn)行文本匹配,一般的文本字符都是可以通過(guò)一定的轉(zhuǎn)化為對(duì)應(yīng)的正則表達(dá)式的形式。
正則表達(dá)式雖然描述能力強(qiáng),但是若要實(shí)現(xiàn)匹配功能,還要進(jìn)行等價(jià)轉(zhuǎn)化。復(fù)雜的正則語(yǔ)義邏輯會(huì)增加時(shí)間和空間的復(fù)雜度,因此,正則表示不太利于大規(guī)模集合的構(gòu)造和高速的數(shù)據(jù)流匹配。
本文地址:http://cdrpkj.cn//article/28160.html