Caracteres regulares | Descrição |
---|---|
\ | Marca o próximo caractere como um caractere especial, um caractere literal, uma aspa invertida ou um escape octal. Por exemplo, "n " corresponde ao caractere "n "。"\n " corresponde a um caractere de nova linha. Serial"\\ " corresponde a "\ " e "\( "corresponde"( "。 |
^ | corresponde ao início da cadeia de caracteres de entrada. Se a propriedade Multiline do objeto RegExp estiver definida, ^ também corresponderá a "\n " ou "\r " seguido de uma posição. |
$ | corresponde à posição final da cadeia de caracteres de entrada. Se a propriedade Multiline do objeto RegExp estiver definida, $ também corresponderá a "\n " ou "\r " antes da posição. |
* | Corresponde à subexpressão anterior zero ou mais vezes. Por exemplo, zo* pode corresponder a "z " e também "zoo ". * é equivalente a {0,}. |
+ | Corresponde à subexpressão anterior uma ou mais vezes. Por exemplo, "zo+ " pode corresponder a "zo " e também "zoo ", mas não pode corresponder a "z ". + é equivalente a {1,}. |
? | Corresponde à subexpressão anterior zero ou uma vez. Por exemplo, "do(es)? " pode corresponder a "does " ou "does " em "do ".? Equivalente a {0,1}. |
{n} | n é um número inteiro não negativo. A correspondência é determinadan vezes. Por exemplo, "o{2} " não pode corresponder a "Bob " em "o ", mas pode corresponder a ambos os o's em "food " em ambos os o's. |
{n,} | n é um número inteiro não negativo. Corresponde a pelo menosn vezes. Por exemplo, "o{2,} " não pode corresponder a "Bob " em "o ", mas pode combinar todos os o's em "foooood " para todos os o's em " "."o{1,} "é equivalente a "o+ "。"o{0,} "é então equivalente a "o* "。 |
{n,m} | m en são ambos números inteiros não negativos, onden<=m . Corresponde a pelo menosn vezes e no máximom vezes. Por exemplo, "o{1,3} " corresponderia aos três primeiros o's em "fooooood " para os três primeiros o's em "o{0,1} " é equivalente a "o? ". Observe que não pode haver espaço entre uma vírgula e dois números. |
? | Quando esse caractere é imediatamente seguido por qualquer um dos outros caracteres de restrição (*,+,? , {n},{n,},{n,m }), o padrão de correspondência é não-corretivo. O padrão non-greedy corresponde ao menor número possível de cadeias de caracteres pesquisadas, enquanto o padrão padrão greedy corresponde ao maior número possível de cadeias de caracteres pesquisadas. Por exemplo, para a cadeia de caracteres "oooo ","o+? " corresponderá a uma única "o ", enquanto "o+ " corresponderá a todas as "o "。 |
. | corresponde a qualquer cadeia de caracteres única, exceto "\ n " para qualquer caractere único, exceto ". Para corresponder a qualquer caractere, inclusive "\ n ", use um padrão como "(.|\n) " padrão. |
(pattern) | Corresponde ao padrão e obtém essa correspondência. A correspondência resultante pode ser obtida na coleção Matches resultante, usando a coleção SubMatches no VBScript ou o atributo $0...$9 no JScript. Para fazer a correspondência de caracteres entre parênteses, use os atributos "\( " ou "\) "。 |
(?:pattern) | corresponde ao padrão, mas não busca o resultado, ou seja, é uma correspondência não buscável que não é armazenada para uso posterior. Isso é feito com o uso do caractere or "(|) " para combinar partes de um padrão é útil. Por exemplo, "industr(?:y|ies) " é uma expressão mais curta do que "industry|industries " é uma expressão mais abreviada. |
(?=pattern) | Pré-verificação afirmativa positiva que corresponde à cadeia de caracteres de pesquisa no início de qualquer cadeia de caracteres que corresponda ao padrão. Essa é uma correspondência não buscada, o que significa que a correspondência não precisa ser buscada para uso posterior. Por exemplo, "Windows(?=95|98|NT|2000) " pode corresponder a "Windows2000 " em "Windows ", mas não pode corresponder a "Windows3.1 " em "Windows ". As pré-verificações não consomem caracteres, ou seja, depois que ocorre uma correspondência, a busca pela próxima correspondência começa imediatamente após a última correspondência, e não após o caractere que contém a pré-verificação. |
(?!pattern) | As pré-verificações negativas positivas correspondem à string de pesquisa no início de qualquer string que não corresponda ao padrão. Essa é uma correspondência sem busca, o que significa que a correspondência não precisa ser buscada para uso posterior. Por exemplo, "Windows(?!95|98|NT|2000) " pode corresponder a "Windows3.1 " em "Windows ", mas não pode corresponder a "Windows2000 " em "Windows ". As pré-verificações não consomem caracteres, ou seja, depois que ocorre uma correspondência, a busca pela próxima correspondência começa imediatamente após a última correspondência, e não após o caractere que contém a pré-verificação |
(?<=pattern) | As pré-checagens afirmativas reversas são análogas às pré-checagens afirmativas diretas, exceto na direção oposta. Por exemplo, "(?<=95|98|NT|2000)Windows " pode corresponder a "2000Windows " em "Windows ", mas não pode corresponder a "3.1Windows " em " "Windows "。 |
(?<!pattern) | O pré-condicionamento negativo reverso é análogo ao pré-condicionamento negativo direto, exceto na direção oposta. Por exemplo, "(?<!95|98|NT|2000)Windows " pode corresponder a "3.1Windows " em "Windows ", mas não pode corresponder a "2000Windows " em " "Windows "。 |
x|y | corresponde a x ou y. Por exemplo, "z|food " pode corresponder a "z " ou "food "。"(z|f)ood ", então corresponde a "zood " ou "food "。 |
[xyz] | Conjunto de caracteres. Corresponde a qualquer um dos caracteres incluídos. Por exemplo, "[abc] " pode corresponder a "plain " no conjunto de caracteres "a "。 |
[^xyz] | Conjunto de caracteres negativos. Corresponde a qualquer caractere não incluído. Por exemplo, "[^abc] " pode corresponder a "plain " no intervalo de caracteres "p "。 |
[a-z] | Intervalo de caracteres. Corresponde a qualquer caractere no intervalo especificado. Por exemplo, "[a-z] " pode corresponder a caracteres de "a " a "z " para qualquer caractere minúsculo no intervalo. |
[^a-z] | Intervalo de caracteres negativos. Corresponde a qualquer caractere arbitrário que não esteja no intervalo especificado. Por exemplo, "[^a-z] " pode corresponder a qualquer caractere que não esteja no intervalo de "a " a "z " de caracteres arbitrários. |
\b | Corresponde a um limite de palavra, o que significa a posição entre a palavra e um espaço. Por exemplo, "er\b " pode corresponder a "never " em "er ", mas não pode corresponder a "verb " em " "er "。 |
\B | corresponde a limites de não palavras. "er\B " pode corresponder a "verb " em "er ", mas não pode corresponder a "never " em " "er "。 |
\cx | Corresponde a um caractere de controle especificado por x. Por exemplo, \cM corresponde a um caractere Control-M ou retorno de carro. x deve ter um valor de A-Z ou a-z. Caso contrário, trate c como um caractere "c " original. |
\d | Corresponde a um caractere numérico. Equivale a [0-9]. |
\D | Corresponde a um caractere não numérico. Equivale a [^0-9]. |
\f | Corresponde a um caractere de quebra de página. Equivale a \x0c e \cL. |
\n | Corresponde a um caractere de avanço de linha. Equivale a \x0a e \cJ. |
\r | Corresponde a um caractere de retorno de carro. Equivale a \x0d e \cM. |
\s | Corresponde a qualquer caractere de espaço em branco, incluindo espaços, tabulações, quebras de página e assim por diante. Equivale a [ \f\n\r\t\v]. |
\S | Corresponde a qualquer caractere de espaço não branco. Equivale a [ ^ \f\n\r\t\v]. |
\t | Corresponde a um caractere de tabulação. Equivale a \x09 e \cI. |
\v | Corresponde a uma tabulação vertical. Equivale a \x0b e \cK. |
\w | Corresponde a qualquer caractere de palavra que inclua um sublinhado. Equivale a "[A-Za-z0-9_] "。 |
\W | Corresponde a qualquer caractere que não seja de palavra. Equivale a "[^A-Za-z0-9_] "。 |
\xn | Corresponde an onden é o valor de escape hexadecimal. O valor de escape hexadecimal deve ter dois dígitos definidos. Por exemplo, "\x41 " corresponde a "A "。"\x041 " seria equivalente a "\x04&1 ". A codificação ASCII pode ser usada em expressões regulares. . |
\num | Matchnum , ondenum é um número inteiro positivo. Uma referência à correspondência obtida. Por exemplo, "(.)\1 " corresponde a dois caracteres idênticos consecutivos. |
\n | Identifica um valor de escape octal ou uma referência retroativa. Se \n for precedido por pelo menosn as subexpressões forem buscadas, entãon é uma referência retroativa. Caso contrário, sen for um número octal (0-7), entãon é um valor de escape octal. |
\nm | Identifica um valor de escape octal ou uma referência retroativa. Se \nm for precedido por pelo menosnm uma subexpressão get, entãonm é uma referência retroativa. Se \nm foi precedido por pelo menosn número de aquisições, entãon é uma referência retroativa seguida pelo textom de uma referência anterior. Se nenhuma das condições anteriores for atendida, sen em forem números octal (0-7), então \nm corresponderá ao valor de escape octalnm。 |
\nml | Sen for um número octal (0-3), e m e l são ambos números octais (0-7), então \ corresponderá ao valor de escape octalnml。 |
\un | corresponde an onden é um caractere Unicode representado por quatro dígitos hexadecimais. Por exemplo, \u00A9 corresponde ao símbolo de copyright (©). |
Nome de usuário | /^[a-z0-9_-]{3,16}$/ |
---|---|
Senha | /^[a-z0-9_-]{6,18}$/ |
Senha2 | (?=^.{8,}$)(?=.*\d)(?=.*\W+)(?=.*[A-Z])(?=.*[a-z])(?!.*\n).*$ (consiste em números/letras maiúsculas/letras minúsculas/sinais de pontuação, todos os quatro devem estar presentes, 8 ou mais dígitos) |
Valor hexadecimal | /^#?([a-f0-9]{6}|[a-f0-9]{3})$/ |
/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/ /^[a-z\d]+(\. [a-z\d]+)*@([\da-z](-[\da-z])?) +(\. {1,2}[a-z]+)+$/ ou\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* | |
URL | /^(https?:\/\/)? ([\da-z\. -]+)\. ([a-z\.] {2,6})([\/\w \...-]*)*\/? -]*)*\/? $/ ou[a-zA-z]+://[^\s]* |
Endereço IP | /((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)/ /^(? :(? :25[0-5]|2[0-4][0-9]|[01]? [0-9][0-9]?) \.) {3}(? :25[0-5]|2[0-4][0-9]|[01]? [0-9][0-9]?) $/ ou((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?) |
Tags HTML | /^<([a-z]+)([^<]+)*(? :>(. *)<\/\1>|\s+\/>)$/ ou<(.*)(.*)>.*<\/\1>|<(.*) \/> |
Remover código \\\\ comentários | (?<!http:|\S)//.*$ |
Corresponder caracteres de byte duplo (inclusive kanji) | [^\x00-\xff] |
Kanji (caracteres) | [\u4e00-\u9fa5] |
Gama de caracteres chineses no código Unicode | /^[\u2E80-\u9FFF]+$/ |
Pontuação chinesa e de largura total (caracteres) | [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee] |
Data (ano-mês-dia) | (\d{4}|\d{2})-((0?([1-9]))|(1[1|2]))-((0?[1-9])|([12]([1-9]))|(3[0|1])) |
Data (mês/dia/ano) | ((0?[1-9]{1})|(1[1|2]))/(0?[1-9]|([12][1-9])|(3[0|1]))/(\d{4}|\d{2}) |
Hora (hora:minuto, sistema de 24 horas) | ((1|0?)[0-9]|2[0-3]):([0-5][0-9]) |
Número de telefone fixo da China continental | (\d{4}-|\d{3}-)?(\d{8}|\d{7}) |
Número de telefone celular da China continental | 1\d{10} |
Código postal da China | [1-9]\d{5} |
Número da carteira de identidade da China continental (15 ou 18 dígitos) | \d{15}(\d\d[0-9xX])? |
Número inteiro não negativo (número inteiro positivo ou zero) | \d+ |
Número inteiro positivo | [0-9]*[1-9][0-9]* |
Número inteiro negativo | -[0-9]*[1-9][0-9]* |
Número inteiro | -?\d+ |
Fracionário | (-?\d+)(\.\d+)? |
Linhas em branco | \n\s*\r ou \n\n(editplus) ou ^[\s\S ]*\n |
Número QQ | [1-9]\d{4,} |
Palavras que não contêm abc | \b((?!abc)\w)+\b |
Corresponde ao primeiro e ao último caracteres em branco | ^\s*|\s*$ |
Comumente usadas por editores | Aqui estão algumas substituições para caracteres chineses especiais (editplus) ^[0-9].*\n ^[^th]. \^[^th]. ^[Exercise]. *\n ^[\s\S ]*\n ^[0-9]*\. ^[\s\S ]*\n <p[^<>*]> href="javascript:if\(confirm\('(.*?)'\)\)window\.location='(.*?)'" <span style=".[^"]*rgb\(255,255,255\)">.[^<>]*</span> <DIV class=xs0>[\s\S]*?</DIV> |
Sintaxe de expressão regular para você tabela de pesquisa rápida de expressões regulares comumente usadas, consulta de sintaxe de expressão regular, sintaxe de expressão regular comumente usada, sintaxe básica de expressão regular, sintaxe de subexpressão, modificador de expressão regular, modo de expressão regular com ganância, modo de expressão regular sem ganância, por meio de uma maneira simples e rápida de obter o controle da cadeia de caracteres.