파이썬 정규표현식 예제

Off
Non classé

정규식의 « 그룹 » 기능을 사용하면 일치하는 텍스트의 일부를 선택할 수 있습니다. 사용자 이름과 호스트를 별도로 추출하려는 전자 메일 문제를 가정해 보겠습니다. 이렇게 하려면 사용자 이름 주위에 괄호 () () 를 추가하고 패턴에 호스트를 추가합니다. 이 경우 괄호는 패턴이 일치하는 내용을 변경하지 않고 대신 일치 텍스트 내부에 논리적 « 그룹 »을 설정합니다. 성공적인 검색에서 match.group(1)은 첫 번째 왼쪽 괄호에 해당하는 일치 텍스트이고 match.group(2)은 2번째 왼쪽 괄호에 해당하는 텍스트입니다. 일반 match.group()은 여전히 평소와 같이 전체 일치 텍스트입니다. 먼저 가능한 가장 간단한 정규식에 대해 알아보겠습니다. 정규식은 문자열에서 작동하기 때문에 가장 일반적인 작업인 문자 일치로 시작합니다. 코스 번호, 코드 및 이름과 일치하기 위해 각각 3 개의 개별 정규식을 컴파일했습니다. 정규표현식에는 특수 문자와 일반 문자를 모두 포함할 수 있습니다. `A`, `a` 또는 `0`과 같은 대부분의 일반 문자는 가장 간단한 정규 표현식입니다. 그들은 단순히 자신을 일치.

일반 문자를 연결할 수 있으므로 마지막 문자열 `last`와 일치합니다. (이 섹션의 나머지 부분에서는 일반적으로 따옴표없이이 특별한 스타일로 RE를 작성하고 문자열은 `단일 따옴표로`일치합니다.) 정규표현식은 텍스트 패턴을 일치시키는 강력한 언어입니다. 이 페이지에서는 파이썬 연습에 충분한 정규식 자체에 대한 기본 소개를 제공하고 정규식이 파이썬에서 어떻게 작동하는지 보여줍니다. 파이썬 « re » 모듈은 정규식 지원을 제공합니다. 파이썬은 현재 scanf()와 동등하지 않습니다. 정규식은 일반적으로 scanf() 형식 문자열보다 더 자세한 내용이지만 더 강력합니다. 아래 표에서는 scanf() 형식 토큰과 정규식 간에 더 많거나 적은 수준의 매핑을 제공합니다. 을 참조하십시오.

메타 문자이기 때문에 특별히 처리해야 합니다. 캐릭터 클래스에 넣었습니다. 또한 후행 을 통지 $; 이 문자열의 나머지 부분을 확장에 포함 해야 합니다. 이 정규식은 foo.bar 및 autoexec.bat 및 sendmail.cf 및 printers.conf와 일치합니다. 이제 s에서 «  »를 제거하면 어떻게되는지 볼 수 있습니다. 출력에는 `s`알파벳이 없으며 문자열에서 « 를 제거하고 « s »를 일반 문자로 평가하여 문자열에서 « s »를 찾을 때마다 단어를 분할하기 때문입니다. 정규식이 있는 일반적인 워크플로는 원하는 부분에 대한 패턴을 작성하고 괄호 그룹을 추가하여 원하는 부분을 추출하는 것입니다. 이 메서드는 첫 번째 일치 후 중지되므로 데이터를 추출하는 것보다 정규식을 테스트하는 데 가장 적합합니다. 정규식의 일치항목으로 문자열을 분할합니다. 캡처 괄호가 RE에서 사용되는 경우 해당 내용도 결과 목록의 일부로 반환됩니다.

Comments are closed.