원하는 패턴을 찾을 때 regex(정규표현식)을 사용합니다.
python에서 re 모듈에서 정규식을 사용하는 방법을 알아봅시다.
메타 문자
정규표현식에서 사용되는 메타 문자들의 의미를 알아봅시다.
re 모듈
re파이썬에서 re모듈로 정규식을 사용하는 방법을 알려줍니다.
정규표현식 컴파일
파이썬에서 정규표현식을 사용하기 위해 re
모듈을 import 후 re.compile()
를 하여 사용할 수 있습니다.
1
2
3
import re
변수 = re.compile('정규표현식')
패턴 객체 메소드
re 객체는 match()
, search()
, findall()
, findite()
4가지의 메소드를 제공합니다.
메서드/어트리뷰트 | 목적 |
---|---|
match() | 문자열의 시작 부분에서 RE가 일치하는지 판단합니다. |
search() | 이 RE가 일치하는 위치를 찾으면서, 문자열을 훑습니다. |
findall() | RE가 일치하는 모든 부분 문자열을 찾아 리스트로 반환합니다. |
findite() | RE가 일치하는 모든 부분 문자열을 찾아 이터레이터로 반환합니다. |
매치 객체 메소드
패턴 객체의 메서드를 통해 리턴된 매치 객체는 아래와 같은 정보를 담고 있다.
1
<_sre.SRE_Match object; span=(매치 시작지점 인덱스, 매치 끝지점 인덱스), match='매치된 문자열'>
매치 객체는 group()
, start()
, end()
, span()
4가지의 메소드를 제공합니다.
메서드/어트리뷰트 | 목적 |
---|---|
group() | 매치된 문자열 출력 |
start() | 매치 시작지점 인덱스 출력 |
end() | 매치 끝지점 인덱스 출력 |
span() | (start(), end())를 튜플로 출력 |
정리하며
이외에도 파이썬에서 정규표현식을 사용할 수 있는 방법은 다양하게 더 있으므로 그때그때 구글링하면 될 것같다. :D