이 문서는 파이썬 2점대를 기준으로 작성되었습니다.
10장 정규식
1-1 반복 메타 문자
반복 메타 문자 |
의미 |
예 |
* |
0회 이상 반복 |
ca*t는 ct, cat, caat, caaaat등과 매치 |
+ |
1회 이상 반복 |
ca+t는 cat, caaaat등과 매치 |
? |
0회 혹은 1회 |
ca?t는 ct, cat와 매치된다. |
{m} |
m회 반복 |
ca{2}는 caa와 매치된다. |
{m,n} |
m회부터 n회까지 반복 |
ca{2,4}t는 caat, caaat, caaaat와 매치 |
1-2 매칭 메타 문자
. : - 줄바꿈 문자를 제외한 모든 문자와 매치 (re.DOTALL모드 사용하면 줄바꿈 문자 매치)
^ : - 문자열의 시작과 매치
- [] 메타 기호 안에서 반대의 문자열의 취함 [^5]는 5가 아닌 문자
$ : - 문자열의 마지막과 매치
- [] 메타 기호안에서는 메타 기호로 사용되지 않고 순수한 $문자로 매치된다.
[] : - 문자 집합을 나타낸다. ( [abc]는 ‘a’, ‘b’, ‘c’중 한 문자를 의미. == [a-c])
- [a-zA-Z0-9]는 영문자 숫자를 의미
| : - a|b는 a 또는(or) b의 의미
() : - 정규식을 그룹으로 묶는다.
[이스케이프 기호]
\\ : 역슬래쉬 문자 자체를 의미한다.
\d : 모든 숫자와 매치된다. [0-9]
\D : 숫자가 아닌 문자와 매치된다. [^0-9]
\s : 화이트 스페이스 문자와 매치된다. [\t\n\r\f\v]
\S : 화이트 스페이스 문자가 아닌 것과 매치된다. [^\t\n\r\f\v]
\w : 숫자 또는 문자와 매치된다. [a-zA-Z0-9_]
\W : 숫자 또는 문자가 아닌 것과 매치된다. [^a-zA-Z0-9_]
\b : 단어의 경계를 나타낸다. 단어는 영문자 혹은 숫자의 연속 문자열로 가정한다.
\B : \b의 반대로 단어의 경계가 아님을 나타낸다.
※출처 : 프리렉 파이썬_이강성 저
[ 참고 ] 파이썬 정리 포스팅들
--------------------------------------------------
[파이썬] python 문자열 함수정리
[파이썬] python 리스트 함수정리
[파이썬] python 튜플 함수정리
-------------------------------------------------------------------------------
'Language > python' 카테고리의 다른 글
파이썬의 신비로움(for문-else문에 대해서) (0) | 2015.02.25 |
---|---|
python 파이썬에서 ^M지우기, 행끝의 캐럿 M지우기 (0) | 2014.05.27 |
[파이썬] python 함수 함수정리 (0) | 2014.05.23 |
[파이썬] python 파일 함수정리 (0) | 2014.05.23 |
[파이썬] python 객체의 복사 및 형 변환 함수정리 (0) | 2014.05.23 |