본문 바로가기

정규표현식

(2)
정규표현식 활용 with Python 파이썬에서 정규표현식의 활용은 re라는 모듈을 가져와서 사용한다. import re re의 자세한 사용법은 https://docs.python.org/ko/3/library/re.html 레퍼런스에 있으니, 헷갈리는 부분이 있으면 참고하자. match(pattern, string, flag) string의 시작부터 pattern에 매치되는 문자열을 반환한다. search는 string의 아무 위치에서나 패턴을 찾을 수 있지만, match는 string의 시작부터 패턴과 매치되지 않으면 찾지 못한다는 차이점에 유의하자. test = '24eq2refda4.' result = re.match('\d+',test) #'24'를 찾아냄. result2 = re.match('[a-z]+',test) # 아무것도 ..
정규표현식 기초 정규표현식(Regular expression)의 필요성 정규표현식은 긴 문자열속에서 자신이 원하는 패턴을 찾기 위해 사용된다. 예를 들어, 여러 학생의 정보가 저장된 데이터셋에서 학생의 전화번호만 찾는다거나 특정 사이트의 html를 분석하여 원하는 정보를 찾아낼때 유용하다. 정규표현식의 기초 메타문자 \ / ^ $ . | * + ? { } \ : 특정 문자셋을 나타낼 때 사용. 혹은 메타문자를 문자 자체로 표현하기 위해 사용. / : 패턴 구분자 시작 및 끝 ^ : 문자열의 시작 $ : 문자열의 종료 . : 와일드 카드. 아무 문자열 매칭 | : 패턴 변경자 * : 0개 이상의 매칭되는 문자열 + : 1개 이상의 매칭되는 문자열 ? : 0 or 1개만 매칭되는 문자열 {} : 매칭되는 개수를 지정 [] ..