Processing math: 100%
본문 바로가기
728x90
반응형

정규표현식4

정규표현식 sub 이용할때 주의할 점 re.search로 찾은 문자열을 그대로 re.sub를 이용해서 삭제하고 싶었다.parentheses = re.search('[\w|\W]:[\w|\W]', words)if parentheses: words = re.sub(f"parentheses.group()", '', words) re.error: missing ), unterminated subpattern at position 2 re.search안에서 escape 문자가 포함된 경우 에러가 난다.난 찾아낸 문자열 그대로를 삭제하고 싶기 때문에, 이를 escape 처리하는 문구를 넣어 주자. parentheses = re.search('[\w|\W]:[\w|\W]', words)if parentheses: word.. 2024. 11. 13.
정규표현 유용한 표현 모음집 자연어처리를 이용해 데이터를 다루다 보면 정규표현을 정말 많이 사용하게 된다.개념만 알고 사용하다가 알게된 여러 케이스들을 정리해두면 좋을 것 같아서 기록해둔다. 괄호 표현법괄호가 의미하는 바를 잘 알아야한다. 각 괄호마다 사용하는 방법이 다르기 때문에 이를 잘 이해하고 사용하면 좀 더 유용하게 정규표현을 사용할 수 있다. 1. 소괄호 () 1) 그룹화패턴을 그룹으로 묶어 하나의 단위로 처리할 때 사용한다. 예를 들어 "(apple)"이라고 사용하면 apple을 하나의 단위로 검색하게 된다. "(appple|banana)"라고 사용하면 "apple"이나 "banana"를 하나의 단위로 검색한다. 2) 캡처링그룹화 하여 매칭된 단어를 저장하는 기능이다. 캡처된 그룹은 결과에서 추출하거나 명명하여 재사용 할.. 2024. 6. 18.
[#1 실습] 정규표현식 함수 사용법 정규표현을 사용하려면 import를 해주어야 한다. 간혹 정규표현식앞에 r이 붙은 것을 볼 수 있는데 이전 버전에는 r을 붙여야 한다더라. 현재는 사용할 때 r을 안붙여도 잘 돌아간다. import re 정규표현식을 이용해서 원하는 문자열을 추출하기 위한 몇가지 함수를 소개하겠다. method search() match() findall() finditer() fullmatch() search()와 match는 매치 될때 객체를 반환하고, 없을 때 None를 반환한다. match객체란 정규식의 검색 결과로 돌려주는 객체를 말한다. re.search(패턴, 문자열, flags) 문자열 전체를 검색해 패턴과 일치하는 지를 조사하는 함수이다. 문자열이 처음부터 있는 경우 뿐만아니라 중간부터 일치하더라도 찾아준.. 2021. 12. 1.
[#1 이론] 정규표현식 정규표현식이란? (Regular Expressions) 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식언어를 말한다. 정규 표현식에서 사용되는 기호를 Meta문자라고 표현한다. 표현식에서 내부적으로 특정 의미를 가지는 문자를 말한다. 표현식 의미 ^x 문자열의 시작 xx0x?x+1x|yxy(OR)(x)xxn,mxnm(nn,n,n)..\n는 \n이 가능하다는 점이 다르다. 한 문장안에 m으로 끝나는 단어가 여러개인 경우 ?이 붙어있.. 2021. 12. 1.
728x90
반응형