728x90 반응형 전체 글76 [#1 실습] 정규표현식 함수 사용법 정규표현을 사용하려면 import를 해주어야 한다. 간혹 정규표현식앞에 r이 붙은 것을 볼 수 있는데 이전 버전에는 r을 붙여야 한다더라. 현재는 사용할 때 r을 안붙여도 잘 돌아간다. import re 정규표현식을 이용해서 원하는 문자열을 추출하기 위한 몇가지 함수를 소개하겠다. method search() match() findall() finditer() fullmatch() search()와 match는 매치 될때 객체를 반환하고, 없을 때 None를 반환한다. match객체란 정규식의 검색 결과로 돌려주는 객체를 말한다. re.search(패턴, 문자열, flags) 문자열 전체를 검색해 패턴과 일치하는 지를 조사하는 함수이다. 문자열이 처음부터 있는 경우 뿐만아니라 중간부터 일치하더라도 찾아준.. 2021. 12. 1. [#1 이론] 정규표현식 정규표현식이란? (Regular Expressions) 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식언어를 말한다. 정규 표현식에서 사용되는 기호를 Meta문자라고 표현한다. 표현식에서 내부적으로 특정 의미를 가지는 문자를 말한다. 표현식 의미 ^x 문자열의 시작 x$ 문자열의 끝 x* 문자가 0번이상 반복됨 x? 문자가 있을 수도 있고 없을 수도 있음 x+ 문자가 1번이상 반복됨 x|y x 또는 y (OR) (x) x를 그룹으로 처리 x{n,m} x가 n번 이상 m번이하 반복됨 (n만 쓰면 n번, n,를 쓰면 n번이상) 헷갈리는 것들 정리해 봤다. .은 \n을 제외한 모든 문자를 지칭하는데 $는 \n이 가능하다는 점이 다르다. 한 문장안에 m으로 끝나는 단어가 여러개인 경우 ?이 붙어있.. 2021. 12. 1. [#0] 시작 매일 생각만 하다가 벌써 1년이 지나가버렸다. 수업시간에 들었던 내용 하나하나 정리하면서 복습하는 느낌으로 정리해보자!!! 블로그에 써놓으면 찾기도 편하고 괜시리 뿌듯할 것 같으니...ㅎㅎ 시간날때마다 하는걸로! 아자아자~~!~!~!~!! 2021. 12. 1. [논문 리뷰 #1] FastText와 Bert를 이용한 자동 용어추출 FastText와 Bert를 이용한 자동 용어추출 : 최규현, 나승훈 (전북대학교 인지컴퓨팅 연구실) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00. 서론 자연어 처리의 다양한 task에서 핵심이 되는 용어를 추출하는 것은 중요하다. 방대한 데이터를 읽고 사람이 직접 용어를 뽑아내는 것은 굉장히 많은 노동력을 필요로 하는 작업이기 때문에 이를 자동으로 수행하는 자동추출 기술이 요구 되고 있다. 이 논문에서는 용어를 추출하는 모델을 2가지로 제안하고 있다. 01. 용어 추출 용어란 텍스트에서 중요한 역할을 하는 단어를 말한다. 텍스트의 주제에 관계가 깊은 단어라고 생각하면 된다. 전문적인 내용을 담고 있는 문서에서 용어란 그 분야의 도메인에서 우세하게 등장하는 단어를 말한다. 예.. 2021. 11. 30. 이전 1 ··· 6 7 8 9 다음 728x90 반응형