본문 바로가기

728x90

논문리뷰4

[논문 리뷰 #7] 자연어 생성 모델을 이용한 준지도 학습 기반 한국어 사실 확인 자료 구축 자연어 생성 모델을 이용한 준지도 학습 기반 한국어 사실 확인 자료 구축: 정재환(스탠퍼드 대학교), 전동현, 김선훈, 강인호(네이버) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00. 서론 한국어 사실 확인 과제는 학습 자료의 부재로 연구에 어려움을 겪고 있다. 이 논문은 수작업으로 구성된 학습 자룔르 토대로 자연어 생성 모델을 이용하여 한국어 사실 확인 자료를 구축하는 방법을 제안한다. C2E와 E2C 두 가지의 생성 방법을 이용하여 실험을 진행한다. 기존 학습 자료와 새롭게 생성한 자료를 더해 학습한 사실 확인 분류기는 높은 성능을 기록했다. 또한 C2E의 경우 수작업으로 구성된 자료 없이 기존의 자연어 추론 과제 자료와 HyperCLOVA few shot 예제만으로도 높은.. 2023. 6. 17.

[논문 리뷰 #6] 문장 수준 관계 추출을 위한 개체 중심 구문 트리 기반 모델 문장 수준 관계 추출을 위한 개체 중심 구문 트리 기반 모델: 박성식, 김학수(건국대학교 컴퓨터공학과) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00. 서론 구문 트리의 구조적 정보는 문장 수준 관계 추출을 수행하는데 매우 중요한 자질 중 하나다. 기존 관계 추출 연구는 구문 트리에서 최단 의존 경로를 적용하는 방식으로 관계 추출에 필요한 정보를 추출하여 활용했다. 그러나 이런 트리 가지치기 기반의 정보 추출은 관계 추출에 필요한 어휘 정보를 소실할 수도 있다는 문제점이 존재한다. 이 논문은 개체 중심으로 구문 트리를 재구축 하고 모든 노드의 정보를 관계 추출에 활용하는 모델을 제안하여 문제점을 해소하고자 한다. 01. 관계추출 관계 추출이란 문장이나 문서 같은 비정형 데이터에.. 2023. 5. 15.

[논문 리뷰 #2] 마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환 마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환 : 배장성, 이창기, 황정인, 노형종(강원대학교 컴퓨터 과학과, 엔씨소프트 NLP Center Language AI Lab) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00.서론 텍스트 스타일 변환은 기계학습모델을 이용해 해결 할 수 있지만 인공지능에서 항상 문제가 되듯 이 문제 또한 대량의 병렬 말뭉치를 필요로 한다. 각 스타일에 대응되는 병렬 말뭉치는 구하기 힘들 뿐더러 구축하는데도 많은 비용과 시간이 필요하다. 따라서 최근에는 비병렬 말뭉치를 이용해 텍스트 스타일 변환을 수행할 수 있도록 하는 많은 연구들이 이뤄지고 있다. 이 논문에서는 입력 텍스트의 내용을 유지하면서 삭제된 스타일 토큰을 원하는 스타일의 토큰으로 변.. 2022. 3. 11.

[논문 리뷰 #1] FastText와 Bert를 이용한 자동 용어추출 FastText와 Bert를 이용한 자동 용어추출 : 최규현, 나승훈 (전북대학교 인지컴퓨팅 연구실) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00. 서론 자연어 처리의 다양한 task에서 핵심이 되는 용어를 추출하는 것은 중요하다. 방대한 데이터를 읽고 사람이 직접 용어를 뽑아내는 것은 굉장히 많은 노동력을 필요로 하는 작업이기 때문에 이를 자동으로 수행하는 자동추출 기술이 요구 되고 있다. 이 논문에서는 용어를 추출하는 모델을 2가지로 제안하고 있다. 01. 용어 추출 용어란 텍스트에서 중요한 역할을 하는 단어를 말한다. 텍스트의 주제에 관계가 깊은 단어라고 생각하면 된다. 전문적인 내용을 담고 있는 문서에서 용어란 그 분야의 도메인에서 우세하게 등장하는 단어를 말한다. 예.. 2021. 11. 30.

이전 1 다음

728x90

티스토리툴바