본문 바로가기

728x90

혐오표현 분류1

[논문 리뷰 #5] 한국어 오픈 도메인 대화 모델의 CTRL을 활용한 혐오 표현 생성 완화 한국어 오픈 도메인 대화 모델의 CTRL을 활용한 혐오 표현 생성 완화 : 좌승연(서울대학교), 차영록, 한문수, 신동훈(엔씨소프트) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00. 서론 대형 코퍼스로 학습한 언어 모델은 코퍼스 안에 포함된 사회적 편견이나 혐오 표현까지 학습한다. 최근 이러한 유해표현을 생성하지 못하도록 제한하는 연구가 이루어 지고 있으며 이 논문은 BART 사전 학습 모델을 기반한 한국어 오픈 도메인 대화 모델에서 컨트롤 코드로 모델의 응답을 조절하는 방법을 사용해 혐오 표현 생성을 완화하는 방법을 제안한다. 01. 오픈 오메인 대화 모델 오픈 도메인 대화 모델은 정해진 주제나 특정한 응답 목적 없이 자유 주제에 관해 대화 가능한 모델이다. 최근 대형 코퍼스.. 2023. 5. 14.

이전 1 다음

728x90

티스토리툴바