728x90 반응형 전체 글76 [프로그래머스] 최소 직사각형 / Python 문제 https://school.programmers.co.kr/learn/courses/30/lessons/86491 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 명함 지갑을 만드는 회사에서 지갑의 크기를 정하려고 합니다. 다양한 모양과 크기의 명함들을 모두 수납할 수 있으면서, 작아서 들고 다니기 편한 지갑을 만들어야 합니다. 이러한 요건을 만족하는 지갑을 만들기 위해 디자인팀은 모든 명함의 가로 길이와 세로 길이를 조사했습니다. 아래 표는 4가지 명함의 가로 길이와 세로 길이를 나타냅니다. 가장 긴 가로 길이와 세로 길이가 각각 80, 70이기 때.. 2023. 5. 13. [논문 리뷰 #4] Attention Mechanism에 따른 포인터 네트워크 기반 의존 구문 분석 모델 비교 Attention Mechanism에 따른 포인터 네트워크 기반 의존 구문 분석 모델 비교 : 한미래, 박성식(건국대학교 인공지능학과), 김학수(건국대학교 컴퓨터공학부) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00. 서론 최근 딥러닝을 활용한 의존 구문 분석 연구가 활발히 진행되고 있다. 딥러닝을 활용한 의존 구문 분석은 크게 3단계로 수행되는데 마지막 단계인 지배소 및 의존 관계 결정 단계에서 포인터 네트워크를 활용하는 방법이 사용된다. 포인터 네트워크는 내부적으로 어텐션(attention)기법을 응용해 동작한다. 이는 어떤 어텐션 기법을 사용하는지에 따라 포인터 네트워크의 성능이 달라지는지를 의미한다. 이 논문은 포인터 네트워크 기반 한국어 의존 구문 분석의 지배소 및 의.. 2023. 5. 13. [논문 리뷰 #3] 긴 문서를 위한 BERT 기반의 End-to-End 한국어 상호참조 해결 긴 문서를 위한 BERT 기반의 End-to-End 한국어 상호참조해결 : 조경빈, 정영준, 이창기 (강원대학교 빅데이터메디컬융합학과), 류지희, 임준호 (한국전자통신 연구원) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00. 서론 최근 한국어 상호참조해결 연구에서는 BERT를 이용해 단어의 문맥 표현을 얻어 성능을 향상시켰다. 하지만 512토큰 이상의 긴 문서를 처리하기 위해서는 512이 토큰 이하로 문서를 분할하여 처리하기 때문에 길이가 긴 문서에 대해서는 상호참조해결 성능이 낮아지는 문제가 있다. 이 논문에서는 512토큰 이상의 긴 문서를 위한 BERT기반 End-to-End 상호참조해결 모델을 제안한다. 01. 상호참조해결 상호참조해결이란 동일한 개체(entitiy)를 의.. 2023. 5. 12. [의학용어 탐지 및 해석 모델] 말뭉치 구축 - [1] 크롤링(Crawling) 신뢰도가 높은 의학용어 사전 페이지를 크롤링하여 의학용어와 정의가 담긴 사전을 구축한다. 크롤링(Crawling)이란 쉽게 말해 웹페이지를 긁어와 원하는 정보를 추출하여 사용하는 것으로 생각하면 된다. 파이썬은 다양한 라이브러리가 구현되어있기 때문에 사용법만 익히면 편하게 이용할 수 있다. 크롤링에 필요한 라이브러리 역시 파이썬에 구현된 라이브러리를 사용한다. - beautiful soap - requests 두 라이브러리를 먼저 설치한다. 크롤링을 원하는 페이지에 접속해 F12를 눌러 관리자 모드에 진입한다. 관리자모드에 커서를 올리면 페이지의 어느 부분인지 알 수 있도록 블록처리가 된다. 원하는 정보가 있는 곳을 찾은 후 정규표현을 이용해 긁어오면 크롤링 성공이다. 의학용어 페이지를 크롤링한 코드는 .. 2023. 4. 21. 의학용어 탐지 및 해석 모델 어릴 때 부터 그런 고민을 자주 했다. 어려운 용어들이 많은 문서에서 내가 모르는 단어를 알아서 찾아 번역해주는 게 있다면 얼마나 좋을까. 고등학생때 보던 인터넷 강의에서 강사님이 그런 이야기를 했다. 의사는 환자의 눈높이에서 설명해주어야 한다며, 의학용어를 이용하면 전문가끼리 소통하는건 편하겠지만 이를 잘 모르는 환자는 이해를 잘 못한다는 것이다. 그럼 의학용어를 알아서 찾아서 쉬운말로 해석해주는 모델이 있다면 서로에게 정말 편하겠다는 생각이 들었다. 막연히 상상만 하던 것을 한번 구현해보기로 했다. 이런거 해보려고 열심히 공부한게 아니겠어?! 가장 먼저 해야할 일은 데이터를 구축하는 일이다. 나의 목적에 맞게 데이터를 찾고 구축하는 일은 생각보다 쉽지 않았다. 혼자서 많은 일을 하려니 완벽하게 할 수.. 2023. 4. 1. lipiji/TranSummar github코드 파라미터 관련 https://github.com/lipiji/TranSummar GitHub - lipiji/TranSummar: Transformer for abstractive summarization on cnn/daily-mail and gigawords Transformer for abstractive summarization on cnn/daily-mail and gigawords - GitHub - lipiji/TranSummar: Transformer for abstractive summarization on cnn/daily-mail and gigawords github.com https://www.cnblogs.com/lauspectrum/p/11234831.html 2022. 10. 20. CRF import 할때 생기는 에러 from torchcrf import CRF 했는데 에러가 뜬다면 pip install pytorch-crf==0.4.0 하면 에러 사라짐 2022. 6. 15. openNMT 관련 파라미터 Transformer model 사용 - config (quickstart에 있는 ex와 example안에 transformer yml 참고) param_init_glorot & param_init 0: correct initialization of parameters; position_encoding: add sinusoidal position encoding to each embedding; (true) optim: "adam", decay_method: "noam", warmup_steps: 8000: use special learning rate; batch_type: "tokens", normalization: "tokens" : batch and normalize based on number .. 2022. 6. 2. [논문 리뷰 #2] 마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환 마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환 : 배장성, 이창기, 황정인, 노형종(강원대학교 컴퓨터 과학과, 엔씨소프트 NLP Center Language AI Lab) (제 33회 한글 및 한국어 정보처리 학술대회 논문집(2021년)) 00.서론 텍스트 스타일 변환은 기계학습모델을 이용해 해결 할 수 있지만 인공지능에서 항상 문제가 되듯 이 문제 또한 대량의 병렬 말뭉치를 필요로 한다. 각 스타일에 대응되는 병렬 말뭉치는 구하기 힘들 뿐더러 구축하는데도 많은 비용과 시간이 필요하다. 따라서 최근에는 비병렬 말뭉치를 이용해 텍스트 스타일 변환을 수행할 수 있도록 하는 많은 연구들이 이뤄지고 있다. 이 논문에서는 입력 텍스트의 내용을 유지하면서 삭제된 스타일 토큰을 원하는 스타일의 토큰으로 변.. 2022. 3. 11. 이전 1 ··· 5 6 7 8 9 다음 728x90 반응형