http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
단어의 의미와 문맥을 고려한 순환신경망 기반의 문서 분류
주종민,김남훈,양형정,박혁로,Joo, Jong-Min,Kim, Nam-Hun,Yang, Hyung-Jeong,Park, Hyuck-Ro 한국정보처리학회 2018 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.7 No.7
In this paper, we propose a method to classify a document using a Recurrent Neural Network by extracting features considering word sense and contexts. Word2vec method is adopted to include the order and meaning of the words expressing the word in the document as a vector. Doc2vec is applied for considering the context to extract the feature of the document. RNN classifier, which includes the output of the previous node as the input of the next node, is used as the document classification method. RNN classifier presents good performance for document classification because it is suitable for sequence data among neural network classifiers. We applied GRU (Gated Recurrent Unit) model which solves the vanishing gradient problem of RNN. It also reduces computation speed. We used one Hangul document set and two English document sets for the experiments and GRU based document classifier improves performance by about 3.5% compared to CNN based document classifier. 본 논문에서는 단어의 순서와 문맥을 고려하는 특징을 추출하여 순환신경망(Recurrent Neural Network)으로 문서를 분류하는 방법을 제안한다. 단어의 의미를 고려한 word2vec 방법으로 문서내의 단어를 벡터로 표현하고, 문맥을 고려하기 위해 doc2vec으로 입력하여 문서의 특징을 추출한다. 문서분류 방법으로 이전 노드의 출력을 다음 노드의 입력으로 포함하는 RNN 분류기를 사용한다. RNN 분류기는 신경망 분류기 중에서도 시퀀스 데이터에 적합하기 때문에 문서 분류에 좋은 성능을 보인다. RNN에서도 그라디언트가 소실되는 문제를 해결해주고 계산속도가 빠른 GRU(Gated Recurrent Unit) 모델을 사용한다. 실험 데이터로 한글 문서 집합 1개와 영어 문서 집합 2개를 사용하였고 실험 결과 GRU 기반 문서 분류기가 CNN 기반 문서 분류기 대비 약 3.5%의 성능 향상을 보였다.
소셜 데이터를 이용한 협업필터링 추천 시스템 성능 개선 연구
주종민 ( Jong-min Joo ),양형정 ( Hyung-jeong Yang ),김남훈 ( Nam-hun Kim ),박성현 ( Sung-hyun Park ),이건우 ( Gun-woo Lee ) 한국정보처리학회 2017 한국정보처리학회 학술대회논문집 Vol.24 No.2
다양한 소셜 네트워크 서비스가 발달되고 많은 사람들이 소셜 미디어에 참여하면서 방대한 양의 정보가 발생하고 있다. 따라서 원하는 정보를 선별하고 가공하는 연구도 활발히 진행되고 있다. 협업필터링은 이러한 정보를 토대로 사용자에게 맞춤형 아이템을 추천해주는 알고리즘이다. 하지만 정확한 추천을 위해서는 매우 방대한 양의 정보가 필요하다. 또한 협업필터링에는 초기에는 제대로 추천이 이루어지지 않는 콜드스타터 문제가 있다. 이러한 문제를 해결하기 위해 본 논문에서는 소셜 네트워크 서비스 중의 하나인 트위터 데이터를 활용하여 협업필터링 추천 시스템의 성능을 높이고자 한다. 협업 필터링의 평점에 특정 아이템 관련 트윗을 수집해서 긍정/부정을 측정하여 가중치를 부여한다. RMSE 평가 방법을 통한 실험 결과, 소셜 미디어의 긍부정 영향력을 측정하여 적용했을 때가 기존의 협업필터링 방식에 비해 약 5.5%의 성능 향상을 확인하였다.
이원병,김영신,주종민,이창원,나정열,Lee, Won-Byoung,Kim, Young-Shin,Joo, Jong-Min,Lee, Chang-Won,Na, Jung-Yul 한국음향학회 2006 韓國音響學會誌 Vol.25 No.8
능동-소나를 이용하여 수중표적을 탐지하는데 있어 소나탐지 성능은 잔향음에 많은 제한을 받는다. 해상풍은 해양에서 기포 형성에 중요한 역할을 한다. 그리고 기포는 유효한 산란체로서 잔향음에 기여한다. 본 연구에서는 중주파수 선저 고전형 능동소나를 운용 시 풍성기포가 음파전달에 미치는 영향을 연구하였다. 주파수 5, 7.5, 10kHz에 대해 기포층을 고려한 음원수심 3, 5, 10m에서의 능동 신호초과비 (Active Signal Excess:ASE)를 계산하였다. 해수면 부근의 음속변화는 해수면 잔향음 준위를 증가시키며, 능동 신호초과비를 변화시킨다 풍속이 10m/s에서 해수면 부근의 최대 탐지거리가 3km 이상 감소하였다. 그 원인은 풍성기포에 의한 해수면 방향으로의 굴절로 분석되었다. When an active SONAR works in the subsurface. its detection Performance is limited by the reverberation. The winds Play a primary role in the Production of bubbles in the ocean. And the bubbles as efficient scatters contribute to the reverberant field. In this Paper the effects of wind-generated bubbles on sound propagation in the subsurface are investigated as a mid-frequency Hull-mounted SONAR works. The active signal excess is calculated at source depths 3. 5. and 10m considering bubble layer for frequencies 5. 7.5, and 10kHz. The change of the near-surface sound speed tend to increase surface reverberation levels and change the active signal excess. In the 10m/s winds. the maximum detection range reduces over 3km through the near-surface . The reason is the upper refraction due to the wind-generated bubbles.
연구 보고서의 공기관계 정보에 제목 및 요약의 가중치를 적용한 유사도 계산
김남훈 ( Nam-hun Kim ),주종민 ( Jong-min Joo ),박혁로 ( Hyuk-ro Park ),양형정 ( Hyung-jeong Yang ) 한국컴퓨터교육학회 2017 한국컴퓨터교육학회 학술발표대회논문집 Vol.21 No.2
본 논문에서는 국가 연구 보고서의 공기 관계 정보와 제목, 요약 등에 가중치를 적용한 유사도 계산 방법을 제안한다. 이를 위해 국가 연구개발 보고서에서 텍스트를 추출하여 한 문장 단위로 문서를 분할 하고, 기본 불용어와 보고서에서 특징적으로 나타나는 불용어를 처리하고 형태소 분석을 한 뒤 공기관계를 추출하였다. 또한 문서의 유사도 계산시 정확성을 높이기 위해 제목과 요약 부분에 가중치를 부여 하였다. 이를 통해 본 논문에서 제안하는 방법이 문서 검색 라이브러인 루씬(Lucene)을 이용한 방법보다 2.5%의 검색성능 향상을 그리고 Knn-휴리스틱 방법보다는 1.1%의 검색성능 향상을 보였다. 이러한 결과를 통해 문서의 요약과 제목 그리고 공기관계 정보가 연구보고서의 유사도를 계산 하는데 영향을 미친다는 것을 보였다.