본 논문에서는 Word2vec을 이용한 새로운 그래프 기반 감성사전 구축 방법을 제안한다. 기존의 연구에서 단어 그래프에서의 변(edge)의 가중치를 계산하기 위하여 널리 사용해 오던 PMI(Point-wise M...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A103117596
2017
Korean
KCI등재
학술저널
93-101(9쪽)
10
학회 요청에 의해 무료로 제공
0
상세조회0
다운로드본 논문에서는 Word2vec을 이용한 새로운 그래프 기반 감성사전 구축 방법을 제안한다. 기존의 연구에서 단어 그래프에서의 변(edge)의 가중치를 계산하기 위하여 널리 사용해 오던 PMI(Point-wise M...
본 논문에서는 Word2vec을 이용한 새로운 그래프 기반 감성사전 구축 방법을 제안한다. 기존의 연구에서 단어 그래프에서의 변(edge)의 가중치를 계산하기 위하여 널리 사용해 오던 PMI(Point-wise Mutual Information)는문장의 맥락이나 문맥 상 의미를 통한 단어 간의 관계를 전혀 고려하지 않았다. 본 논문에서는 단어의 의미와 문장에서의 맥락을 고려하여 단어를 벡터로 표현하는 Word2vec 기법에 기반한 변의 가중치 계산 방법을 제안한다. 또한, 새로운 가중치 계산 방법이 감성 사전의 정확도를 개선하는 것을 실증하기 위하여 10,000건의 실제 영화평을포함하는 데이터를 기반으로 두 가지 LP(Label Propagation) 알고리즘에 새로운 Word2vec 가중치를 적용하여감성사전을 구축하는 실험을 실행하였다. 이 실험 결과 Word2vec 가중치 계산식을 적용하여 구축한 감성사전을 이용하여 새로운 문장에 대한 감성분석을 하였을 경우 기본의 방법보다 평균적으로 1.5%의 정확도가 향상됨을 알 수 있었다.
다국어 초록 (Multilingual Abstract)
In this paper we propose a new method for constructing a graph based sentiment dictionary using Word2vec and label propagation. The similarity calculation method used in the previous research to calculate the weight of the edges in a word graph, PMI(P...
In this paper we propose a new method for constructing a graph based sentiment dictionary using Word2vec and label propagation. The similarity calculation method used in the previous research to calculate the weight of the edges in a word graph, PMI(Point-wise Mutual Information), does not consider the relationships among the words by the context and the contextual meaning of a sentence for calculating the weights of the edges in a word graph. To improve the accuracy of the weights, we propose a new method using Word2vec, that vectorizes words by considering the meaning of the words and the context of the sentence containing the words. We confirmed the improvement of the performance of our proposed method through the experiments with actual clinical data. In the experiment of constructing sentiment dictionaries based on 10,000 movie reviews, our methods combining Word2vec weight calculation method and label propagation algorithms produced the sentiment dictionaries, which predict new text data with 1.5% more accuracy than the conventional method using PMI.
목차 (Table of Contents)
참고문헌 (Reference)
1 이철성, "한글 마이크로블로그 텍스트의 감정 분류 및 분석" 한국정보과학회 40 (40): 159-167, 2013
2 홍초희, "트윗 감정 분류를 위한 다양한 기계학습 자질에 대한 비교 연구" 한국콘텐츠학회 12 (12): 471-478, 2012
3 김명규, "텍스트 문서 기반의 감성 인식 시스템" 한국감성과학회 12 (12): 433-442, 2009
4 안주영, "텍스트 마이닝을 이용한 감정 유발 요인 ‘Emotion Trigger’에 관한 연구" 한국지능정보시스템학회 21 (21): 69-92, 2015
5 장재영, "텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향" 한국인터넷방송통신학회 13 (13): 37-47, 2013
6 윤경목, "유전알고리즘과 신경망 파라미터 값들의 변동에 의한 영화 추천시스템 성능향상" 한국차세대컴퓨팅학회 10 (10): 56-64, 2014
7 김승우, "오피니언 분류의 감성사전 활용효과에 대한 연구" 한국지능정보시스템학회 20 (20): 133-148, 2014
8 오연주, "영화평과 평점을 이용한 감성 문장 구축을 통한 영화 평점 추론" 한국인터넷정보학회 16 (16): 41-48, 2015
9 이현규, "명암도 조절을 통한 베이스 분류기 기반 영상분할기법" 한국차세대컴퓨팅학회 8 (8): 73-86, 2012
10 홍정훈, "데이터마이닝에서 연관분석을 이용한 변수선택" 한국차세대컴퓨팅학회 7 (7): 20-27, 2011
1 이철성, "한글 마이크로블로그 텍스트의 감정 분류 및 분석" 한국정보과학회 40 (40): 159-167, 2013
2 홍초희, "트윗 감정 분류를 위한 다양한 기계학습 자질에 대한 비교 연구" 한국콘텐츠학회 12 (12): 471-478, 2012
3 김명규, "텍스트 문서 기반의 감성 인식 시스템" 한국감성과학회 12 (12): 433-442, 2009
4 안주영, "텍스트 마이닝을 이용한 감정 유발 요인 ‘Emotion Trigger’에 관한 연구" 한국지능정보시스템학회 21 (21): 69-92, 2015
5 장재영, "텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향" 한국인터넷방송통신학회 13 (13): 37-47, 2013
6 윤경목, "유전알고리즘과 신경망 파라미터 값들의 변동에 의한 영화 추천시스템 성능향상" 한국차세대컴퓨팅학회 10 (10): 56-64, 2014
7 김승우, "오피니언 분류의 감성사전 활용효과에 대한 연구" 한국지능정보시스템학회 20 (20): 133-148, 2014
8 오연주, "영화평과 평점을 이용한 감성 문장 구축을 통한 영화 평점 추론" 한국인터넷정보학회 16 (16): 41-48, 2015
9 이현규, "명암도 조절을 통한 베이스 분류기 기반 영상분할기법" 한국차세대컴퓨팅학회 8 (8): 73-86, 2012
10 홍정훈, "데이터마이닝에서 연관분석을 이용한 변수선택" 한국차세대컴퓨팅학회 7 (7): 20-27, 2011
11 Goldberg, Yoav, "Word2vec explained:Deriving mikolov et al.'s negative-sampling word-embedding method"
12 Kim, J, H., "The graph-based method for construction of domain-oriented sentiment dictionary" Korea Aerospace University 2014
13 아흐람 말락, "The Effect of PCA On Kernel Classifiers For the Diagnosis of Alzheimer’s Disease" 한국차세대컴퓨팅학회 12 (12): 25-32, 2016
14 Stavrianou, Anna, "Overview and semantic issues of text mining" 36 (36): 23-34, 2007
15 Zhou, Dengyong, "Learning with local and global consistency" 16 (16): 321-328, 2003
16 Zhu, Xiaojin, "Learning from labeled and unlabeled data with label propagation" Carnegie Mellon University 2002
17 Saggion, Horacio, "Interpreting SentiWordNet for opinion classification" 2010
18 Mikolov, Thomas, "Efficient estimation of word representations in vector space"
19 Harris, Zellig S., "Distributional structure" 10 (10): 146-162, 1954
20 Kim, S., "Determining the sentiment of Opinions" 1367-, 2004
21 Xue, B., "A study on sentiment computing and classification of sina weibo with word2vec" IEEE 358-363, 2014
22 Xue, B., "A study on sentiment computing and classification of sina weibo with word2vec" 2014
캐릭터 성격에 따른 비언어적 커뮤니케이션 요소 표현 및 VST 실현요소 분석
사람 재 식별을 위한 딥 피쳐를 사용한 보행자 파트 분석
학술지 이력
| 연월일 | 이력구분 | 이력상세 | 등재구분 |
|---|---|---|---|
| 2027 | 평가예정 | 재인증평가 신청대상 (재인증) | |
| 2021-01-01 | 평가 | 등재학술지 유지 (재인증) | ![]() |
| 2018-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
| 2015-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
| 2011-01-01 | 평가 | 등재학술지 선정 (등재후보2차) | ![]() |
| 2010-01-01 | 평가 | 등재후보 1차 PASS (등재후보1차) | ![]() |
| 2008-01-01 | 평가 | 등재후보학술지 선정 (신규평가) | ![]() |
학술지 인용정보
| 기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
|---|---|---|---|
| 2016 | 0.68 | 0.68 | 0.62 |
| KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
| 0.56 | 0.51 | 0.557 | 0.26 |