http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
이철성(Cheolseong Lee),최동희(Donghee Choi),김성순(Seongsoon Kim),강재우(Jaewoo Kang) 한국정보과학회 2013 정보과학회논문지 : 데이타베이스 Vol.40 No.3
지금까지 국내에서는 우리말을 이용하여 긍?부정을 판단하는 감성분석연구(sentiment analysis)가 주를 이뤘고, 여러 감정으로 분류하는 감정분석연구(emotion analysis)는 진행되지 않았다. 이에 본 연구에서는 한글 문서를 기반으로 기계학습 모델을 적용하여 7개의 감정으로 분류하고 그 결과를 영화평에 적용하여 영화 장르별 감정특성을 분석하였다. 본 연구에 적용한 기계학습 모델 중 ‘다항 네이브 베이즈(Multinomial Naive Bayes) 모델이 가장 높은 정확도를 보였다. 이 모델을 ‘네이버 40자 영화평’에 적용하여 영화 100편에 해당하는 영화평의 감정을 분류하고, 요인분석(factor analysis)하였다. 그 결과, ‘생동감’과 ‘우울’이 상반되는 감정임을 알 수 있었고, 영화평에 나타난 ‘친근감’은 영화의 평점에 긍정적인 영향을 미치고, ‘분노’, ‘혼란’, ‘피로감’은 부정적인 영향을 미치는 것으로 나타났다. 반면에 ‘생동감’과 ‘우울’은 영화의 평점에 영향을 미치지 않은 것으로 나타났다. 또한, 단일감정을 특성으로 하는 4개의 장르 즉, 공포-‘긴장감’, 코미디-‘생동감’, 멜로/애정/로맨스-‘친근감’, 범죄-‘혼란’이 영화 장르별 감정 특성으로 나타났다. 트위터(Twitter)로부터 수집한 데이터를 이용하여 ‘네이버 40자 영화평’에 적용한 이번 연구는 데이터의 성격을 넘어, 본 연구에서 제안한 방법이 실제 응용분야에서 적용 가능함을 보여준다. Recent studies in Korean sentiment analysis mostly focus on binary classification such as ‘positive’ or ‘negative’. However, there are few researches have discussed on emotion analysis which involves classifying opinions into multiple categories. In this paper, we have developed machine learning models based on Korean document and applied these classifiers to movie reviews to extract emotional features of various movie genres. We used Multinominal Naive Bayes model which shows best classification accuracy. Employing this model, we performed factor analysis on the movie review dataset distributed by “Naver” for 100 movies. The experimental result shows that ‘vigor’ and ‘depression’ are opposite emotions. Meanwhile, ‘friendliness’ positively influences on movie rating, by contrast, ‘anger’, ‘confusion’ and ‘fatigue’ affect negatively. Also we have found 4 movie genres which has single emotional feature as follows: horror-‘anxiety’, comedy-‘vigor’, romance/love-‘friendliness’ and crime-‘confusion’. Finally, cross-corpus evaluation using “Twitter” and “Naver” movie review dataset demonstrates that our proposed method can be applicable in practical applications over various data attributes.