RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      Word2vec와 Label Propagation을 이용한 감성사전 구축 방법

      한글로보기

      https://www.riss.kr/link?id=A103117596

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      본 논문에서는 Word2vec을 이용한 새로운 그래프 기반 감성사전 구축 방법을 제안한다. 기존의 연구에서 단어 그래프에서의 변(edge)의 가중치를 계산하기 위하여 널리 사용해 오던 PMI(Point-wise Mutual Information)는문장의 맥락이나 문맥 상 의미를 통한 단어 간의 관계를 전혀 고려하지 않았다. 본 논문에서는 단어의 의미와 문장에서의 맥락을 고려하여 단어를 벡터로 표현하는 Word2vec 기법에 기반한 변의 가중치 계산 방법을 제안한다. 또한, 새로운 가중치 계산 방법이 감성 사전의 정확도를 개선하는 것을 실증하기 위하여 10,000건의 실제 영화평을포함하는 데이터를 기반으로 두 가지 LP(Label Propagation) 알고리즘에 새로운 Word2vec 가중치를 적용하여감성사전을 구축하는 실험을 실행하였다. 이 실험 결과 Word2vec 가중치 계산식을 적용하여 구축한 감성사전을 이용하여 새로운 문장에 대한 감성분석을 하였을 경우 기본의 방법보다 평균적으로 1.5%의 정확도가 향상됨을 알 수 있었다.
      번역하기

      본 논문에서는 Word2vec을 이용한 새로운 그래프 기반 감성사전 구축 방법을 제안한다. 기존의 연구에서 단어 그래프에서의 변(edge)의 가중치를 계산하기 위하여 널리 사용해 오던 PMI(Point-wise M...

      본 논문에서는 Word2vec을 이용한 새로운 그래프 기반 감성사전 구축 방법을 제안한다. 기존의 연구에서 단어 그래프에서의 변(edge)의 가중치를 계산하기 위하여 널리 사용해 오던 PMI(Point-wise Mutual Information)는문장의 맥락이나 문맥 상 의미를 통한 단어 간의 관계를 전혀 고려하지 않았다. 본 논문에서는 단어의 의미와 문장에서의 맥락을 고려하여 단어를 벡터로 표현하는 Word2vec 기법에 기반한 변의 가중치 계산 방법을 제안한다. 또한, 새로운 가중치 계산 방법이 감성 사전의 정확도를 개선하는 것을 실증하기 위하여 10,000건의 실제 영화평을포함하는 데이터를 기반으로 두 가지 LP(Label Propagation) 알고리즘에 새로운 Word2vec 가중치를 적용하여감성사전을 구축하는 실험을 실행하였다. 이 실험 결과 Word2vec 가중치 계산식을 적용하여 구축한 감성사전을 이용하여 새로운 문장에 대한 감성분석을 하였을 경우 기본의 방법보다 평균적으로 1.5%의 정확도가 향상됨을 알 수 있었다.

      더보기

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      In this paper we propose a new method for constructing a graph based sentiment dictionary using Word2vec and label propagation. The similarity calculation method used in the previous research to calculate the weight of the edges in a word graph, PMI(Point-wise Mutual Information), does not consider the relationships among the words by the context and the contextual meaning of a sentence for calculating the weights of the edges in a word graph. To improve the accuracy of the weights, we propose a new method using Word2vec, that vectorizes words by considering the meaning of the words and the context of the sentence containing the words. We confirmed the improvement of the performance of our proposed method through the experiments with actual clinical data. In the experiment of constructing sentiment dictionaries based on 10,000 movie reviews, our methods combining Word2vec weight calculation method and label propagation algorithms produced the sentiment dictionaries, which predict new text data with 1.5% more accuracy than the conventional method using PMI.
      번역하기

      In this paper we propose a new method for constructing a graph based sentiment dictionary using Word2vec and label propagation. The similarity calculation method used in the previous research to calculate the weight of the edges in a word graph, PMI(P...

      In this paper we propose a new method for constructing a graph based sentiment dictionary using Word2vec and label propagation. The similarity calculation method used in the previous research to calculate the weight of the edges in a word graph, PMI(Point-wise Mutual Information), does not consider the relationships among the words by the context and the contextual meaning of a sentence for calculating the weights of the edges in a word graph. To improve the accuracy of the weights, we propose a new method using Word2vec, that vectorizes words by considering the meaning of the words and the context of the sentence containing the words. We confirmed the improvement of the performance of our proposed method through the experiments with actual clinical data. In the experiment of constructing sentiment dictionaries based on 10,000 movie reviews, our methods combining Word2vec weight calculation method and label propagation algorithms produced the sentiment dictionaries, which predict new text data with 1.5% more accuracy than the conventional method using PMI.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • 1. 서론
      • 2. 관련 연구
      • 3. Word2vec을 이용한 감성사전 구축 방법
      • 요약
      • Abstract
      • 1. 서론
      • 2. 관련 연구
      • 3. Word2vec을 이용한 감성사전 구축 방법
      • 3.1 Word2vec을 이용한 가중치 계산법
      • 3.2 Word2vec을 이용한 가중치 계산 방법
      • 3.3 LP 알고리즘을 이용한 감성사전 구축
      • 3.4 Label Propagation
      • 4. 감성사전 구축 실험
      • 4.1 감성사전 구축 실험 개요
      • 4.2 영역별 어휘의 감성 추론
      • 4.3 감성사전을 이용한 텍스트 감성분석
      • 5. 결론
      • 참고문헌
      더보기

      참고문헌 (Reference)

      1 이철성, "한글 마이크로블로그 텍스트의 감정 분류 및 분석" 한국정보과학회 40 (40): 159-167, 2013

      2 홍초희, "트윗 감정 분류를 위한 다양한 기계학습 자질에 대한 비교 연구" 한국콘텐츠학회 12 (12): 471-478, 2012

      3 김명규, "텍스트 문서 기반의 감성 인식 시스템" 한국감성과학회 12 (12): 433-442, 2009

      4 안주영, "텍스트 마이닝을 이용한 감정 유발 요인 ‘Emotion Trigger’에 관한 연구" 한국지능정보시스템학회 21 (21): 69-92, 2015

      5 장재영, "텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향" 한국인터넷방송통신학회 13 (13): 37-47, 2013

      6 윤경목, "유전알고리즘과 신경망 파라미터 값들의 변동에 의한 영화 추천시스템 성능향상" 한국차세대컴퓨팅학회 10 (10): 56-64, 2014

      7 김승우, "오피니언 분류의 감성사전 활용효과에 대한 연구" 한국지능정보시스템학회 20 (20): 133-148, 2014

      8 오연주, "영화평과 평점을 이용한 감성 문장 구축을 통한 영화 평점 추론" 한국인터넷정보학회 16 (16): 41-48, 2015

      9 이현규, "명암도 조절을 통한 베이스 분류기 기반 영상분할기법" 한국차세대컴퓨팅학회 8 (8): 73-86, 2012

      10 홍정훈, "데이터마이닝에서 연관분석을 이용한 변수선택" 한국차세대컴퓨팅학회 7 (7): 20-27, 2011

      1 이철성, "한글 마이크로블로그 텍스트의 감정 분류 및 분석" 한국정보과학회 40 (40): 159-167, 2013

      2 홍초희, "트윗 감정 분류를 위한 다양한 기계학습 자질에 대한 비교 연구" 한국콘텐츠학회 12 (12): 471-478, 2012

      3 김명규, "텍스트 문서 기반의 감성 인식 시스템" 한국감성과학회 12 (12): 433-442, 2009

      4 안주영, "텍스트 마이닝을 이용한 감정 유발 요인 ‘Emotion Trigger’에 관한 연구" 한국지능정보시스템학회 21 (21): 69-92, 2015

      5 장재영, "텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향" 한국인터넷방송통신학회 13 (13): 37-47, 2013

      6 윤경목, "유전알고리즘과 신경망 파라미터 값들의 변동에 의한 영화 추천시스템 성능향상" 한국차세대컴퓨팅학회 10 (10): 56-64, 2014

      7 김승우, "오피니언 분류의 감성사전 활용효과에 대한 연구" 한국지능정보시스템학회 20 (20): 133-148, 2014

      8 오연주, "영화평과 평점을 이용한 감성 문장 구축을 통한 영화 평점 추론" 한국인터넷정보학회 16 (16): 41-48, 2015

      9 이현규, "명암도 조절을 통한 베이스 분류기 기반 영상분할기법" 한국차세대컴퓨팅학회 8 (8): 73-86, 2012

      10 홍정훈, "데이터마이닝에서 연관분석을 이용한 변수선택" 한국차세대컴퓨팅학회 7 (7): 20-27, 2011

      11 Goldberg, Yoav, "Word2vec explained:Deriving mikolov et al.'s negative-sampling word-embedding method"

      12 Kim, J, H., "The graph-based method for construction of domain-oriented sentiment dictionary" Korea Aerospace University 2014

      13 아흐람 말락, "The Effect of PCA On Kernel Classifiers For the Diagnosis of Alzheimer’s Disease" 한국차세대컴퓨팅학회 12 (12): 25-32, 2016

      14 Stavrianou, Anna, "Overview and semantic issues of text mining" 36 (36): 23-34, 2007

      15 Zhou, Dengyong, "Learning with local and global consistency" 16 (16): 321-328, 2003

      16 Zhu, Xiaojin, "Learning from labeled and unlabeled data with label propagation" Carnegie Mellon University 2002

      17 Saggion, Horacio, "Interpreting SentiWordNet for opinion classification" 2010

      18 Mikolov, Thomas, "Efficient estimation of word representations in vector space"

      19 Harris, Zellig S., "Distributional structure" 10 (10): 146-162, 1954

      20 Kim, S., "Determining the sentiment of Opinions" 1367-, 2004

      21 Xue, B., "A study on sentiment computing and classification of sina weibo with word2vec" IEEE 358-363, 2014

      22 Xue, B., "A study on sentiment computing and classification of sina weibo with word2vec" 2014

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2027 평가예정 재인증평가 신청대상 (재인증)
      2021-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2018-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2011-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2010-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2008-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.68 0.68 0.62
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.56 0.51 0.557 0.26
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼