RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      오피니언 마이닝의 제품 특징을 이용한 극성 분류 = Polarity Classification using the Features of the Product of Opinion Mining

      한글로보기

      https://www.riss.kr/link?id=T13560222

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      컴퓨터와 통신 기술의 발전으로 전자상거래라는 비즈니스 모델이 출현하게 되었고, 전자상거래의 시장은 계속해서 발전하는 중이다. 전자상거래로 구매의 문제점은 구매자가 직접 물건을 ...

      컴퓨터와 통신 기술의 발전으로 전자상거래라는 비즈니스 모델이 출현하게 되었고, 전자상거래의 시장은 계속해서 발전하는 중이다. 전자상거래로 구매의 문제점은 구매자가 직접 물건을 보고 만진 후에 구매할 수 없으므로 불안감을 가지고 제품을 구매하게 된다. 이러한 문제점을 해결을 위해 구매자들은 SNS(Social Networking Service)와 상품평을 통해 정보를 얻게 된다. 이 정보를 분석하는 방법으로 오피니언 마이닝(Opinion Mining)이 있다.
      오피니언 마이닝에서 사용하는 긍/부정 사전은 영어의 경우에는 WordNet-Affect, SentiWordNet 등 공개된 사전이 있지만, 한국어의 경우에는 공개된 사전이 없다. 이러한 사전을 구축하기 위해 수작업으로 진행하는 방법도 있지만, 비용과 시간이 많이 들게 된다.
      본 논문에서는 단어의 극성을 분류하는 방법의 정확도 향상을 위한 방법을 제안하고, 이 방법의 우수성을 증명하기 위하여 실험을 시행하였다. 제안 방법은 단어의 극성을 분류하기 위한 SO-PMI(Semantic Orientation from Point-wise Mutual Information)를 이용하였다. 한국어의 극성을 분류할 때에 생기는 문제점을 해결하기 위해 학습 데이터 구축, 학습 데이터의 전처리, 특징을 이용한 극성 분류를 사용하여 정확도를 높였다. 서술어의 분석을 위해 제품의 특징 추출 방법과 추출한 제품 특징을 이용하여 문장의 끝맺음 규칙을 적용하여 분석하였다. 특징별 극성 분류를 종합하여 특징별 감성 단어의 극성이 정확히 분류되었는지 평가하여 잘 못 분류된 결과를 확인한다. 평가 결과, 특징을 반영하지 않은 극성 분류에서는 제안한 극성 분류기가 기존의 SO-PMI와는 약 9%의 높은 성능을 보였고, SentiWordNet와는 약 5%의 높은 성능을 보였다. 특징을 반영한 극성 분류에서는 제안한 극성 분류기가 각각의 특징에서 다르게 사용되는 단어에 대한 극성 분류에서 기존의 SO-PMI와는 약 18%의 높은 성능을 보였고, SentiWordNet와는 약 11%의 높은 성능을 보였다. 또한, 학습 문서를 무작위로 수집하고 정제하여 학습 문서의 개수별 성능을 평가하였다. 평가 결과 무작위로 수집된 학습 문서에서도 기존의 SO-PMI보다 제안하는 극성 분류기가 더 좋은 성능을 보였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      With the development of computer and communications, the business model, e-commerce, occurred and it has been continuously growing. It has a problem that consumers have to buy products with a feeling of anxiety as they could not actually touch nor see...

      With the development of computer and communications, the business model, e-commerce, occurred and it has been continuously growing. It has a problem that consumers have to buy products with a feeling of anxiety as they could not actually touch nor see the products. To solve this problem, buyers get information through SNS(Social Networking Service) and rates. Opinion Mining is used to analyze this information.
      English Positive-Negative words dictionaries , such as WorldNet-Affecct, SentiWordNet are used in Opinion Mining, however, there are no Korean dictionaries. Dictionaries could be complied by hand, but it take lots of time and costs.
      The paper suggested the method for improving accuracy of the classification and conducted an experiment to verify superiority of it. SO-PMI(Semantic Orientation from Point-wise Mutual Information) is used to classify the polarity of words. To settle a matter, occurring when the polarity of Korean is classified, it improved the accuracy by establishing and preprocessing a learning data and considering characteristics. It analyzed predicate by extracting characteristics of products and using the characteristic and applying rules, used at the end of a sentence. It checked whether words, expressing emotions, were accurately classified by combining polarity classification for per characteristic. According to the result, the new classifier performed better than the existing SO-PMI by 9% and by 5% than SentiWordNet in the classification, not reflecting characteristics. On the contrary, it was better than the existing SO-PMI by 18% and by 11% than SentiWordNet. Furthermore, it evaluated the performance for each amount of documents by randomly collecting and refining them. In this case, the classifier also performed better than the existing SO-PMI.

      더보기

      목차 (Table of Contents)

      • 1. 서 론 1
      • 1.1 연구 배경 1
      • 1.2 연구 목적 2
      • 2. 관련 연구 3
      • 2.1 오피니언 마이닝 3
      • 1. 서 론 1
      • 1.1 연구 배경 1
      • 1.2 연구 목적 2
      • 2. 관련 연구 3
      • 2.1 오피니언 마이닝 3
      • 2.2 SentiWordNet을 이용한 극성의 분류 3
      • 2.3 PMI(Point-wise Mutual Information) 4
      • 2.4 단어의 선정 기준 7
      • 2.5 -통계량 9
      • 2.6 감성 분석 알고리즘 10
      • 3. 제품 특징의 극성 분류를 이용한 사전 구축 12
      • 3.1 제품 특징 추출 12
      • 3.2 제품 특징을 이용한 단어의 극성 분류 15
      • 3.3 제품 특징을 이용한 감성 분석 19
      • 4. 실험 24
      • 4.1 평가 방법 24
      • 4.2 비교 방법 28
      • 4.3 제안 방법 평가 29
      • 5. 결 론 44
      • 참고문헌 45
      • 영문초록(Abstract) 47
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼