http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
토픽 모델을 사용한 베스트셀러 서적 단문 의미 분석 연구
박소현,송애린,박영호,임선영 동국대학교 영상문화콘텐츠연구원 2018 영상문화콘텐츠연구 Vol.0 No.-
최근 상품 설명 요약문, SNS 글, 사용자 리뷰 등과 같이 단문 형태의텍스트 데이터의 양이 증가하고 있으며, 이런 단문 데이터는 사용자의 의견이 함축되어 있기 때문에 중요성이 날로 높아지고 있다. 텍스트 마이닝(text mining)은 비정형 텍스트로부터 유용한 패턴을 추출하는 기법이다. 텍스트 마이닝 중 하나인 토픽 모델(topic model)은 주제 분석 기법으로써 대표적인 방법으로는 LDA(Latent Dirichlet Allocation), BTM(Biterm Topic Mode)과 BTM을 개선시킨 WV-BTM(Word2Vec Biterm Topic Model)이 있다. 본 논문에서는 WV-BTM 모델을 베스트셀러 서적 요약문 데이터에 적용하여 단문의 의미를 분석 하는 연구를 진행하고자 한다. Recently, the amount of short text data such as a summary of product description, SNS articles, and user reviews has been increasing. Such short text data is becoming increasingly important because the opinions of users are implied. ext mining is a technique for extracting useful patterns from unstructured text. The topic model, which is one of text mining, is LDA (Latent Dirichlet Allocation), BTM (Biterm Topic Model) and WV-BTM (Word2Vec Biterm Topic Model) which are improved BTM. In this paper, we apply WV-BTM model to book bestseller data to analyze semantics of short text.
토픽 모델을 사용한 베스트셀러 서적 단문 의미 분석 연구
박소현(So-Hyun Park),송애린(Ae-Rin Song),박영호(Young-Ho Park),임선영(Sun-Young Ihm) 동국대학교 영상문화콘텐츠연구원 2018 영상문화콘텐츠연구 Vol.15 No.-
최근 상품 설명 요약문, SNS 글, 사용자 리뷰 등과 같이 단문 형태의 텍스트 데이터의 양이 증가하고 있으며, 이런 단문 데이터는 사용자의 의견이 함축되어 있기 때문에 중요성이 날로 높아지고 있다. 텍스트 마이닝(text mining)은 비정형 텍스트로부터 유용한 패턴을 추출하는 기법이다. 텍스트 마이닝 중 하나인 토픽 모델(topic model)은 주제 분석 기법으로써 대표적인 방법으로는 LDA(Latent Dirichlet Allocation), BTM(Biterm Topic Mode)과 BTM을 개선시킨 WV-BTM(Word2Vec Biterm Topic Model)이 있다. 본 논문에서는 WV-BTM 모델을 베스트셀러 서적 요약문 데이터에 적용하여 단문의 의미를 분석 하는 연구를 진행하고자 한다. Recently, the amount of short text data such as a summary of product description, SNS articles, and user reviews has been increasing. Such short text data is becoming increasingly important because the opinions of users are implied. ext mining is a technique for extracting useful patterns from unstructured text. The topic model, which is one of text mining, is LDA (Latent Dirichlet Allocation), BTM (Biterm Topic Model) and WV-BTM (Word2Vec Biterm Topic Model) which are improved BTM. In this paper, we apply WV-BTM model to book bestseller data to analyze semantics of short text.