http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
한글 트위터상의 코로나19 백신 담론에 대한 2단계 동적 토픽 모델링 분석
서하린,서영균 한국정보과학회 2023 데이타베이스 연구 Vol.39 No.1
This study introduces a novel two-phase Dynamic Topic Modeling (DTM) technique for analyzing in time-series domestic COVID-19 vaccine-related issues latent in social media data. To this end, we collected and analyzed the Twitter data from February 2021, when starting in earnest COVID-19 vaccination implementation in Korea, to January 2023. The existing DTM technique revealed a problem in that it is difficult to analyze the hidden meaning of the topic because it is difficult to find the relevance of the keywords within the topic due to the rapidly changing trend of the COVID-19 vaccine. To resolve this challenge in analysis, in this study we conduct a macro DTM on the entire Twitter dataset to find the point at which the similarity of keywords within a topic changes, and proceed with the second phase DTM by reconstructing the dataset based on the point in time. As a result, we confirmed that the proposed two-phase DTM approach effectively identified a greater variety of topics than existing DTM. 본 연구는 소셜 미디어 데이터에 잠재하는 국내 코로나19 백신 쟁점에 대한 시계열 기반 분석을 위한 최신 2단계 동적 토픽 모델링(Dynamic Topic Modeling, DTM) 기법을 제안한다. 본 연구를 위해, 우리는 국내 코로나19 백신 접종 시행 및 계획이 본격적으로 시작된 2021년 2월부터 2023년 1월까지 작성된 트위터 데이터를 수집하여 분석하였다. 기존 DTM 기법은 추세가 급변하는 코로나19 백신 특성상 토픽 내 키워드의 연관성을 찾기 어려워 토픽의 숨겨진 의미를 분석하기 어렵다는 문제가 있다. 이러한 분석상의 난제를 해결하기 위해, 본 연구에서는 1단계로 전체 트위터 데이터셋에 대한 거시적 DTM을 수행하여 토픽 내 키워드들의 유사성이 변하는 시점을 찾고, 해당 시점들을 기준으로 데이터셋을 재구축해 2단계 DTM을 수행한다. 그 결과, 우리는 제안한 2단계 DTM에서 기존 DTM대비 더 다양한 토픽이 효과적으로 분류되는 것을 확인하였다.