RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        부산 지역의 코로나 19 감염양상 이해를 위한 언론 텍스트 분석

        권성미(Sungmi Kwon),문형빈(Hyung Bin Monn),박윤진(Yoonjin Park),김윤희(Yun Hee Kim),이운식(Woon Seeok Lee),노맹석(Maengseok Noh) 한국자료분석학회 2022 Journal of the Korean Data Analysis Society Vol.24 No.1

        본 연구의 목적은 텍스트 마이닝 기법을 활용해 코로나 19 관련 언론 텍스트를 분석하여 코로나 19 감염양상과 관련해 어떠한 이슈가 지역사회 부산에 팽배해 있는지, 또 대중의 관점에서 어떠한 논의가 쟁점화되고 있는지를 기술함으로써, 코로나 19에 대한 지역사회의 인식을 파악하고, 코로나 19에 대한 선제 대응 방안 개발을 위한 기초 자료를 제공하는 것이다. 연구를 위해, 본고는 먼저 기사 검색 포털인 빅카인즈를 사용해 2020년 1월부터 2021년 9월까지 ‘코로나 19와 부산’에 관한 기사, 1,979개를 수집했다. 그리고 수집된 기사문 텍스트를 자연어 처리를 통해 통계 분석이 가능한 데이터로 변환하고 정제한 후, 토픽 모델링과 의미연결망 분석을 실행하였다. 조사 결과는 다음과 같이 나타났다. 첫째, 3개월을 한 단위로 한 7개 분기별 워드 클라우드를 분석한 결과, 분기별 고빈도 단어에 뚜렷한 차이를 보였다. 둘째, 임베딩을 활용해 탐색적 분석을 실시한 결과, ‘발생 장소’, ‘발생 추이’, ‘치료 병상 현황’, ‘경제적인 영향’ 등의 주제를 가진 단어들이 대표 주제어 부류들로 나타났다. 셋째, 토픽 모델링을 실행한 결과, ‘발생 현황’, ‘산업 현황’, ‘방역 및 백신’, ‘생활 영향’과 같은 4개의 주요 토픽으로 기사가 분류되었다. The purposes of the study were to analyze the media texts related to COVID-19 using text mining techniques based on natural language processing to find out what issues are prevalent in the community and what discussions are being made from the public s point of view and to provide the basic data for the development of preemptive measures for the community to respond to COVID-19. For the research, the paper, first, collected 1,979 articles about ‘COVID-19 and Busan’ through Big Kinds, an article search web portal, and conducted topic modeling and semantic network analysis after converting and refining the collected article texts into data that can be analyzed statistically with natural language processing. The results were as follows. First, as a result of analyzing word clouds of seven quaters, there was a clear difference in the high frequency words for each quarter. Second, exploratory analysis using embedding revealed that words with themes such as ‘situation of occurrence’, ‘occurrence trend’, ‘capacity of care beds’, and ‘economic effect’ were found as representative keyword classes. Third, as a result of topic modeling, articles were classified into four main topics: ‘situation of occurrence’, ‘effects on industry’, ‘quarantine and vaccine’, and ‘effects on daily life’.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼