RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      문헌정보학 분야의 KoBERT 기반 문헌 자동 분류 및 동적 토픽 모델링에 의한 연구 동향 분석

      한글로보기

      https://www.riss.kr/link?id=T16647580

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      본 연구는 문헌정보학 분야의 학술지인 한국정보관리학회지, 한국문헌정보학회지, 한국비블리아학회지, 한국도서관·정보학회지에 1970년부터 2021년까지 기재된 논문 6,161건을 대상으로 자동 문헌 분류 및 연구 동향 분석을 실시하였다.
      자동 문헌 분류 기준은 문헌정보학 4대 하위 영역인 도서관학, 정보학, 서지학, 기록관리학으로 삼았다. 분류 모델은 딥러닝 기반의 자연어 처리 모델인 KoBERT를 사용하였으며 문헌정보학 분야에 특화된 분류를 수행할 수 있도록 수집된 논문 중 1,540건을 모델에 파인튜닝한 뒤 분류를 실시하였다. 모델의 테스트 데이터 셋은 정확도(Accuracy) 및 크로스 엔트로피 손실 함수(Cross entropy loss)를 통해 검증하였고 정확도가 99%, 오차가 0.006으로 나타남을 통해 본 논문에서 활용된 문헌정보학 하위 영역 분류 모델이 유의미한 결과를 도출했다고 보았다.
      도서관학, 정보학, 서지학, 기록관리학으로 분류된 논문은 빈도 분석 및 주제 분석을 통해 연구의 발전 방향과 트렌드를 살펴보고자 하였다. 먼저, 빈도 분석을 통해 도서관, 기록관리학은 상승 추세를 보이고 있으며, 서지학은 하락 추세를 보이고 있음을 확인하였다. 정보학은 도서관학과 함께 전체 연구 주제의 약 95%를 차지하는 만큼 우세한 연구 성과를 보였지만 도서관학과는 달리 출판 비율을 유지하는 수준을 보이며 상승 추세는 나타나지 않았다.
      다음으로, 도서관학, 정보학, 서지학, 기록관리학 분야별 주제 분석을 실시하였다. 주제 분석은 다이나믹 토픽 모델링을 통해 시간의 흐름에 따른 주제의 변화 흐름을 분석하였다. 그 결과, 2010년 이후 문헌정보학의 전체 하위 영역에서 ‘인공지능’ 및 ‘인터넷’을 활용한 데이터의 보존 관리, 이용자 연구 및 프로그램 등이 나타남에 따라 문헌정보학의 최근 연구 동향에서도 4차 산업혁명의 영향이 나타나고 있을 뿐만 아니라 전 분야에서 기술의 융합이 활발하게 이루어지고 있음을 확인하였다.
      본 연구는 문헌정보학 분야에 특화된 딥러닝 기반의 자연어 처리 모델인 KoBERT로 유의미한 분류 성과를 도출했다는 것과 빈도 분석 및 동적 토픽 모델링을 이용해 문헌정보학의 초기부터 현재까지의 연구 주제 트렌드와 발전 동향을 파악했다는 것에 실질적인 함의가 있다.
      번역하기

      본 연구는 문헌정보학 분야의 학술지인 한국정보관리학회지, 한국문헌정보학회지, 한국비블리아학회지, 한국도서관·정보학회지에 1970년부터 2021년까지 기재된 논문 6,161건을 대상으로 자�...

      본 연구는 문헌정보학 분야의 학술지인 한국정보관리학회지, 한국문헌정보학회지, 한국비블리아학회지, 한국도서관·정보학회지에 1970년부터 2021년까지 기재된 논문 6,161건을 대상으로 자동 문헌 분류 및 연구 동향 분석을 실시하였다.
      자동 문헌 분류 기준은 문헌정보학 4대 하위 영역인 도서관학, 정보학, 서지학, 기록관리학으로 삼았다. 분류 모델은 딥러닝 기반의 자연어 처리 모델인 KoBERT를 사용하였으며 문헌정보학 분야에 특화된 분류를 수행할 수 있도록 수집된 논문 중 1,540건을 모델에 파인튜닝한 뒤 분류를 실시하였다. 모델의 테스트 데이터 셋은 정확도(Accuracy) 및 크로스 엔트로피 손실 함수(Cross entropy loss)를 통해 검증하였고 정확도가 99%, 오차가 0.006으로 나타남을 통해 본 논문에서 활용된 문헌정보학 하위 영역 분류 모델이 유의미한 결과를 도출했다고 보았다.
      도서관학, 정보학, 서지학, 기록관리학으로 분류된 논문은 빈도 분석 및 주제 분석을 통해 연구의 발전 방향과 트렌드를 살펴보고자 하였다. 먼저, 빈도 분석을 통해 도서관, 기록관리학은 상승 추세를 보이고 있으며, 서지학은 하락 추세를 보이고 있음을 확인하였다. 정보학은 도서관학과 함께 전체 연구 주제의 약 95%를 차지하는 만큼 우세한 연구 성과를 보였지만 도서관학과는 달리 출판 비율을 유지하는 수준을 보이며 상승 추세는 나타나지 않았다.
      다음으로, 도서관학, 정보학, 서지학, 기록관리학 분야별 주제 분석을 실시하였다. 주제 분석은 다이나믹 토픽 모델링을 통해 시간의 흐름에 따른 주제의 변화 흐름을 분석하였다. 그 결과, 2010년 이후 문헌정보학의 전체 하위 영역에서 ‘인공지능’ 및 ‘인터넷’을 활용한 데이터의 보존 관리, 이용자 연구 및 프로그램 등이 나타남에 따라 문헌정보학의 최근 연구 동향에서도 4차 산업혁명의 영향이 나타나고 있을 뿐만 아니라 전 분야에서 기술의 융합이 활발하게 이루어지고 있음을 확인하였다.
      본 연구는 문헌정보학 분야에 특화된 딥러닝 기반의 자연어 처리 모델인 KoBERT로 유의미한 분류 성과를 도출했다는 것과 빈도 분석 및 동적 토픽 모델링을 이용해 문헌정보학의 초기부터 현재까지의 연구 주제 트렌드와 발전 동향을 파악했다는 것에 실질적인 함의가 있다.

      더보기

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      This study conducted an automatic classification and analysis of research trends on 6,161 papers published in the Journal of the Korean Society for Information Management, Journal of the Korean Society for Library and Information Science, Journal of the Korean Biblia Society for Library and Information Science, and Journal of Korean Library and Information Science Society from 1970 to 2021.
      The criteria for automatic classification were library science, information science, bibliography, and record management, which are the four sub-areas of library and Information science. The classification model used KoBERT, a deep learning-based natural language processing model, In order to perform classification specialized in library and information science, so 1,540 of the collected papers were fine-tuned to the model and then classified. The test dataset of the model was validated with accuracy and cross entropy loss and was found to be 99% and 0.006, respectively. Therefore, it was considered that the sub-area classification model of library and Information science used in this paper derived significant result.
      The papers classified into library science, information science, bibliograpy, and record management attempted to examine the direction and trends of research through frequency analysis and topic analysis. First, through frequency analysis, it was found that library science and record management studies are showing an upward trend, and bibliography is showing a downward trend. Information science, along with library science, showed superior publishing results as it accounted for about 95% of the total research topics, bout unlike library science, it only maintained the publishing rate and did not show an upward trend.
      Next, topic analysis by filed of library science, information science, bibliograpy, and record management was conducted. The Topic analysis analyzed the flow of change over time through dynamic topic modeling. As a result, data preservation management, user research, and programs using ‘Artificial intelligence’ and ‘Internet’ have appeared in all sub-areas since 2010, and recent research trends in library and information science have also shown an impact on the fourth industrial revolution and are actively converging technologies.
      This study has practical implications in that it derived meaningful classification results with KoBERT, a deep learning-based natural language processing model specialized in the field of library and information science, and identified trends in research topics from the beginning to the present using frequency analysis and dynamic topic modeling.
      번역하기

      This study conducted an automatic classification and analysis of research trends on 6,161 papers published in the Journal of the Korean Society for Information Management, Journal of the Korean Society for Library and Information Science, Journal of t...

      This study conducted an automatic classification and analysis of research trends on 6,161 papers published in the Journal of the Korean Society for Information Management, Journal of the Korean Society for Library and Information Science, Journal of the Korean Biblia Society for Library and Information Science, and Journal of Korean Library and Information Science Society from 1970 to 2021.
      The criteria for automatic classification were library science, information science, bibliography, and record management, which are the four sub-areas of library and Information science. The classification model used KoBERT, a deep learning-based natural language processing model, In order to perform classification specialized in library and information science, so 1,540 of the collected papers were fine-tuned to the model and then classified. The test dataset of the model was validated with accuracy and cross entropy loss and was found to be 99% and 0.006, respectively. Therefore, it was considered that the sub-area classification model of library and Information science used in this paper derived significant result.
      The papers classified into library science, information science, bibliograpy, and record management attempted to examine the direction and trends of research through frequency analysis and topic analysis. First, through frequency analysis, it was found that library science and record management studies are showing an upward trend, and bibliography is showing a downward trend. Information science, along with library science, showed superior publishing results as it accounted for about 95% of the total research topics, bout unlike library science, it only maintained the publishing rate and did not show an upward trend.
      Next, topic analysis by filed of library science, information science, bibliograpy, and record management was conducted. The Topic analysis analyzed the flow of change over time through dynamic topic modeling. As a result, data preservation management, user research, and programs using ‘Artificial intelligence’ and ‘Internet’ have appeared in all sub-areas since 2010, and recent research trends in library and information science have also shown an impact on the fourth industrial revolution and are actively converging technologies.
      This study has practical implications in that it derived meaningful classification results with KoBERT, a deep learning-based natural language processing model specialized in the field of library and information science, and identified trends in research topics from the beginning to the present using frequency analysis and dynamic topic modeling.

      더보기

      목차 (Table of Contents)

      • 목차
      • Ⅰ. 서 론 1
      • 1.1 연구의 필요성 및 목적 1
      • 1.2 연구 문제 5
      • 목차
      • Ⅰ. 서 론 1
      • 1.1 연구의 필요성 및 목적 1
      • 1.2 연구 문제 5
      • Ⅱ. 이론적 배경 및 선행연구 6
      • 2.1 이론적 배경 6
      • 2.1.1 자연어 처리 6
      • 2.1.2 임베딩(Embedding) 기법 9
      • 2.1.3 문헌 분류 11
      • 2.1.3.1 문헌 분류 정의 및 종류 11
      • 2.1.3.2 머신러닝 기반의 문헌 자동 분류 13
      • 2.1.3.3 딥러닝 기반의 문헌 자동 분류 14
      • 2.1.4 KoBERT 15
      • 2.1.5 LDA 기반의 동적 토픽 모델링 21
      • 2.1.5.1 LDA(Latent Dirichlet Allocation) 21
      • 2.1.5.2 동적 토픽 모델링 22
      • 2.1.6 분류 성능 평가 지표 23
      • 2.1.6.1 정확도(Accuracy) 23
      • 2.1.6.2 크로스 엔트로피 손실 함수(Cross entropy loss) 24
      • 2.2 선행연구 25
      • 2.2.1 문헌정보학의 정의 및 세부 학문 영역에 대한 선행 연구 25
      • 2.2.2 도서관, 정보학, 서지학, 기록관리학에 대한 선행 연구 31
      • 2.2.3 문헌정보학의 연구 동향 분석 방법에 대한 선행 연구 38
      • 2.2.4 자동 문헌 분류 기법을 활용한 선행 연구 43
      • Ⅲ. 연구 방법 46
      • 3.1 연구 절차 46
      • 3.2 데이터 수집 47
      • 3.3 전처리 및 형태소 분석 48
      • 3.4 데이터 분류 51
      • 3.5 성능 평가 54
      • 3.6 문헌정보학 동향 분석 55
      • Ⅳ. 연구 결과 및 분석 57
      • 4.1 모델 성능 평가 결과 57
      • 4.2 빈도 분석 결과 58
      • 4.3 동적 토픽 모델링 결과 61
      • 4.3.1 Coherence Value 산출 결과 61
      • 4.3.1.1 도서관학의 Coherence Value 산출 결과 61
      • 4.3.1.2 정보학의 Coherence Value 산출 결과 63
      • 4.3.1.3 서지학의 Coherence Value 산출 결과 65
      • 4.3.1.4 기록관리학의 Coherence Value 산출 결과 67
      • 4.3.2 주제 분석 결과 69
      • 4.3.2.1 도서관학의 주제 분석 결과 69
      • 4.3.2.2 정보학의 주제 분석 결과 74
      • 4.3.2.3 서지학의 주제 분석 결과 81
      • 4.3.2.4 기록관리학의 주제 분석 결과 84
      • Ⅴ. 논의 및 결론 89
      • 참고문헌 93
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼