본 연구는 문헌정보학 분야의 학술지인 한국정보관리학회지, 한국문헌정보학회지, 한국비블리아학회지, 한국도서관·정보학회지에 1970년부터 2021년까지 기재된 논문 6,161건을 대상으로 자�...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T16647580
서울 : 성균관대학교 일반대학원, 2023
학위논문(석사) -- 성균관대학교 일반대학원 , 문헌정보학과 , 2023. 2
2023
한국어
서울
An automatic classification based on KoBERT and an analysis of research trends by dynamic topic modeling in library and information science
vii, 121 p. : 삽화 ; 30 cm
지도교수: 김영식
참고문헌: p. 93-118
I804:11040-000000172918
0
상세조회0
다운로드본 연구는 문헌정보학 분야의 학술지인 한국정보관리학회지, 한국문헌정보학회지, 한국비블리아학회지, 한국도서관·정보학회지에 1970년부터 2021년까지 기재된 논문 6,161건을 대상으로 자�...
본 연구는 문헌정보학 분야의 학술지인 한국정보관리학회지, 한국문헌정보학회지, 한국비블리아학회지, 한국도서관·정보학회지에 1970년부터 2021년까지 기재된 논문 6,161건을 대상으로 자동 문헌 분류 및 연구 동향 분석을 실시하였다.
자동 문헌 분류 기준은 문헌정보학 4대 하위 영역인 도서관학, 정보학, 서지학, 기록관리학으로 삼았다. 분류 모델은 딥러닝 기반의 자연어 처리 모델인 KoBERT를 사용하였으며 문헌정보학 분야에 특화된 분류를 수행할 수 있도록 수집된 논문 중 1,540건을 모델에 파인튜닝한 뒤 분류를 실시하였다. 모델의 테스트 데이터 셋은 정확도(Accuracy) 및 크로스 엔트로피 손실 함수(Cross entropy loss)를 통해 검증하였고 정확도가 99%, 오차가 0.006으로 나타남을 통해 본 논문에서 활용된 문헌정보학 하위 영역 분류 모델이 유의미한 결과를 도출했다고 보았다.
도서관학, 정보학, 서지학, 기록관리학으로 분류된 논문은 빈도 분석 및 주제 분석을 통해 연구의 발전 방향과 트렌드를 살펴보고자 하였다. 먼저, 빈도 분석을 통해 도서관, 기록관리학은 상승 추세를 보이고 있으며, 서지학은 하락 추세를 보이고 있음을 확인하였다. 정보학은 도서관학과 함께 전체 연구 주제의 약 95%를 차지하는 만큼 우세한 연구 성과를 보였지만 도서관학과는 달리 출판 비율을 유지하는 수준을 보이며 상승 추세는 나타나지 않았다.
다음으로, 도서관학, 정보학, 서지학, 기록관리학 분야별 주제 분석을 실시하였다. 주제 분석은 다이나믹 토픽 모델링을 통해 시간의 흐름에 따른 주제의 변화 흐름을 분석하였다. 그 결과, 2010년 이후 문헌정보학의 전체 하위 영역에서 ‘인공지능’ 및 ‘인터넷’을 활용한 데이터의 보존 관리, 이용자 연구 및 프로그램 등이 나타남에 따라 문헌정보학의 최근 연구 동향에서도 4차 산업혁명의 영향이 나타나고 있을 뿐만 아니라 전 분야에서 기술의 융합이 활발하게 이루어지고 있음을 확인하였다.
본 연구는 문헌정보학 분야에 특화된 딥러닝 기반의 자연어 처리 모델인 KoBERT로 유의미한 분류 성과를 도출했다는 것과 빈도 분석 및 동적 토픽 모델링을 이용해 문헌정보학의 초기부터 현재까지의 연구 주제 트렌드와 발전 동향을 파악했다는 것에 실질적인 함의가 있다.
다국어 초록 (Multilingual Abstract)
This study conducted an automatic classification and analysis of research trends on 6,161 papers published in the Journal of the Korean Society for Information Management, Journal of the Korean Society for Library and Information Science, Journal of t...
This study conducted an automatic classification and analysis of research trends on 6,161 papers published in the Journal of the Korean Society for Information Management, Journal of the Korean Society for Library and Information Science, Journal of the Korean Biblia Society for Library and Information Science, and Journal of Korean Library and Information Science Society from 1970 to 2021.
The criteria for automatic classification were library science, information science, bibliography, and record management, which are the four sub-areas of library and Information science. The classification model used KoBERT, a deep learning-based natural language processing model, In order to perform classification specialized in library and information science, so 1,540 of the collected papers were fine-tuned to the model and then classified. The test dataset of the model was validated with accuracy and cross entropy loss and was found to be 99% and 0.006, respectively. Therefore, it was considered that the sub-area classification model of library and Information science used in this paper derived significant result.
The papers classified into library science, information science, bibliograpy, and record management attempted to examine the direction and trends of research through frequency analysis and topic analysis. First, through frequency analysis, it was found that library science and record management studies are showing an upward trend, and bibliography is showing a downward trend. Information science, along with library science, showed superior publishing results as it accounted for about 95% of the total research topics, bout unlike library science, it only maintained the publishing rate and did not show an upward trend.
Next, topic analysis by filed of library science, information science, bibliograpy, and record management was conducted. The Topic analysis analyzed the flow of change over time through dynamic topic modeling. As a result, data preservation management, user research, and programs using ‘Artificial intelligence’ and ‘Internet’ have appeared in all sub-areas since 2010, and recent research trends in library and information science have also shown an impact on the fourth industrial revolution and are actively converging technologies.
This study has practical implications in that it derived meaningful classification results with KoBERT, a deep learning-based natural language processing model specialized in the field of library and information science, and identified trends in research topics from the beginning to the present using frequency analysis and dynamic topic modeling.
목차 (Table of Contents)