제4차 산업혁명 시대에 접어들며 데이터 활용의 중요성이 점차 강조되고 있다. 다양한 분야에서 데이터를 매칭하고 활용하려는 수요가 증가하면서 새 로운 가치 창출의 가능성이 열리고 있...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T17177948
청주 : 충북대학교 일반대학원, 2025
학위논문(박사) -- 충북대학교 일반대학원 , 통계학과(원) , 2025. 2
2025
한국어
충청북도
96 ; 26 cm
지도교수: 허태영
I804:43009-200000863815
0
상세조회0
다운로드제4차 산업혁명 시대에 접어들며 데이터 활용의 중요성이 점차 강조되고 있다. 다양한 분야에서 데이터를 매칭하고 활용하려는 수요가 증가하면서 새 로운 가치 창출의 가능성이 열리고 있...
제4차 산업혁명 시대에 접어들며 데이터 활용의 중요성이 점차 강조되고 있다. 다양한 분야에서 데이터를 매칭하고 활용하려는 수요가 증가하면서 새 로운 가치 창출의 가능성이 열리고 있다. 국외에서는 데이터 매칭과 관련된 다양한 방법론이 오래전부터 활발히 연구되었으나, 국내에서는 주로 주민등록 번호와 같은 고유 식별자를 기반으로 한 결정적 자료연계 방식이 활용되어 왔 다. 이러한 방식은 데이터 불일치, 오류 문제, 그리고 개인정보 보호 규정 강 화로 인해 한계를 드러내고 있다. 본 연구는 이러한 한계를 해결하기 위해 확률적 자료연계 방법을 활용하여 데이터 매칭 성능을 최적화하고자 하였다. 더 나아가, 로지스틱 회귀, 랜덤 포 레스트, 그라디언트 부스팅 등 기계학습 방법을 도입하여 기존 방법론과 매칭 성능을 비교·분석하였다. 분석 결과, 기계학습 기반 자료연계 방식이 기존 확 률적 자료연계 방법보다 우수한 성능을 보였으며, 데이터 매칭에 있어 충분히 실용적인 가능성을 확인하였다. 본 연구는 데이터 통합 문제를 해결하기 위한 기계학습 기반 자료연계의 실용적이고 견고한 해결책을 제안한다. 주요 용어 : 데이터 매칭, 확률적 자료연계, 기계학습 접근방법
다국어 초록 (Multilingual Abstract)
The importance of data utilization has been increasingly emphasized in the Fourth Industrial Revolution. As the demand for data matching and utilization grows across various fields, new opportunities for value creation are emerging. While diverse meth...
The importance of data utilization has been increasingly emphasized in the Fourth Industrial Revolution. As the demand for data matching and utilization grows across various fields, new opportunities for value creation are emerging. While diverse methodologies related to data matching have been extensively researched internationally, Korea has predominantly relied on deterministic record linkage methods based on unique identifiers such as resident registration numbers. These methods, however, face limitations due to data inconsistencies, errors, and the tightening of privacy protection regulations. This study aims to address these limitations by optimizing data matching performance through probabilistic record linkage methods. Furthermore, machine learning techniques such as logistic regression, random forests, and gradient boosting were introduced to compare and analyze performance against existing methods. The results demonstrate that machine learning-based record linkage methods outperform traditional 1) A thesis for the degree of Doctor of Philosophy in February 2025. probabilistic approaches, showing substantial practical applicability in data matching. This study proposes machine learning-based record linkage as a practical and robust solution to the challenges of data integration. Keywords : data matching, probabilistic record linkage, machine learning approach
목차 (Table of Contents)