스키마 통합은 이질적인 XML 데이터의 효과적인 검색 및 관리를 위해 매우 중요하다. 스키마 통합을 위한 기존 연구의 대부분은 대응하는 노드의 어휘적, 구조적 유사도에 기반하여 스키마를...
스키마 통합은 이질적인 XML 데이터의 효과적인 검색 및 관리를 위해 매우 중요하다. 스키마 통합을 위한 기존 연구의 대부분은 대응하는 노드의 어휘적, 구조적 유사도에 기반하여 스키마를 클러스터링하여 통합에 적절하지 않고, 또한 노드간 매칭 및 사용자의 개입을 통해 스키마를 통합하므로 높은 시간 복잡도를 갖는다.본 논문에서는 스키마 사이의 공통 구조에 기반한 효율적인 통합 알고리즘을 제안한다. 스키마 통합 과정은 일반적으로 스키마 클러스터링과 통합 스키마 추출의 두 단계로 나뉜다. 제안된 방법은 스키마를 통합하는 비용이 적을수록 유사하다는 가정하에 스키마를 클러스터링한다. 이를 위해 경로간 매칭을 통해 스키마 사이의 공통구조를 계산하고 공통구조의 크기에 기반해 스키마를 계층적으로 클러스터링한다. 또한 공통구조를 기반으로 대응되는 경로간의 이름, 데이터 타입 및 구조적 충돌을 해결하여 두 스키마를 포괄하는 통합 스키마를 생성한다.제안된 방법의 성능을 평가하기 위해서 다수의 XML 스키마를 대상으로 실험한 결과, 통합 스키마의 정확성 및 시간 복잡도 면에서 기존의 방법보다 우수하였다.