http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
데이터 코드 개념을 이용한 데이터 마이닝 접근성 확장 기법
박성공(Sung-Kong Park),박대하(Dae-Ha Park),백두권(Doo-Kwon Baik) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.2Ⅰ
데이터 마이닝의 응용 범위는 넓고 다양하기 때문에 사용자들에게 융통성 있고 쉬운 접근 방법의 제공이 필요하다. 데이터 마이닝의 대상이 되는 데이터베이스는 대용량의 데이터와 다수의 속성으로 이루어져 있다. 그러나 사용자는 데이터베이스의 일부에만 관심이 있기 때문에 데이터 마이닝은 데이터의 부분 집합으로 가능하다. 이 방법은 사용자에게 데이터의 부분 집합을 생성하기 위해 많은 배경지식을 요구한다. 본 논문에서는 데이터 코드의 분석으로 얻은 배경지식을 사용하여, 사용자에게 데이터 마이닝을 위한 간단하고 자연어와 유사한 형태의 질의가 가능하도록 하는 기법을 제안하고, 제안하는 기법이 조인의 횟수를 줄임을 보인다.
백두권,최요한,박성공,이정욱,정동원,Baik, Doo-Kwon,Choi, Yo-Han,Park, Sung-Kong,Lee, Jeong-Oog,Jeong, Dong-Won 한국정보처리학회 2003 정보처리학회논문지D Vol.10 No.2
To share and standardize information, especially in the database environments, MDR (Metadata Registry) can be used to integrate various heterogeneous databases within a particular domain. But due to the discrepancies of data element representation between organizations, global information integration is not so easy. And users who are searching integrated information on the Web have limitation to obtain schema information for the underlying source databases. To solve those problems, in this paper, we present a 3-layered Information Integration System (LI2S) based on MDRs and Ontology. The purpose of proposed architecture is to define information integration model, which combine both of the nature of MDRs standard specification and functionality of ontology for the concept and relation. Adopting agent technology to the proposed model plays a key role to support the hierarchical and independent information integration architecture. Ontology is used as for a role of semantic network from which it extracts concept from the user query and the establishment of relationship between MDRs for the data element. (MDR and Knowledge Base are used as for the solution of discrepancies of data element representation between MDRs. Based on this architectural concept, LI2S was designed and implemented. 한 도메인 내에서 다양한 데이터베이스의 데이터를 공유하고 표준화하기 위해 MDR(Metadata Registry)을 이용하여 정보를 통합할 수 있다. 그러나 MDR을 구축하는 조직간 데이터요소 표현의 불일치 때문에 MDR간 광역적인 정보를 통합하는데 어려움이 있다. 또한 웹과 같은 다양한 데이터베이스가 존재하는 환경에서 통합된 정보를 검색하고자 하는 사용자는 각각의 데이터베이스 스키마 정보를 확보하기엔 한계가 있다. 따라서 본 논문에서는 MDR과 온톨로지(Ontology)를 결합한 3계층 정보 통합 시스템을 제안한다. MDR간 데이터요소의 관계를 사상시키고 표현의 불일치를 해결하기 위해 MDR의 표준성기능과 온톨로지의 개념과 관계기능을 결합한 정보 통합 모델을 정의하고 에이전트 기술을 적용한 계층적이고 독립적인 정보 통합 아키텍처를 제안한다. 온톨로지는 사용자의 질의에서 개념을 추출하기 위한 의미망(semantic network)의 역할과 MDR간의 데이터요소 관계를 설정하기 위한 기능으로 적용되었다. MDR과 지식베이스(Knowledge Base)는 데이터요소간 표현 불일치를 해결하기 위해 적용하였다. 이러한 핵심요소를 고려하여 제안된 아키텍처를 사용하여 MDR과 온톨로지를 결합한 3계층 정보 통합 시스템을 구현하였다.
권도훈(Do-Hoon Kwon),박성공(Sung-Kong Park),이정욱(Jeong-Oog Lee),백두권(Doo-Kwon Baik) 한국정보과학회 2001 한국정보과학회 학술발표논문집 Vol.28 No.1B
온라인 정보 소스와 정보 사용자의 수는 인터넷과 통신 기술의 확산으로 급속히 증가하고 있다. 이는 정보시스템간의 통합을 요구한다. 정보 시스템 통합에 대한 연구는 오래 전부터 시작되었고, 많은 결과들이 발표되고 있다. 하지만 기존의 정보통합 방법은 일반적으로 CDM(Common Data Model)작성과 스키마간 통합 등을 요구하고 있다. 이는 최종 사용자에게 다양한 질의를 제공하기 위함이다. 하지만, 일반적으로 시스템 최종사용자는 사용자 인터페이스 수준의 질의 유형만을 요구한다. 이 경우 다양한 질의를 제공하기 위한 기존 정보시스템들의 요구사항은 많은 오버헤드로 작용한다. 본 논문은 웹환경과 같이 질의 유형이 제한된 곳에서 정보시스템 통합 시 기존 정보 통합 방법의 오버헤드를 제거하기 위한 방법으로서 데이터베이스 접근 인터페이스를 중심으로 한 정보 통합방법을 제안한다. 이는 질의유형이 제한된 곳에서 기존의 데이터베이스 통합 방법에 비해 단순하고, 확장성 있는 데이터베이스 통합을 제공한다.
통합 정보시스템에서의 데이터 이질성 해결 방안에 관한 연구
박성진(Seong Jin Park),박성공(Sung Kong Park),박화규(Hwa Gyoo Park) 한국IT서비스학회 2008 한국IT서비스학회지 Vol.7 No.4
As the technologies for telecommunication have been evolving, more enhanced information services and integrated information systems have been introduced, which can manage a variety of information from the heterogeneous systems. The major obstacle for the integrated information systems is the integrating heterogeneous databases in the systems and the heterogeneity problems can be classified into the structural and data heterogeneities. However, the previous researches have mainly highlighted into the solving structural heterogeneity problems. This paper identifies the data heterogeneity problems for multi-database schema integrations and proposes a new solving method. We analyze the semantics equivalence in data values based on the functional dependency, primary and candidate keys, and present a procedural solution of data heterogeneity in the perspective of the concept of attribute equivalence, integration key and conceptual integration table.
이기종 데이터베이스 환경의 정보 통합을 위한 I2System( : Information Integration System) 설계
권도훈(Do-Hoon Kwon),박성공(Sung-Kong Park),이정욱(Jeong-Oog Lee),백두권(Doo-Kwon Baik) 한국정보과학회 2001 한국정보과학회 학술발표논문집 Vol.28 No.2Ⅰ
인터넷과 통신기술의 발전으로 온라인 정보소스와 정보사용자의 수가 증가되었다. 이것은 정보시스템간 특히 데이터베이스간의 통합을 요구한다. 데이터베이스간 통합에 대한 연구는 오래 전부터 시작되었고, 많은 결과들이 발표되고 있다. 기존의 데이터베이스간 통합 방법은 일반적으로 전역데이터모델(Global Data Model)을 제공해야하며, 전역스키마(Global Schema) 작성, 전역시키마와 지역스키마간 번역과 같은 복잡한 작업들을 필요로 한다. 이는 최종 사용자에게 다양한 질의(정보)와 이질적인 지역 데이터베이스들에 대한 단일접근방법을 제공하기 위함이다. 하지만 데이터베이스간 통합이 요구되는 영역에서 필요한 정보만 제공해 준다면 다양한 질의를 제공하기 위한 기존 정보통합시스템들의 요구사항은 오버헤드로 작용한다. 본 논문은 데이터베이스간 통합 시 필요한 정보를 기반으로 데이터베이스간 통합을 하는 I2System(Information Integration System)을 제안한다. 이는 기존의 정보통합방법의 오버헤드를 줄이며, 단순하고 확장성 있는 데이터베이스간 통합을 제공한다.
GSN 기반 DB통합 모델에서의 data value 이질성 해결 기법
홍종하(Jong-Ha Hong),박성공(Sung-Kong Park),이정욱(Jeong-Oog Lee),백두권(Doo-Kwon Baik) 한국정보과학회 2001 한국정보과학회 학술발표논문집 Vol.28 No.2Ⅰ
분산되고 이질적인 환경에서의 정보 소스들을 통합하려는 노력은 끊임 없이 계속되어 왔다. 이질적인 다중 정보소스로부터 추출된 정보를 통합된 도구를 개발하는 것을 인터넷 기반에서 다양한 정보들을 실시간으로 사용할 수 있다는 측면에서 아주 흥미로운 일이다. 이러한 도구를 개발하는데 있어서의 주된 문제점은 서로 다른 정보소스에 존재하지만 실제적으로는 같은 실세계의 개념을 가지고 있는 정보를 어떻게 효과적으로 표현할 것인가 하는 것이다. 이러한 의미적 이질성을 해결하기 위해서 WordNet이나 Common Thesaurus 등을 이용한 개념 기반의 접근방법이 많이 제안되었다. 하지만 이들은 스키마 이질성을 해결하는 방법은 제시 할 뿐, 데이터의 이질성을 해결 하는 방법은 보여주지 않는다. 본 논문에서는 GSN(Global Semantic Network)을 이용해서 스키마 이질성을 해결하는 데이터베이스 시스템에서 발생하는 데이터 이질성의 예를 제시하고 이러한 데이터 이질성을 해결할 수 있는 기법을 제안한다.
이선정(Sun-Jung Lee),박윤주(Yoon-Joo Park),박성공(Sung-Kong Park),문창주(Chang-Joo Moon),백두권(Doo-Kwon Baik) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B
웹 환경의 기존 멀티데이타베이스의 질의는 일반 사용자가 사용하기에는 복잡하고, 동적인 전역 스키마의 구성과 유지보수의 어려우며, 자유롭게 새로운 데이타베이스의 연합이 계속되는 동적인 웹 환경에 적응력이 떨어진다. 이런 단점을 해결하기 위한 방안으로 개념 기반 질의를 제안한다. 개념 기반 질의는 주어진 개념 하에서 멀티소스를 하나의 소스처럼 질의할 수 있도록 하였다. 개념 질의를 위해, 멀티데이타소스의 이질적 스키마의 속성들을 개념 기반으로 하였으며, 이로써 일반 사용자는 보다 쉽고 풍부한 개념 기반 질의를 표현할 수 있다.
소프트웨어 아키텍쳐에 기반한 코바 컴포넌트 모델링 기법
문창주(Chang-Joo Moon),이선정(Sun-Jung Lee),박성공(Sung-Kong Park),백두권(Doo-Kwon Baik) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅰ
현재의 코바 컴포넌트를 개발 하는 방법은 대상 시스템 분석 후, IDL로 인터페이스와 시스템을 명세 한 다음 언어를 선택하여 구현을 한다. 하지만 시스템분석에서 IDL로 전환은 어려운 작업이며 아직까지 진행된 연구가 부족 하다. 따라서 본 논문에서는 IDL작성 전의 시스템 분석과 검증 단계를 소프트웨어 아키텍쳐 접근 방법을 이용한 SACM(Software Architecture-based Component Modeling) 기법을 제안 하였다. SACM은 정확한 IDL을 작성 뿐만 아니라 구현 단계까지 청사진을 제시 한다. SACM 기법을 따르는 경우 효과적으로 컴포넌트 개발이 가능하며, 코드의 재사용 측면도 효과적으로 지원해 준다.
효과적 질의 처리를 위한 메타데이터 기반 실체 뷰 관리 기법
이선정(Sun-Jung Lee),문창주(Chang-Joo Moon),박성공(Sung-Kong Park),백두권(Doo-Kwon Baik) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅰ
CORBA/JAVA 기반의 멀티데이터 소스에 대한 통합 질의 환경에서 많은 사용자가 질의를 동시에 수행함으로써, 질의 처리 성능 문제가 나타난다. 이러한 문제점을 해결하기 위해서 본 논문에서는, 메타데이터를 이용하여 분할된 질의에 대한 실체 뷰(Materialized view)를 관리함으로써, 질의 처리를 향상시키는 기법을 제안한다. 제안된 기법은 자주 사용되는 실체 뷰를 캐쉬에 유지시키으로써, 재사용율을 높이고, 질의 절차를 감소시켜, 중복되는 질의의 반복 수행을 줄인다.