http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
RDF 질의 처리 성능 향상을 위한 실체 뷰 선택 기법
박재열(Jaeyeol Park),윤상원(Sangwon Yoon),최기태(Kitae Choi),임종태(Jongtae Lim),이병엽(Byoungyup Lee),신재룡(Jaeryong Shin),복경수(Kyoungsoo Bok),유재수(Jaesoo Yoo) 한국콘텐츠학회 2015 한국콘텐츠학회논문지 Vol.15 No.12
시맨틱 웹의 발전과 함께 RDF 데이터에 대한 사용이 증가되고 있다. RDF 데이터는 트리플로 구성되어 있으며 질의 처리 시 높은 조인 비용이 요구된다. 실체 뷰는 질의 처리 비용을 감소시키는 기법으로 알려져 있다. 실체 뷰는 질의 처리의 결과 또는 중간 결과를 저장 공간 내부에 물리적으로 저장하여 질의 처리시 전체 데이터베이스의 접근이 아닌 실체 뷰의 접근으로 질의를 처리한다. 본 논문에서는 이를 해결하기 위해 의사 결정 트리를 사용하여 실체 뷰를 선택한다. 제안하는 기법은 의사 결정 트리를 통해 질의 처리시간뿐만 아니라 실체 뷰의 크기 및 유지비용을 고려한다. 성능평가를 통해 제안하는 기법이 기존 기법에 비해 제한된 저장 공간에서의 실체 뷰는 증가하였고 동일 개수의 실체 뷰의 유지비용은 감소함을 보인다. With the development of the semantic web, a large amount of data being produced nowadays is in RDF format. RDF is represented by a triple. An RDF database consisting of triples requires the high cost of join query processing. Materialized view is known as a scheme to reduce the query processing cost by accessing materialized views without accessing the database. It is physically stored the results or the intermediate results of the query processing in a storage area. In this paper, we propose a materialized view selection scheme by using decision tree to solve such a problem. The decision tree considers the size and maintenance costs of the materialized view as well as the profit of query response times. It is shown through performance evaluation that the proposed scheme increases the number of materialized views in the limited storage space and decreases the update rates of the materialized views.
데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법
김병훈(Byounghoon Kim),김대윤(Daeyun Kim),고건식(Geonsik Ko),노연우(Yeonwoo Noh),임종태(Jongtae Lim),복경수(kyoungsoo Bok),이병엽(Byoungyup Lee),유재수(Jaesoo Yoo) 한국정보과학회 2017 정보과학회 컴퓨팅의 실제 논문지 Vol.23 No.5
시맨틱 웹 서비스의 증가로 인해 RDF 데이터가 대용량화되고 있다. 대용량 RDF 데이터를 효율적으로 활용하기 위하여 다양한 분산 저장 및 질의 처리기법들이 연구되고 있다. 본 논문에서는 대용량 RDF 데이터의 데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법을 제안한다. 제안하는 기법은 질의 처리 시의 조인 비용 및 통신비용을 감소시키기 위해 분산 저장된 RDF 데이터의 지역성 및 질의 수행 경로를 고려한다. 분산 환경에서 SPARQL 질의를 처리할 때 데이터 지역성을 고려하여 WHERE절을 기준으로 해당 질의를 여러 개의 서브 질의로 분할한다. 제안하는 기법은 분할된 서브 질의들을 인덱스를 통해 연관 노드들끼리 그룹화 하여 처리함으로써 데이터 통신비용을 감소시킬 수 있다. 또한 그룹 화된 서브 질의 처리 시 불필요한 조인 및 대기 시간을 감소시키기 위해 데이터 파싱 비용, 노드별 데이터 통신량 및 대기 시간 등을 고려한 효율적인 질의 수행 경로를 생성한다. 다양한 성능평가를 통해 제안하는 기법이 기존 기법보다 우수함을 보인다. A large amount of RDF data has been generated along with the increase of semantic web services. Various distributed storage and query processing schemes have been studied to efficiently use the massive amounts of RDF data. In this paper, we propose a distributed SPARQL query processing scheme that considers the data locality and query execution path of large RDF data. The proposed scheme considers the data locality and query execution path in order to reduce join and communication costs. In a distributed environment, when processing a SPARQL query, it is divided into several sub-queries according to the conditions of the WHERE clause by considering the data locality. The proposed scheme reduces data communication costs by grouping and processing the sub-queries through the index based on associated nodes. In addition, in order to reduce unnecessary joins and latency when processing the query, it creates an efficient query execution path considering data parsing cost, the amount of each node"s data communication, and latency. It is shown through various performance evaluations that the proposed scheme outperforms the existing scheme.
최정훈, 이병엽 배재대학교 공학연구소 2019 공학논문집 Vol.21 No.1
현대 사회에서 인터넷은 기업의 필수 기술이 되었다. 이에 따라, 대부분의 기업에서 기업 홍보 및 고객정보 수집을 위한, 다양한 웹사이트가 불특정 다수의 고객들에게 오픈되어 있고, 기업에서는 비즈니스를 위하여, 고객의 다양한 정보를 수집하고 있다. 개인정보의 중요성이 커짐과 동시에 해커들의 공격 초점도 지속적으로 애플리케이션 계층으로 이동하여, 개인정보를 탈취하는 부분에 집중되고 있다. 따라서 개인정보를 보호하는 보안 기술 및 관리 프로세스에 대한 지속적인 보완은 기업의 필수 불가결한 요소가 되었고, 정부에서도 이런 트렌드를 반영하여, 개인정보보호법 및 정보통신망법에서 개인정보 보호를 언급하며, 다양한 규제 조치를 마련하였다. 기업은 개인정보의 보호를 위해 다양한 방안들을 마련해 이러한 규제를 준수하여야 하며, 기업 내부에 관리중인 개인정보에 대해 보안을 강화하여야만 한다. 이에 다수의 개인정보들이 저장되는 DB의 암호화 아키텍처를 비교 하고, 법 규제를 준수 하는 암호화 알고리즘을 분석하여, 데이터 보안을 확보하기 위한 방안을 마련할 필요가 있다, 본 논문은 법률상 강화된 개인정보보호 기준에 맞는 기술적 관리적인 보호 조치를 정리하고, 기존 DB암호화 솔루션의 기술적 아키텍처을 비교 분석하였으며, 개인정보의 속성에 따른 암호화 알고리즘 구현 및 키관리 기능을 중앙화 하는 방식을 제안 하여, 개인정보를 저장하는 시스템 구축 시 사용이 편리하면서도 안전한 보안을 제공하는 시스템을 구축하고자 한다. In modern society, the Internet has become an essential technology for corporations. Accordingly, in most companies, various websites are opened to a large number of unspecified customers for corporate promotion and customer information collection, and companies collect various information of customers for business. As personal information grows in importance, hacker attacks continue to shift to the application layer, focusing on stealing personal information. Therefore, the continuous supplementation of security technology and management process to protect personal information has become an indispensable element of the company, and the government reflects this trend, referring to the protection of personal information in the Personal Information Protection Act and the Network Act, and It provides a wide range of regulatory measures. Companies must prepare various measures to protect personal information to comply with these regulations, and strengthen the security of personal information under management. Therefore, it is necessary to prepare a plan to secure data security by comparing the encryption architecture of DB where a large number of personal information is stored, and analyzing encryption algorithms that comply with laws and regulations. It summarizes the technical management protection measures that meet the protection criteria, compares and analyzes the technical architecture of the existing DB encryption solution, proposes a method to centralize the encryption algorithm and key management functions according to the properties of personal information, and stores the personal information. When constructing a system, we want to build a system that provides safe and convenient security.