http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
속성 그래프 및 GraphQL을 활용한 지식기반 공간 쿼리 시스템 설계
장한메,김동현,유기윤 한국측량학회 2022 한국측량학회지 Vol.40 No.5
Recently, the demand for a QA (Question Answering) system for human-machine communication has increased. Among the QA systems, a closed domain QA system that can handle spatial-related questions is called GeoQA. In this study, a new type of graph database, LPG (Labeled Property Graph) was used to overcome the limitations of the RDF (Resource Description Framework) based database, which was mainly used in the GeoQA field. In addition, GraphQL (Graph Query Language), an API-type query language, is introduced to address the fact that the LPG query language is not standardized and the GeoQA system may depend on specific products. In this study, database was built so that answers could be retrieved when spatial-related questions were entered. Each data was obtained from the national spatial information portal and local data open service. The spatial relationships between each spatial objects were calculated in advance and stored in edge form. The user's questions were first converted to GraphQL through FOL (First Order Logic) format and delivered to the database through the GraphQL server. The LPG used in the experiment is Neo4j, the graph database that currently has the highest market share, and some of the built-in functions and QGIS were used for spatial calculations. As a result of building the system, it was confirmed that the user's question could be transformed, processed through the Apollo GraphQL server, and an appropriate answer could be obtained from the database. 최근 사람과 기계의 소통을 위해 QA (Question Answering) 시스템에 대한 요구가 증가하다. QA 시스템 중 공간 에 관련된 질문을 처리할 수 있는 폐쇄 도메인 QA 시스템을 GeoQA라 하는데 본 연구는 GeoQA 분야에서 주로 사 용되던 RDF (Resource Description Framework)기반의 데이터베이스가 데이터 입출력 및 변형에 한계를 보인다는 점을 극복하기 위해 최근 주목받고 있는 새로운 형태의 그래프 데이터베이스인 LPG (Labeled Property Graph)를 사 용하다. 또한, LPG 쿼리(query)언어가 표준화되지 않아 GeoQA 시스템이 특정 제품에 의존할 수 있다는 점 때문 에 API 형태의 쿼리 언어인 GraphQL (Graph Query Language)을 도입하여 다양한 LPG를 사용할 방안을 제시하 다. 본 연구에서는 공간 관련 질문이 입력되었을 때 답변을 검색할 수 있도록 대한민국 중심의 별도 데이터베이스를 구축하는데 각 데이터는 국가공간정보포털 및 지방행정 인허가데이터개방 서비스에서 취득하으며 각 공간 객 체 간 공간적 관계는 미리 계산되어 그래프의 엣지(edge) 형태로 입력되었다. 사용자의 질문은 먼저 FOL (First Order Logic)형태를 거쳐 최종적으로 GraphQL로 변환되며 GraphQL 서버를 통해 데이터베이스에 전달되었다. 실험에 사 용한 LPG로는 현재 가장 높은 점유율을 보이는 그래프 데이터베이스인 Neo4j를 선택하고 내장 함수와 QGIS 일 부가 공간 연산에 사용되었다. 시스템 구축 결과 사용자의 질문을 변환, Apollo GraphQL 서버를 통해 처리하고 데 이터베이스로부터 적합한 답변을 얻을 수 있음을 확인하다.
채희진,장한메,유기윤 한국측량학회 2022 한국측량학회지 Vol.40 No.6
Geo-analytical QA (QA: Question Answering)is a study that derives geospatial operation workflow included ingeospatial question and it is necessary to derive workflow for various sentence types in order to perform realistic geoanalyticalQA. Therefore, the purpose of this study is to develop an algorithm that can derive workflow for varioussentence types. To this end, text classification which matches a question to predefined workflows is used . To use textclassification, we need to select a corpus, label the corpus, extract feature which converts text into numbers, and trainthe classification models using the extracted feature. GeoAnQu, which is known to require various types of geospatialoperation workflows, was selected as a corpus and 23 workflows were derived by analyzing it. We then paraphrase itfor algorithm generalization verification and data augmentation and label it using 23 workflows. We performed corpusfeature extraction using TF-IDF that is based on statistical methodology. We trained linear SVM, decision tree, Multilayerperceptron classifier, and Naive Bayes classifier, and then selected the best performing linear SVM as the finalmodel. It was confirmed that the workflow for various sentence types can be derived through the model. 지리공간분석 질의응답(Geo-analytical QA)은 지리공간질의에 내포된 지리공간 분석절차를 도출하는 연구로서 현실적인 지리공간분석 질의응답을 수행하기 위해서는 다양한 문장형태에 대해 분석절차를 도출할 수 있어야 한다. 따라서 본 연구에서는 다양한 문장형태에 대해 분석절차를 도출할 수 있는 알고리즘을 개발하는 것을 목표로 한다. 이를위해 미리 정의한 지리공간 분석절차 중 하나로 질의를 대응시키는 text classification을 사용했다. text classification을사용하기 위해서는 말뭉치 선정, 말뭉치 라벨링, 말뭉치를 숫자로 변환하는 특징추출, 마지막으로 특징추출 한 값을 이용해 분류모델을 학습시키는 과정이 필요하다. 말뭉치로는 지리공간질의를 답하기 위해 다양한 유형의 분석절차를 필요로 하는 것으로 알려진 GeoAnQu를 선정했고 해당 말뭉치를 분석해 23개의 분석절차를 도출했다. 그 후, 알고리즘일반화 검증 및 데이터 증강 목적으로 GeoAnQu말뭉치를 패러프레이징 한 후 이를 23개의 분석절차를 이용해 라벨링했다. 통계학적 방식에 기반한 TF-IDF를 이용해 말뭉치 특징추출을 수행하고 선형 SVM(Linear SVM), Decision tree,Multi-layer perceptron classifier, Naive Bayes classifier을 학습시킨 후 가장 높은 성능을 보인 선형 SVM을 최종 모델로 선정했다. 해당 모델을 통해 다양한 문장형태에 대해 분석절차를 도출할 수 있는 것을 확인했다.
효율적인 공간분석질의 수행을 위한 한국형 공간지식그래프 구축방안에 관한 연구: 서울시를 대상으로
김동현,장한메,유기윤 대한공간정보학회 2022 대한공간정보학회지 Vol.30 No.4
Among the fields of GeoQA, geo-analytical question has the difficulty in terms of ambiguity and complex spatial computation. In this study, we propose a method of solving geo-analytical questions in a graph traverse method by pre-computing and storing spatial relation as relationships in a knowledge graph. We demonstrate a Koreanized GeoKG of the Seoul region. In order to improve the limitations of existing GeoKGs, we utilize WorldKG that has the advantage of having various kinds of POI and public data with administrative districts and major POI information. Based upon the example scenarios, the Koreanized GeoKG solves the problems of spatial operation and inaccurate information compared to the existing GeoKGs. By solving the problem of overlapping administrative district names, the Koreanized GeoKG proposes a scalable construction procedure, demonstrating the possibility to build a comprehensive GeoKG for the entire Republic of Korea. 공간질의응답 분야 중에서 공간분석질의는 모호한 단어와 복잡한 공간연산의 문제점을 가지고 있다. 본 연구에서는 공간적인 관계를 사전연산하고 지식그래프에 저장해 그래프 탐색방식으로 공간분석질의를 해결하는 방안을 제시하였고, 서울 전역을 대상으로 실험을 진행하였다. 기존의 공간지식그래프의 문제점을 개선하기 위해 다양한 종류의 point of interest(POI)를 다루는 WorldKG와 공공데이터에서 취득한 행정구역 및 주요 POI 정보를 융합하였다. 질의 시나리오를 기반으로 결과를 비교해보았을 때, 기존의 공간지식그래프가 해결하지 못하는 공간연산과 부정확한 정보에 대한 문제점을 한국형 공간지식그래프가 해결함을 확인하였다. 또한, 중복되는 행정구역명에 대한문제점을 해결하며 성공적으로 서울시의 공간지식그래프를 구축해 본 연구에서 제시한 구축방안으로 대한민국 전역에 대한 공간지식그래프 구축이 가능함을 확인하였다.