http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
대용량 위치 데이터에서 효율적인 k-최근접 질의 처리 기법
최도진(Dojin Choi),임종태(Jongtae Lim),유승훈(Seunghun Yoo),복경수(Kyoungsoo Bok),유재수(Jaesoo Yoo) 한국콘텐츠학회 2017 한국콘텐츠학회논문지 Vol.17 No.8
스마트 기기의 대중화로 다양한 위치 기반 서비스가 제공되고 있다. 최근에는 소셜 서비스와 결합한 위치 기반 소셜 서비스들이 생겨나고 있다. 이러한 위치 기반 소셜 네트워크 서비스에서는 사용자 중심의 가장 가까운 위치를 검색하는 k-최근접 질의 처리의 요구가 증가된다. 본 논문에서는 대규모 사용자 환경에서 질의를 효율적으로 처리하기 위한 근사 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 빅데이터 분산 처리기술을 활용하여 효율적인 스트림 처리를 수행한다. 본 논문에서는 대량의 위치 데이터에 대한 색인을 위해 전통적인 그리드 색인 기법을 변형한 색인 기법을 제안한다. 제안하는 질의 처리기법은 사용자의 진행방향을 고려하여 해당 셀을 우선적으로 탐색한다. 이를 통해 k개의 근사 결과 집합을 생성할 수 있다. 제안하는 기법의 우수성을 입증하기 위해 기존 기법과 다양한 성능 평가를 수행한다. With the growing popularity of smart devices, various location based services have been providing to users. Recently, some location based social applications that combine social services and location based services have been emerged. The demands of a k-nearest neighbors(k-NN) query which finds k closest locations from a user location are increased in the location based social network services. In this paper, we propose an approximate k-NN query processing method for fast response time in a large number of users environments. The proposed method performs efficient stream processing using big data distributed processing technologies. In this paper, we also propose a modified grid index method for indexing a large amount of location data. The proposed query processing method first retrieves the related cells by considering a user movement. By doing so, it can make an approximate k results set. In order to show the superiority of the proposed method, we conduct various performance evaluations with the existing method.
빅데이터 처리 플랫폼에서 학술 데이터를 사용한 전문가 검색 시스템 설계 및 구현
최도진(Dojin Choi),김민수(Minsoo Kim),김대윤(Daeyun Kim),이서희(Seohee Lee),한진수(Jinsu Han),서인덕(Indeok Seo),임종태(Jongtae Lim),복경수(Kyoungsoo Bok),유재수(Jaesoo Yoo) 한국콘텐츠학회 2017 한국콘텐츠학회논문지 Vol.17 No.3
대부분의 연구자들은 새로운 분야의 연구를 수행하기 위해 전문가에게 자문을 받거나 전문가의 논문들을 기반으로 연구 방향을 설정한다. 기존의 학술 검색 서비스에서는 분야별 논문 정보는 제공하지만 각 분야의 전문가를 제공해주지 않기 때문에 사용자들이 검색된 논문을 기반으로 전문가를 직접 판단해야한다. 본 논문에서는 학회에 발간된 논문 정보를 기반으로 빅 데이터 처리를 이용한 학문 분야별 전문가 검색 시스템을 설계하고 구현한다. 제안하는 시스템은 대량의 논문을 저장하고 관리하기 위해 빅 데이터 분산 저장 기술을 활용하였다. 또한 빅 데이터 분산 처리기술을 활용하여 전문가를 판별하고 전문가와 연관 되는 정보를 분석한다. 분산처리 된 결과는 사용자가 전문가 검색 요청 시 웹페이지를 통해 보여준다. 사용자는 제안하는 시스템을 통해 해당 연구 분야의 전문가를 추천받음으로써 연구를 수행함에 있어 많은 도움을 받을 수 있다. Most of the researchers establish research directions to conduct the study of new fields by getting advice from experts or through the papers of experts. The existing academic data search services provide paper information by field but do not provide experts by field. Therefore, users should decide experts by field using the searched papers by themselves. In this paper, we design and implement an expert search system by discipline through big data processing based on papers that have been published in the academic societies. The proposed system utilizes distributed big data storage systems to store and manage large papers. We also discriminate experts and analyze data related to the experts by using distributed big data processing technologies. The processed results are provided through web pages when a user searches for experts. The user can get a lot of helps for the research of a particular field since the proposed system recommends the experts of the corresponding research field.
최도진(Dojin Choi),장준혁(Junhyeok Jang),송상호(Sangho Song),김상혁(Sanghyeuk Kim),임종태(Jongtae Lim),김종훈(Jonghun Kim),복경수(Kyoungsoo Bok),유재수(Jaesoo Yoo) 한국콘텐츠학회 2023 한국콘텐츠학회논문지 Vol.23 No.3
현재 서비스 중인 학술 문헌 사이트는 이미 무수히 많은 연구결과물을 가지고 있기 때문에 같은 이름을 가진 동명이인이 흔하게 존재한다. 이러한 상황에서 학술 문헌 사이트에서 어떠한 연구결과물을 찾기 위해 연구자의 이름이나 문서의 키워드로 검색을 할 때 찾고자 하는 연구자의 모든 연구결과물을 한 번에 찾기가 쉽지 않다. 본 논문에서는 이종의 학술 문헌 사이트에 저장되어 있는 모든 연구결과물을 기반으로 동명이인 판별기법을 제안한다. 제안하는 기법은 학술 문헌 사이트에서 제공하는 데이터를 통합하여 수집하고, 수집한 데이터에서 동명이인 판별에 필요한 속성을 이용하여 군집 분석 기법으로 동명이인을 판별한다. 마지막으로 제안하는 기법의 우수성을 입증하기 위해 성능 평가를 수행한다. 비교 성능 평가 수행 결과 기존의 규칙 기반 기법, 심층학습 기법보다 우수한 F1-Score를 보이며 동명이인 판별에 가장 적합한 기법임을 나타내었다. 학술 문헌 사이트에서 동명이인으로 인한 불편함이 해소될 것으로 기대한다. The academic document sites currently in service already has countless research results, so there are many researchers with the same name. In this situation, it is not easy to find all the research results of the researcher at once when searching with the researchers name or keyword to find any research results in the academic document sites. In this paper, we propose a name disambiguation method of researchers with the same name based on heterogeneous academic data. Using the attributes necessary for the name disambiguation, the proposed method performs clustering to identify people with the same name. We perform performance evaluations are performed to prove the superiority and feasibility of the proposed scheme.As a result of performing comparative performance evaluation, it showed F1-Score superior to the existing rule-based scheme and deep learning scheme, indicating that it is the most suitable scheme for discriminating people with the same name. It is expected that the inconvenience caused by people with the same name will be resolved on the academic document sites.