http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
모바일 통신 빅데이터 기반 항공교통이용자 O/D 추출 알고리즘 연구
조범철,권기훈 사)한국빅데이터학회 2023 한국빅데이터학회 학회지 Vol.8 No.2
Current analysis of air passengers mainly relies on statistical methods, but there are limitations in analyzing detailed aspects such as travel routes, number of regional passengers and airport access times. However, with the advancement of big data technology and revised three data acts, big data-based transportation analysis has become more active. Mobile communication data, which can precisely track the location of mobile phone terminals, can serve as valuable analytical data for transportation analysis. In this paper, we propose a air passenger Origin/Destination (O/D) extraction algorithm based on mobile communication data that overcomes the limitations of existing air transportation user analysis methods. The algorithm involves setting airport signal detection zones at each airport and extracting air passenger based on their base station connection history within these zones. By analyzing the base station connection data along the passenger’s origin-destination paths, we estimate the entire travel route. For this paper, we extracted O/D information for both domestic and international air passengerss at all domestic airports from January 2019 to December 2020. To compensate for errors caused by mobile communication service provider market shares, we applied a adjustment to correct the travel volume at a nationwide citizen level. Furthermore correlation analysis was performed on O/D data and aviation statistics data for air traffic users based on mobile communication data to verify the extracted data. Through this, there is a difference in the total amount (4.1 for domestic and 4.6 for international), but the correlation is high at 0.99, which is judged to be useful. The proposed algorithm in this paper enables a comprehensive and detailed analysis of air transportation users’ travel behavior, regional/age group ratios, and can be utilized in various fields such as formulating airport-related policies and conducting regional market analysis. 현행 항공교통이용자 분석은 주로 통계적인 분석이 주류를 이루고 있으나, 이동경로, 지역별 이용자 수, 공항접근 소요시간 등 세부적인 사항에 대한 분석이 어렵다는 한계가 있다. 한편 빅데이터 기술 발전과 데이터3법 개정에 따라 빅데이터 기반 교통분석이 활성화되고 있으며, 모바일 통신 데이터는 휴대전화 단말기의 위치를 상세하게 파악할 수 있어 교통분석을 위한 좋은 분석자료가 될 수 있다. 이에 본 연구에서는 기존 항공교통이용자 분석방법의 한계를 극복하기 위해 이동경로 전체를 분석할 수 있는 모바일 통신 데이터를 기반의 교통이용자 O/D(Origin/Destination) 추출 알고리즘을 제시한다. 본 연구에서 제시하는 알고리즘은 각 공항에 공항신호탐지 구역을 설정하고, 해당 구역의 기지국 접속이력을 토대로 항공교통이용자를 추출하고 해당 이용자의 출발지-도착지 경로상의 기지국 접속 데이터를 토대로 이동경로를 추정하는 것이다. 본 연구에서는 2019년 1~12월의 기간을 대상으로 모든 국내 공항에 대하여 국내/ 국제선 이용자에 대해 O/D를 추출하였다. 또한 추출된 데이터의 검증을 위해 모바일 통신데이터 기반 항공교통 이용자 O/D 데이터와 항공통계데이터에 대해 상관성 분석을 수행하였다. 이를 통해 총량에는 차이가 있으나(국내선 4.1, 국제선 4.6) 상관성 0.99로 상관성이 높아 활용 가능할 것으로 판단되었다. 본 연구에서 제시한 알고리즘은 기존과 다르게 항공교통이용자의 이동행태, 지역별/연령별 비율 등 폭넓고 상세한 분석을 가능하게 하며, 향후 공항관련 정책 마련이나 지역별 시장분석 등 다양한 분야에서 활용할수 있다.
조범철,권기훈,안덕배 사)한국빅데이터학회 2022 한국빅데이터학회 학회지 Vol.7 No.2
코로나19 팬데믹에 따른 경제사회 환경 변화와 빅데이터 기술의 발달로 교통분석에 대한 요구가 다양화되고 있다. 특히 데이터 3법 개정에 따라 이종 데이터 간 가명정보 결합이 가능해져 다각적인 분석이 가능해졌다. 그러나 개인정보보호 강화로 모빌리티 빅데이터의 결합분석에는 데이터 협력, 비용대비 효과 등에 한계가 있어 새로운 분석방법론이 필요하다. 본 연구에서 제시하는 “모빌리티 빅데이터 가상결합 방법론”은 법제상의 제약 해소 및 다각적인 교통분석을 위한 것으로, 모바일 통신 기지국 데이터, 교통카드 데이터 등 다양한모빌리티 관련 빅데이터를 간접적으로 결합하여 상세 분석을 수행하기 위한 방법론이다. 가상결합은 모바일데이터를 바탕으로 특정 인원의 시간대별 위치를 파악할 수 있는 MCGM(Mobility Comprehensive Genetic Map)을 생성하여 패턴을 분석하고, 이를 교통카드데이터 등 교통관련 빅데이터와 결합시켜 분석하는 방법론으로 본 연구에서는 청주, 수도권 대상으로 가상결합 분석을 수행하여 활용가능성을 검증하였다.
효과적인 사이버공간 작전수행을 위한 빅데이터 거버넌스 모델
장원구,이경호 사)한국빅데이터학회 2019 한국빅데이터학회 학회지 Vol.4 No.1
초연결, 초지능을 특징으로 하는 4차 산업혁명이 태동하면서 사이버 물리 시스템이 눈앞에 다가온 가운데 사이버공간에서는 인간 생활에 대한 활동기록과 컴퓨터, 정보통신기기 뿐만아니라 사물인터넷과의 통신기록까지 막대한 양의 데이터가 매일 쏟아지고 있다. 3Vs로 대변되는 빅데이터는 국방분야에서도 적극적으로 활용되고 있는데 본 논문에서는 사이버공간에서의 군사작전을 효과적으로 수행될 수 있도록 하기 위한 빅데이터 거버넌스 모델을 제안하였다. 우리의 사이버공간 작전 임무를 구분하고 사이버공간에서 수집될 수 있는 빅데이터 유형을 분류한 후 빅데이터 거버넌스 이슈와 통합하여 빅데이터 거버넌스 프레임워크 모델을 구축하였다. 구축된 모델은 사례를 통하여 그 효용성을 증명하였으며 이를 통하여 국방분야에서 추진되는 빅데이터 활용방안에 기여한다.
홍준기 사)한국빅데이터학회 2020 한국빅데이터학회 학회지 Vol.5 No.1
오늘날 빅데이터로부터 유의미한 결과를 도출하는 연구가 활발히 진행되고 있다. 본 논문에선 빅데이터의데이터의 영역들을 파티션(partition)으로 설정하고 각 파티션들의 대표 값을 계산하여 변수들 사이의 상관관계를 분석 할 수 있는 파티션 기반 빅데이터 분석 알고리즘을 제안한다. 본 논문에선 파티션의 크기조절이 가능한 파티션 기반 빅데이터 분석 알고리즘의 파티션 크기 변화에 따른 시각화 결과를 비교분석하였다. 제안한 파티션 기반 빅데이터 분석 알고리즘을 검증하기 위해 의류 회사 ‘A’의 빅데이터를 분석하여 온도와 판매 가격 변화에 따른 상품의 판매량 변화를 분석하고 시각화하여 유의미한 결과를 얻을 수 있었다.
최영환,조완섭,이경희 사)한국빅데이터학회 2018 한국빅데이터학회 학회지 Vol.3 No.2
스마트 물관리 분야에서도 빅데이터 분석을 통해 경쟁력을 강화하려는 요구가 급증하면서 빅데이터에 대한 체계적인 관리(거버넌스)가 중요한 이슈로 부각되고 있다. 빅데이터 거버넌스는 데이터의 품질보장, 프라이버시 보호, 데이터 수명관리, 데이터 전담조직을 통한 데이터 소유 및 관리권의 명확화 등의 데이터 관리를 평가하고(Evaluation), 지시하며(Direction), 모니터링(Monitoring) 하는 체계적인 관리활동을 의미한다. 빅데이터 거버넌스가 확립되지 못하면 중요한 의사결정에 품질이 낮은 데이터를 사용함으로써 심각한 문제를 야기할 수 있으며, 개인 프라이버시 관련 데이터로 인해 빅브라더의 우려가 현실화될 수 있고, 폭증하는 데이터의 수명관리 소홀로 인해 IT 비용이 급증하기도 한다. 이러한 기술적인 문제가 완비되더라도 데이터 관련 문제를 전담하고 책임지는 조직과 인력이 없다면 빅데이터 효과는 지속되지 못할 것이다. 본 연구에서는 빅데이터 기반의 스마트 물관리를 위한 데이터 거버넌스 구축모델을 제시하고, 실제 물관리 업무에 적용한 사례를 소개한다.
조치선,이난규,함유근 사)한국빅데이터학회 2020 한국빅데이터학회 학회지 Vol.5 No.1
국내 전력산업이 스마트 그리드화 되면서 이로 인해 발생하는 빅데이터를 활용하여 수요관리, 시설물관리, 대고객서비스 등을 위한 빅데이터 플랫폼들이 도입되고 있는 추세이다. 그러나 빅데이터 프로젝트의 속성상 실제로 빅데이터 플랫폼의 활용이 업무 프로세스 상에서 정착되기 위해서는 많은 시간과 업데이트가 필요하다. 따라서 기존에 알려져 있거나 이론적인 평가 방법으로는 초기 빅데이터 플랫폼의 성과를 평가하기는 적절하지 않다. 본 논문에서는 빅데이터의 규모, 다양성, 속도에 따른 정보의 완전성/충분성, 정보의 신뢰성/정확성, 정보의 적합성/관련성, 정보의 상세성/구체성, 정보의 비교가능성, 정보의 불편성, 정보의 적시성 등 특정 정보의 7 가지 품질 측면에서 전력산업에서 초기 빅데이터 플랫폼의 성과를 평가하는 방법론을 제시한다.
그래프 구조를 갖는 서지 빅데이터의 효율적인 온라인 탐색 및 분석을 지원하는 그래픽 인터페이스 개발
유영석,박범준,조선화,이수안,김진호 사)한국빅데이터학회 2020 한국빅데이터학회 학회지 Vol.5 No.1
최근 다양한 실세계의 복잡한 관계를 그래프의 형태로 구성하고 분석하는 다양한 연구들이 진행되고 있다. 특히 DBLP와 같은 컴퓨터 분야 문헌 데이터 시스템은 논문의 저자, 그리고 논문과 논문들이 서로 인용 관계로 표현되는 대표적인 그래프 데이터이다. 그래프 데이터는 저장 구조 및 표현이 매우 복잡하므로, 문헌 빅데이터의 검색과 분석, 그리고 시각화는 매우 어려운 작업이다. 본 논문에서는 문헌 빅데이터를 그래프의 형태로 시각화한 그래픽 사용자 인터페이스 도구, 즉 EEUM을 개발하였다. EEUM은 그래프 데이터를 시각적으로 표시하여 연결된 그래프 구조에 따라 문헌 데이터를 브라우징 하는 기능을 제공하며, 문헌 빅데이터에 대한 검색 및 관리, 분석이 가능하도록 구현하였다. 또한 EEUM을 DBLP가 제공하는 문헌 그래프 빅데이터에 적용하여 편리하게 검색, 탐색 및 분석하는 할 수 있음을 시연한다. EEUM을 이용하여 모든 연구 분야에서 영향력 있는 저자나 논문을 쉽게 찾을 수 있으며, 여러 저자와 논문 사이의 모든 관계를한 눈에 볼 수 있는 등 복잡한 문헌 그래프 빅데이터의 검색 및 분석 도구로 편리하게 사용할 수 있다.
머신러닝을 이용한 빅데이터 도메인 자동 판별에 관한 연구
공성원,황덕열 사)한국빅데이터학회 2018 한국빅데이터학회 학회지 Vol.3 No.2
본 연구는 빅데이터 품질 진단의 핵심 요소인 도메인 기반 품질 진단을 위한 도메인 자동 판별에 관한 연구다. 빅데이터의 가치와 활용도의 증가와 4차 산업혁명의 대두로, 법률, 의료, 금융 등 IT와 융합된 다양한 분야에서 빅데이터를 활용하여 새로운 가치를 창출하려는 노력을 진행중이다. 하지만, 신뢰도가 낮은 데이터에 기반한 분석은 과정과 결과 모두에서 치명적인 문제를 발생하며, 분석 결과에 따른 판단 또한 신뢰하기 어려워 진다. 이처럼 신뢰도가 높은 데이터의 필요성 또한 증가하였지만, 데이터의 품질 확보에 대한 연구와 그에 대한 결과는 미비하다. 본 연구는 데이터 품질 향상을 위한 진단 평가의 핵심적 요소인 도메인 기반 품질 진단에서, 수작업으로 진행되었던 도메인 판별 작업을 머신러닝을 이용하여 자동화 함으로써, 작업시간을 단축하는 것을 목표로 한다. 데이터 베이스에 저장된, 도메인이 판별되어 있는 데이터의 특성에 관한 정보들을 추출하여 변수화하고, 이를 머신러닝을 이용하여 도메인 판별을 자동화 한다. 이를 빅데이터 품질 진단에 활용하고, 품질 향상에 기여하도록 한다.
보건의료 빅데이터 플랫폼에서 LOD를 활용한 데이터 연계 방안
이경희,김기남,조완섭 사)한국빅데이터학회 2019 한국빅데이터학회 학회지 Vol.4 No.2
LOD(Linked Open Data)는 데이터 공개방식 중에서 가장 우수한 수준으로 평가받고 있으며, 인터넷 상에서 서로 관련있는 데이터를 표준방식으로 연결하여 하나의 거대한 데이터베이스처럼 검색할 수 있도록 한다. 글로벌 환경에서 관련있는 데이터들이 LOD 형태로 구축되는 사례가 증가하고 있으나 국내 보건의료 분야에서 LOD 형태의 데이터 공개는 아직 초보적인 수준에 머물러 있다. 본 논문에서는 한국의학연구논문 데이터와 보건의료 빅데이터 연계 플랫폼 데이터를 중심으로 국내외 관련있는 DB들을 LOD 방식으로 연계하여 서비스하는 LOD 플랫폼 구축사례를 소개한다. 각 DB의 모든 데이터를 LOD로 연계하는 것은 시간과 노력이 많이 필요하며, 기본적으로 민간보다 국가나 공공기관이 담당해야 하는 인프라성 연구이다. 본연구에서는 각 DB의 일부만을 대상으로 하여 LOD국내외 10개 사이트를 연계하였으며, 이를 통해 사용자는 편리한 방식으로 국내외 여러 기관의 데이터를 연계하여 검색할 수 있게 된다.
엔지니어링 서비스 지원을 위한 클라우드 기반 빅데이터 플랫폼 개발 연구
서동우,김명일,박상진,김재성,정석찬 사)한국빅데이터학회 2019 한국빅데이터학회 학회지 Vol.4 No.1
본 연구는 엔지니어링 분야에서 생성되는 대용량의 빅데이터를 효율적으로 저장, 관리, 분석하는 클라우드 기반 빅데이터 플랫폼을 제안하고자 한다. 클라우드 기반 빅데이터 플랫폼은 HPC 클라우드 환경, 엔지니어링 빅데이터 분석 플랫폼, 데이터 수집 및 처리 모듈, 인공지능 기반 분석 라이브러리, 응용서비스로 구성된다. 이를 통해 데이터 분석에 대한 전문지식이 없는 엔지니어링 전문가가 IoT 빅데이터를 수집 및 분석함으로써 산업적으로 활용이 가능하다. 마지막으로 응용서비스에서는 빅데이터 플랫폼 적용 사례를 제시하기 위해 하수처리플랜트 데이터를 이용하여 서비스를 구현하였다.