http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
위치 참조가 없는 블로그 텍스트를 이용한 위치 정보 추출
문성국(Seonggook Moon),조성진(Sung-Jin Cho),황철수(Chul Sue Hwang) 대한지리학회 2018 대한지리학회지 Vol.53 No.5
최근 빅 데이터를 활용한 사례가 증가하는 추세로 주로 SNS(트위터나 페이스북 등)에서 수집한 위치태그를 이용해 사용자의 위치정보를 추출하는 연구가 진행되어 왔다. 본 연구는 위치태그가 없거나 콘텐츠 특성 상 위치정보를 수집하기 어려운 경우, 이에 대한 대안으로써 개인 블로그 자료의 활용가능성을 종로구 일대의 퇴근후 활동위치를 사례연구를 통해 확인하였다. 실험 결과, 사전기반 매칭을 이용해 네이버 블로그의 단어에서 블로그에 삽입된 지도 보다 더 많은(12배 이상) 활동유형별 위치 좌표와 활동순서 데이터를 생성하였다. 사례연구를 통해서, 자료의 신뢰도 측정, 사전 기반 매칭방법의 의존도, 시간해상도의 불일치 등 위치정보 추출과정에서 발생할 수 있는 몇 가지 고려사항을 도출하였다. 앞으로 이론 및 방법론, 입력 자료의 보완을 통해서 비교적 정확한 위치정보를 필요로 하는 여러 분야에 활용될 수 있다. As researches using Big Data are increasing recently, many studies have been conducted to extract location information of users by using geo-tags collected from SNS such as Twitter and Facebook. In cases where location tags are missing or where location information is difficult to collect due to content characteristics, this study attempted to appraise the possibility of using personal blog data in Jongro-gu, Seoul, as a case study. As a result of the experiment, we used a dictionary-based matching for extracting location coordinates (12 times or more than the maps inserted into the blogs) by activity type in Naver blogs and also produced time-series data using the location data. Through the cast study, several considerations were derived, such as measurement of data reliability, dependence on reference dictionary, and mismatch in temporal resolution. To conclude, by making up theories, methodologies, and inputs, we hope this study supports several fields that typically require accurate location information in the future.