http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
지리적 공간과 장치 정보를 사용한 개선된 트윗 봇 검출
이알찬,서고은,신원용,김동건,조재희,Lee, Al-Chan,Seo, Go-Eun,Shin, Won-Yong,Kim, Donggeon,Cho, Jaehee 한국정보통신학회 2015 한국정보통신학회논문지 Vol.19 No.12
온라인 소셜 네트워크 서비스 중 하나인 트위터는 가장 보편적으로 사용되는 마이크로 블로그인데, 트위터의 개방적 구조로 인해 자동화 프로그램인 트윗 봇이 많이 생성되고 있다. 이 트윗 봇은 적법한 봇과 악성 봇으로 분류되는데, 이 중 악성 봇은 일반 사용자들에게 많은 양의 스팸 정보나 유해한 컨텐츠를 배포하기 때문에 트윗 봇을 검출하는 작업은 반드시 필요하다. 기존 연구에서는 시간적 정보를 활용하여 사람과 트윗 봇을 분류하였다. 본 논문에서는 먼저 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 정보를 활용하여 트위터 사용자들의 정확한 위치를 알아낸다. 그리고, 각 사용자의 공간 변수에 대한 엔트로피 값 및 사용자의 장치 정보를 사용하여 새로운 봇 검출 알고리즘을 제안한다. 주요 결과로써, 시간 정보만을 이용한 기존 연구결과보다 각 신뢰도별 봇 검출 확률 및 거짓 경보 확률이 모두 우수하게 나타난다. Twitter, one of online social network services, is one of the most popular micro-blogs, which generates a large number of automated programs, known as tweet bots because of the open structure of Twitter. While these tweet bots are categorized to legitimate bots and malicious bots, it is important to detect tweet bots since malicious bots spread spam and malicious contents to human users. In the conventional work, temporal information was utilized for the classficiation of human and bot. In this paper, by utilizing geo-tagged tweets that provide high-precision location information of users, we first identify both Twitter users' exact location. Then, we propose a new tweet bot detection algorithm by using both an entropy based on geographic variable of each user and device information of each user. As a main result, the proposed algorithm shows superior bot detection and false alarm probabilities over the conventional result which only uses temporal information.
전소영,이알찬,서고은,신원용,Jeon, So-Young,Lee, Al-Chan,Seo, Go-Eun,Shin, Won-Yong 한국정보통신학회 2015 한국정보통신학회논문지 Vol.19 No.6
최근 위치 정보를 제공하는 온라인 소셜 네트워크 서비스들의 급증으로 인해 사용자들의 지리적 위치 데이터의 중요성이 강조되고 있다. 본 논문에서는 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 (geo-tagged tweet) 정보를 활용하여 트위터 사용자들의 정확한 위치와 트윗 전송시각을 알아낸 후, 이를 통해 사용자의 평균 이동속도와 트윗 주기 (tweet frequency) 사이의 관계를 분석한다. 구체적으로, 트윗 빈도수 계산 알고리즘을 소개하며, 결과에 대한 분석은 국가별, 도시별로 나누어 진행한다. 주요 결과로써, 사용자 속도에 따른 트윗 주기가 멱 법칙 분포 (power-law distribution) (또는 Zipf의 법칙 분포, Pareto 분포)를 따름을 보인다. 또한, 미국과 일본에서의 결과를 비교할 때, 일본에서의 분포도 지수가 미국의 경우에 비해 작음을 확인한다. Recently, the importance of users' geographic location information has been highlighted with a rapid increase of online social network services. In this paper, by utilizing geo-tagged tweets that provides high-precision location information of users, we first identify both Twitter users' exact location and the corresponding timestamp when the tweet was sent. Then, we analyze a relationship between the tweet frequency and the average user velocity. Specifically, we introduce a tweet-frequency computing algorithm, and show analysis results by country and by city. As a main result, it is shown that the tweet frequency according to user velocity follows a power-law distribution (i.e., Zipf' distribution or a Pareto distribution). In addition, by performing a comparison between the United States and Japan, one can see that the exponent of the distribution in Japan is smaller than that in the United States.