http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
네이브 베이지안 알고리즘과 URL 분석에 기반을 둔 스팸 트윗 필터링
원대연(Dae-Yeon Won),박기정(Ki-Jung Park),박영준(Young-Jun Park),심규배(Gyu-Bae Shim),이재웅(Jae-Woong Lee),김용혁(Yong-Hyuk Kim) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.2B
트위터 사용자가 폭증하면서 스팸 트윗의 양도 매우 증가하고 있다. 이렇게 증가하는 스팸 트윗은 사회적으로 많은 문제를 유발하고 비용을 발생시킨다. 이러한 스팸 문제를 해결하고자 특정 단어를 추출하여 스팸 지수를 산출하는 네이브 베이지안 알고리즘 및 제목과 본문 내용 간의 연관성을 알아보기 위한 URL 기반의 분석방법을 기반으로 하는 트윗 스팸 필터링 알고리즘을 제안하고자 한다. 이후 테스트 프로그램으로 일정량의 정상 트윗과 스팸 트윗을 본 논문에서 제시하는 알고리즘으로 테스트해본 결과 76%의 확률로 스팸 트윗을 검출해 내는 것을 확인할 수 있었다.