http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
암호화된 데이터에 대한 프라이버시를 보존하는 k-means 클러스터링 기법
정윤송,김준식,이동훈 한국정보보호학회 2018 정보보호학회논문지 Vol.28 No.6
The k-means clustering algorithm groups input data with the number of groups represented by variable k. In fact, thisalgorithm is particularly useful in market segmentation and medical research, suggesting its wide applicability. In this paper,we propose a privacy-preserving clustering algorithm that is appropriate for outsourced encrypted data, while exposing noinformation about the input data itself. Notably, our proposed model facilitates encryption of all data, which is a largeadvantage over existing privacy-preserving clustering algorithms which rely on multi-party computation over plaintext datastored on several servers. Our approach compares homomorphically encrypted ciphertexts to measure the distance betweeninput data. Finally, we theoretically prove that our scheme guarantees the security of input data during computation, and alsoevaluate our communication and computation complexity in detail. k-means 클러스터링 알고리즘은 주어진 데이터를 비슷한 k개의 그룹으로 묶어서 시장 세분화나 의료연구 등의다양한 분야에서 활용되고 있다. 본 논문에서는 다수의 사용자 데이터를 노출하지 않고 암호화하여 외부 서버에 저장하는 환경에서 프라이버시를 보존하는 클러스터링 알고리즘을 제안한다. 분산된 서버에 평문으로 저장된 데이터를다자간 계산프로토콜을 기반으로 수행된 기존 클러스터링 알고리즘 연구와 비교했을 때 제안하는 기법은 모든 데이터를 안전하게 암호문으로 저장할 수 있다는 뚜렷한 장점이 있다. 데이터 간의 거리를 측정하고 비교하기 위해서 덧셈과 곱셈 연산이 가능한 완전동형암호로 데이터를 암호화한다. 프로토콜 수행과정에서 사용자 데이터의 안전성을분석하고 통신량과 연산량을 다른 연구들과 비교한다.