http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Min-Max Hash 를 활용한 다중 집합 기반의 유사도 측정
윤진욱 ( Jin-uk Yoon ),김병욱 ( Byoungwook Kim ) 한국정보처리학회 2019 한국정보처리학회 학술대회논문집 Vol.26 No.1
데이터 마이닝에서 클러스터링은 서로 유사한 특징을 갖는 데이터들을 동일한 클래스로 분류하는 방법이다. 클러스터링에는 다양한 방법이 존재하지만 대표적으로 집합으로 표현된 데이터들의 유사도를 측정하기 위해서는 자카드 유사도(Jaccard Similarity)를 이용한다. 자카드 유사도는 서로 다른 집합 간의 공통된 부분을 상대적으로 평가하여 유사도를 측정하는 방법이다. 그러나 최근에는 데이터를 저장할 수 있는 기술과 매체의 발전으로 표현할 수 있는 데이터의 영역과 범위는 발전되고 있기 때문에 많은 연산과 시간의 비용이 발생하게 된다. 이를 해결하기 위해서 두 데이터의 표본의 유사도를 통해 실제 데이터들의 유사도를 추정할 수 있는 Min-Hash 가 제안되었다. 본 논문에서는 이를 활용하여 집합의 영역을 다중 집합(Multiset)으로 확장하여 중복되는 값을 가질 수 있는 두 데이터 간의 유사도를 효율적으로 추정할 수 있는 Min-Max Hash 를 제안한다.
안강호(Kang-Ho Ahn),안진홍(Jin-Hong Ahn),윤진욱(Jin-Uk Yoon),김광영(Kwang-Young Kim) 대한기계학회 2001 대한기계학회 춘추학술대회 Vol.2001 No.9
A well defined electro-spraying and electro-static precipitator(ESP) experiment is carried out to investigate the charging characteristics of the submicron particles and the monodisperse particles. The basic idea is that the highly charged electro-sprayed droplets will be exploded into smaller droplets when the Coulombic repulsive force on the surface is higher than the surface tension. During this process many highly charged smaller droplets or ions if the droplets are completely dried out will be produced in the space. These charged species will be attached to the particle and eventually charged the particles. These charged species will be easily collected with ESP. The experimental result shows that the atomizer generated particles with GMD 50㎚ is collected more than 99% even at the mean face velocity of 2.0 ㎧.