http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
안수남(Shounan An),유지호(Jiho Yoo),최승진(Seungjin Choi) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.2C
확률기반의 잠재적 의미분석(probabilistic latent semantic analysis) 은 널리 알려진 dyadic 데이터 요소분석(factor analysis) 에 관한 토픽모델중의 한 개 이다. 확률기반의 잠재적 의미분석은 비음수 행렬분해(nonnegative matrix factorization)와 밀접한 연관성이 있다. 확률기반의 잠재적 의미분석과 비음수행렬분해를 토대로 하여 비음수 데이터를 확률적 행렬 3-요소 분해를 함으로써 dyadic 데이터를 행과 열 co-clustering 할 수 있는 확률적 행렬 3-요소분해(probabilistic matrix tri-factorization) 는 우리가 이미 제안한 방법이다. 그러나, 위에 서술한 여러 방법들은 dyadic 데이터의 매니폴드(manifold) 구조를 고려하지 않았다. 본 논문에서는 데이터의 매니폴드를 고려한 확률적 행렬분해(manifold-respecting probabilistic matrix tri-factorization) 방법을 제안하였다. 이 방법은 잠재변수의 사후분포의 부드러움을 제한조건으로 고려한다. 우리는 EM 알고리즘으로 확률적 행렬 3-요소분해를 학습시켰다. 이미 제안 되여 있는 다른 방법들은 오직 레이블이 없는 데이터만 처리 할 수 있는 반면에 우리가 제안한 방법은 레이블이 있는 데이터와 레이블이 없는 데이터를 모두 처리 할 수 있다. 문서 데이터와 이미지 데이터에 관한 클러스터링을 통해 제안한 방법의 좋은 클러스터링 성능을 보여주었다.