http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
클러스터 측정과 유전자 알고리즘을 이용한 문서 클러스터링
최임천 ( Lim Cheon Choi ),박순철 ( Soon Cheol Park ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.2
본 논문에서는 클러스터 측정(Cluster Measurement)과 유전자 알고리즘을 이용한 문서 클러스링 알고리즘을 제안한다. 유전자 알고리즘의 요소를 클러스터링에 대입하고 클러스터 측정을 적합도 함수에 대입하여 문서 클러스터링을 구현하였다. 성능 평가를 위하여 한국일보-20000/한국일보-40075 문서범주화 실험문서집합의 데이터 셋을 이용하였다. 클러스터링 성능 평가 결과 AS Index가 DB Index, RS Index 보다 좋은 성능을 보여준다. 또한 제안한 알고리즘이 K-means 클러스터링 알고리즘에 비교해 안정적으로 좋은 성능을 보여준다.
최임천 ( Lim Cheon Choi ),박순철 ( Soon Cheol Park ) 한국정보처리학회 2007 한국정보처리학회 학술대회논문집 Vol.14 No.2
정보화 시대에 범람하는 정보들 중 원하는 정보를 빠르고 정확하게 검색할 수 있도록 도와주는 정보검색 시스템의 중요성이 대두 되고 있다. 정보 검색 시스템의 한 축을 담당하는 색인어 추출기는 보통 형태소 분석을 통하여 작성이 되지만 색인어 추출만을 위하여선 불필요한 작업들이 있는 것이 사실이다. 그래서 이 논문에서는 미리 정의된 색인어 리스트를 가진 사전을 이용한 색인어 추출 시스템을 제안하고 그에 맞는 데이터 구조들을 분석하여 성능 비교를 하였다.
개체 구조에 따른 유전자 알고리즘 기반의 문서 클러스터링 성능 비교
최임천(Lim Cheon Choi),쏭웨이(Wei Song),박순철(Soon Cheol Park) 한국산업정보학회 2011 한국산업정보학회논문지 Vol.16 No.3
유전자 알고리즘을 문서 클러스터링에 적용하기 위해서는 적절한 개체 구조가 필요 하다. 기존의 유전자 알고리즘을 이용한 문서 클러스터링(DCGA)은 센트로이드 벡터 형식의 개체 구조를 사용하였다. 새로운 유전자 알고리즘을 이용한 문서 클러스터링(NDAGA)은 문서 할당 형식의 개체 구조를 사용한다. 본 논문에서는 문서 클러스터링에 더 적합한 개체 구조와 연산을 결정하기 위해 두 개체 구조의 차이에 따른 연산, 연산량, 클러스터링 수행 시간, 성능을 구체적으로 비교, 분석한다. 본 논문에서 수행한 다양한 실험에서 NDCGA가 DCGA와 비교하여 15%정도 더 빠른 수행 시간과, 약 5~10% 정도 더 높은 성능을 보여, 문서 할당 형식의 개체 구조가 센트로이드 벡터 형식의 개체 구조 보다 문서 클러스터링에 적합한 것을 증명한다. 또한 NDCGA는 전통적인 클러스터링 알고리즘들(K-means, Group Average)에 비해서 15~20% 더 좋은 성능을 보였다. To apply Genetic algorithm toward document clustering, appropriate individual structure is required. Document clustering with the genetic algorithms (DCGA) uses the centroid vector type individual structure. New document clustering with the genetic algorithm (NDAGA) uses document allocated individual structure. In this paper, to find more suitable object structure and process for the document clustering, calculation, amount of calculation, run-time, and performance difference between the two methods were analyzed. In this paper, we have performed various experiments using both DCGA and NDCGA. Result of the experiment shows that compared to DCGA, NDCGA provided 15% faster execution time, about 5~10% better performance. This proves that the document allocated structure is more fitted than the centroid vector type structure when it comes to document clustering. In addition, NDCGA showed 15~25% better performance than the traditional clustering algorithms (K-means, Group Average).
쏭웨이 ( Wei Song ),최임천 ( Lim Cheon Choi ),박순철 ( Soon Cheol Park ) 한국정보처리학회 2009 한국정보처리학회 학술대회논문집 Vol.16 No.2
본 논문에서는 효율적인 인공지능 알고리즘인 유전자 알고리즘(GA)을 이용한 문서 클러스터링 시스템을 제안한다. 일반적으로 클러스터링 알고리즘에 가장 많이 사용되는 K-Means는 임의로 결정되는 초기 센트로이드 벡터에 따라 그 성능이 많이 달라지는 것을 볼 수 있다. 이에 본 논문에서는 유전자 알고리즘을 이용하여 안정적이면서도 높은 성능을 보여주는 클러스터링 알고리즘을 개발하였다. 제안한 클러스터링 알고리즘의 성능 평가를 위하여 HANTEC 2.0과 문서 범주화 집단 데이터 셋을 사용하였다. 제안된 방법은 효율적이고 빠른 K-Means를 이용한 클러스터링 알고리즘에 비하여 훨씬 뛰어난 성능을 보였다.
박재학 ( Jae-hak Park ),소재환 ( Jae-hwan So ),최임천 ( Lim-cheon Choi ),박순철 ( Soon-cheol Park ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.2
하드웨어의 발전으로 인하여 스마트폰이 등장함으로서 휴대폰도 PC의 기능적 부분을 수행할 수 있게 되었다. PC가 우리 생활 속에 많은 영향을 끼치는 만큼 스마트폰의 사용자 또한 급격하게 증가하는 추세이며 그에 따른 어플리케이션의 개발도 상당한 속도로 발전하고 있다. 본 논문에서는 기존에 웹 2.0 기반으로 설계된 무형문화 디지털 아카이브즈를 스마트폰 어플리케이션으로 구현함으로서 사람들의 접근성을 높이고 루씬 검색 시스템을 적용하여 기존 검색 시스템보다 효율적인 검색을 통해 사용자에게 정확한 정보를 전달할 수 있도록 하였다.
황설희 ( Seol Hee Hwang ),박준형 ( Jun Hyung Park ),조훈 ( Hun Jo ),최임천 ( Lim Cheon Choi ),이정송 ( Jung Song Lee ),박순철 ( Soon Cheol Park ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.2
아이폰을 선두로 하여 세계적으로 스마트폰이 각광을 받기 시작했다. 더불어 스마트폰의 성능이 향상 됨에 따라 사용자가 점점 증가하고 있다. 이에 따라, 스마트폰을 이용한 다양한 연구가 진행되고 있고 응용 프로그램(Application)도 다양하게 개발되고 있다. 본 논문에서는 스마트폰과 디지털 아카이브즈 시스템을 접목하여 자료 수집 전문 연구원(아키비스트)에게 보다 쉬운 자료 수집 환경을 제공한다. 또한, 일반 사용자들에게는 아카이브 자료를 쉽게 이용 할 수 있도록 편이성을 제공하고자 한다. 이를 위해 개발자에게 편리한 개발환경과 부대비용이 들지 않는 Google의 안드로이드(Android) 플랫폼을 선택하여 스마트폰 상의 디지털 아카이브즈 시스템을 구현 하였다.
디지털아카이브즈 시스템에 적합한 데이터베이스 구조와 그 활용 - 20세기민중생활사 디지털아카이브즈를 중심으로 -
이정송 ( Jung Song Lee ),천선일 ( Sun Il Chon ),나정훈 ( Jeong Hun Na ),김용환 ( Yong Hwan Kim ),최임천 ( Lim Cheon Choi ),박순철 ( Soon Cheol Park ) 한국정보처리학회 2009 한국정보처리학회 학술대회논문집 Vol.16 No.1
본 논문은 아카이브즈 시스템에서 점점 방대해지는 자료들을 위해 적합한 데이터베이스 구조와 자료들을 활용할 수 있는 방안에 대하여 20세기민중생활사 연구단의 디지털아카이브즈 시스템을 통한 해결방안을 제시하였다. 자료들을 관리하기위해서 기본적으로 더블린 코어를 사용하였으며, 웹2.0 플랫폼을 활용하여 자료를 손쉽게 편집, 검색할 수 있도록 하였다.