http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석
전성해,오경환,Jun, Sung-Hae,Oh, Kyung-Whan 한국정보처리학회 2003 정보처리학회논문지D Vol.10 No.2
웹으로부터 유용한 정보를 얻기 위한 연구는 현재 많이 진행되고 있다. 본 논문에서는 특히 웹 로그 데이터의 희소성에 대한 문제 해결과 이를 통한 웹 사용자의 군집화 방안에 대하여 연구하였다. MCMC 방법의 베이지안 추론에 의한 결측치 대체 기법을 이용하여 웹 데이터의 희소성을 제거하였고, 주성분에 의한 산점도를 통하여 형상지도의 차원을 결정한 자기 조직화지도를 이용하여 웹 사용자의 군집화를 수행하였다. 제안 기법은 기존의 방법들에 비해 모형의 정확도와 빠른 학습 시간을 제공하여 주었다. KDD Cup 데이터를 이용한 실험을 통하여 제안 방법에 대한 문제 해결 절차 및 성능 평가를 객관적으로 확인하였다. The knowledge discovery from web has been studied in many researches. There are some difficulties using web log for training data on efficient information predictive models. In this paper, we studied on the method to eliminate sparseness from web log data and to perform web user clustering. Using missing value imputation by Bayesian inference of MCMC, the sparseness of web data is removed. And web user clustering is performed using self organizing maps based on 3-D plot by principal component. Finally, using KDD Cup data, our experimental results were shown the problem solving process and the performance evaluation.
휴리스틱에 의하여 개선된 반딧불이 알고리즘의 설계와 분석
이현숙,이정우,오경환,Rhee, Hyun-Sook,Lee, Jung-Woo,Oh, Kyung-Whan 한국정보처리학회 2011 정보처리학회논문지B Vol.18 No.1
본 논문에서는 최근 Xin-She Yang에 의해 소개된 반딧불이 알고리즘(FA)에 휴리스틱을 적용하여 개선하는 방안을 제안한다. 또한 이를 위하여 기존의 FA를 이와 유사한 문제영역의 알고리즘인 Particle Swarm Optimization(PSO)와 정확도 측면, 수렴 시간 측면, 각 입자의 움직임 측면에서 비교 분석한다. 비교 실험 결과, FA의 정확도는 PSO보다 나쁘지 않았지만, 수렴 속도는 느린 것으로 나타났다. 본 논문은 이에 대한 직관적인 원인을 고찰하고, 이를 극복하기 위해, 기존의 FA에 부분 돌연변이 휴리스틱을 적용하여 개선된 FA(Improved FA)를 제안한다. 벤치마크 함수들을 최적화 하는 비교 실험 결과, 개선된 FA가 PSO와 기존의 FA보다 정확도와 수렴속도 측면에서 우수함을 보이고자 한다. In this paper, we propose a method to improve the Firefly Algorithm(FA) introduced by Xin-She Yang, recently. We design and analyze the improved firefly algorithm based on the heuristic. We compare the FA with the Particle Swarm Optimization (PSO) which the problem domain is similar with the FA in terms of accuracy, algorithm convergence time, the motion of each particle. The compare experiments show that the accuracy of FA is not worse than PSO's, but the convergence time of FA is slower than PSO's. In this paper, we consider intuitive reasons of slow convergence time problem of FA, and propose the improved version of FA using a partial mutation heuristic based on the consideration. The experiments using benchmark functions show the accuracy and convergence time of the improved FA are better than them of PSO and original FA.
이상훈,박정은,오경환,Lee, Sang-Hoon,Park, Jung-Eun,Oh, Kyung-Whan 한국지능시스템학회 2003 한국지능시스템학회논문지 Vol.14 No.7
본 논문에서는 특정 매개변수(parameter)의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형(continuous) 속성 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공하는 정보의 손실을 최소화 하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다. This paper proposes a new approach that converts continuous-valued attributes to categorical-valued ones considering the distribution of target attributes(classes). In this approach, It can be possible to get optimal interval boundaries by considering the distribution of data itself without any requirements of parameters. For each attributes, the distribution of target attributes is projected to one-dimensional space. And this space is clustered according to the criteria like as the density value of each target attributes and the amount of overlapped areas among each density values of target attributes. Clusters which are made in this ways are based on the probabilities that can predict a target attribute of instances. Therefore it has an interval boundaries that minimize a loss of information of original data. An improved performance of proposed discretization method can be validated using C4.5 algorithm and UCI Machine Learning Data Repository data sets.
한재혁(Jae Hyuk Han),오경환(Kyung Whan Oh) 한국정보과학회 1992 정보과학회논문지 Vol.19 No.5
신경망에서는 기호체계에서 쉽게 다룰 수 있는 지식-즉 문제해결의 목표, 제약조건 등-을 표현하는데 어려움을 겪고 있다. 이런 문제점을 신경망의 문제해결 능력을 저해하는 요소가 된다. 한편 기호 지식기반 시스템에서는 기호체계에서 쉽게 표현할 수 없는 전문가의 휴리스틱을 습득하는 어려움 때문에 자식습득 병목현상에 직면하고 있다. 이런 문제점들을 해결하기 위해 신경망과 기호체계가 혼합된 새로운 모델 PLENN(Prototype of Learning from Experience based on Neural Network)을 제안한다. In the artificial neural network(ANN) we have difficulty in representing the symbolic knowledge-e.g., the goal of problem solving, constraint conditions, etc.-with which a symbolic system can deal more easily than the ANN. This problem may become a factor to weaken the problem solving capability of ANN. By contrast, symbolic knowledge-based systems are being confronted with the knowledge acquisition bottleneck because they have difficulty in acquiring the heuristic of an expert which cannot be easily expressed in a symbolic system. To overcome these problems we propose a new model PLENN(Prototype of Learning from Experience based on Neural Network) which combines ANN with a symbolic system.
변형된 볼쯔만 탐색 전략을 사용하는 강화학습 기반 지능형 에이전트
고영범(Go Young-beom),오경환(Oh Kyung-whan) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B
동적 프로그래밍과 마코프 결정 과정에 이론적 기반을 두고 있는 강화학습은 에이전트 스스로 환경과의 상호 작용을 통해 최적의 정책을 학습하는 것을 보장한다. 그러나 이를 위해서는 강화학습의 행동 선택에 관한 문제인 진동과 안정 사이의 딜레마(exploration-exploitation dilemma)를 해결할 수 있는 탐색 전략이 전제되어야 한다. 이 문제를 해결하기 위해 본 논문에서는 강화학습 알고리즘의 수렴에 필요한 행동 선택의 임의성과 경험을 통해 축적된 지식의 활용을 동시에 고려한 새로운 탐색 전략을 제안한다. 이를 통해 에이전트는 자율성과 적응성을 획득할 수 있다. 실험을 위해 본 논문에서는 실시간 온라인 학습에 적합한 Q-learning 알고리즘과 에이전트 시스템 연구에 있어 전통적인 문제인 추적문제를 사용한다.