http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Spatial-Temporal Modelling of Road Traffic Data in Seoul City
이상열,안수한,박창이,전종우,Lee, Sang-Yeol,Ahn, Soo-Han,Park, Chang-Yi,Jeon, Jong-Woo The Korean Data and Information Science Society 2002 한국데이터정보과학회지 Vol.13 No.2
Recently, the demand of the Intelligent Transportation System(ITS) has been increased to a large extent, and a real-time traffic information service based on the internet system became very important. When ITS companies carry out real-time traffic services, they find some traffic data missing, and use the conventional method of reconstructing missing values by calculating average time trend. However, the method is found unsatisfactory, so that we develop a new method based the spatial and spatial-temporal models. A cross-validation technique shows that the spatial-temporal model outperforms the others.
진슬기,김광래,박창이,Jin, Seul-Ki,Kim, Kwang-Rae,Park, Chang-Yi 한국통계학회 2012 응용통계연구 Vol.25 No.2
신용평점표(credit scorecard) 작성시 각 특성변수(characteristic variable)들을 몇 개의 속성(attribute)들로 나누고 각 속성에 적절한 가중치를 부여하게 된다. 이 과정을 성김화(coarse classi cation)라 한다. 특성변수들을 속성들로 나눌 때 그 기준이 되는 절단값(cutpoint)을 선택해야 한다. 본 논문에서는 벌점화(penalization) 기반의 절단값 선택법을 제안한다. 또한 여러가지 모의실험과 실제 신용자료의 분석을 통하여 제안된 방법과 기존의 절단값 선택법인 스플라인 분류 기계 (Koo 등, 2009)의 성능을 비교한다. In constructing a credit scorecard, each characteristic variable is divided into a few attributes; subsequently, weights are assigned to those attributes in a process called coarse classification. While partitioning a characteristic variable into attributes, one should determine appropriate cutpoints for the partition. In this paper, we propose a cutpoint selection method via penalization. In addition, we compare the performances of the proposed method with classification spline machine (Koo et al., 2009) on both simulated and real credit data.
송석헌,김경희,박창이,구자용,Song, Seuck-Heun,Kim, Kyoung-Hee,Park, Chang-Yi,Koo, Ja-Yong 한국통계학회 2007 응용통계연구 Vol.20 No.3
본 연구에서는 유전자 선택 방법으로 최근 이용되는 SVM-RFE 알고리즘은 단순히 가중치의 절대값을 유전자 선택 기준으로 사용하여 유전자 값의 변동성을 고려하지 못하므로 가중치의 절대값을 그것의 표준오차로 나눈 보완된 통계량, B-RFE 알고리즘을 새로운 기준으로 제안하였다. 두 방법을 모의실험을 통해서 비교한 결과 본 연구에서 제안한 B-RFE 알고리즘이 더 의미 있는 순위를 도출하였다. The recursive feature elimination for support vector machine is known to be useful in selecting relevant genes. Since the criterion for choosing relevant genes is the absolute value of a coefficient, the recursive feature elimination may suffer from a scaling problem. We propose a modified version of the recursive feature elimination algorithm using bootstrap. In our method, the criterion for determining relevant genes is the absolute value of a coefficient divided by its standard error, which accounts for statistical variability of the coefficient. Through numerical examples, we illustrate that our method is effective in gene selection.
최병정,채윤석,최우영,박창이,구자용,Choi, Byoung-Jeong,Chae, Youn-Seok,Choi, Woo-Young,Park, Chang-Yi,Koo, Ja-Yong 한국통계학회 2008 응용통계연구 Vol.21 No.5
혼합모형을 이용한 판별분석은 다중 분류문제를 해결하는데 유용한 방법으로서 준지도 학습으로 확장될 수 있다. 본 논문에서는 정규 혼합분포를 이용한 준지도 학습 방법에서 혼합 모형의 하위 구성요소 개수 선택 기준을 연구하고자 한다. 하위 구성요소 선택 기준으로서 베이지안 정보량을 사용하였고 모의실험을 통해 이 방법의 유용성을 규명하였다. Discriminant analysis based on Gaussian mixture models, an useful tool for multi-class classifications, can be extended to semi-supervised learning. We consider a model selection problem for a Gaussian mixture model in semi-supervised learning. More specifically, we adopt Bayesian information criterion to determine the number of subclasses in the mixture model. Through simulations, we illustrate the usefulness of the criterion.