http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
박천건(Chun Gun Park) 한국데이터정보과학회 2018 한국데이터정보과학회지 Vol.29 No.2
다중선형회귀모형에서 이상치는 통계적 추론에 상당한 악영향을 준다. 지금까지 이상치가 회귀분석에 미치는 영향을 회피하고자 다양한 이상치 탐색 기법들이 연구되어 왔다. 이러한 노력에도 불구하고 모형선택과 이상치가 복합적 문제로 발생되면 회귀분석에 상당한 어려움을 주게 된다. 본 연구는 차이기반회귀모형을 소개하고 모형선택에 어느 정도 자유로운 이상치 탐색 알고리즘을 소개한다(Park과 Kim, 2017). 또한 Park과 Kim (2017)이 제시한 이상치 탐색 알고리즘은 “회귀모형에 이상치가 항상 존재해야 한다는 가정”이 있다. 이러한 가정의 약점을 극복하고자 본 연구는 단일 변수에서 강건하게 이상치를 탐색할 수 있는 방법을 기존 알고리즘에 추가하고 모의실험 결과를 제시한다. In a multiple linear regression model, outliers have a significant adverse effect on statistical inference. So far, various outlier detection techniques have been studied in order to avoid the effects of abnormal values on regression analysis. In spite of these efforts, if the model selection and the anomaly occur as a complex problem, the regression analysis becomes difficult. This study introduces the difference based regression model and the somewhat free outlier search algorithm for model selection (Park and Kim, 2017). In addition, Park and Kim (2017) proposed the algorithm for outlier detection in regression that is under “assumption that outliers always exist in the model”. To overcome the weakness of the assumption, this study adds the robust method of outlier detection for single variable to the algorithm and propose simulation studies.
이상치가 존재하는 단순회귀모형에서 Rice 추정량에 관해서
박천건,Park, Chun Gun 한국통계학회 2013 응용통계연구 Vol.26 No.3
이상치가 존재하는 회귀모형에서 이상치를 탐색하거나 로버스트 추정량에 대한 연구는 매우 중요하다. 이러한 연구는 leave-one-out를 이용하여 회귀계수를 추정하고 잔차를 이용하여 오차 분산을 추정하여 이상치를 탐색하는데 있다. 본 연구는 회귀모형에서 회귀계수를 추정하지 않고 오차 분산을 추정할 수 있는 Rice 추정량의 적용을 소개한 것이다. 특히, 단순회귀모형에서 이상치의 유무에 따라 Rice 추정량의 통계적 성질을 비교하고 이상치 탐색에 있어 어떤 장점이 있는지를 탐색한 연구이다. Detection outliers and robust estimators are crucial in regression models with outliers. In such studies the focus is on detecting outliers and estimating the coefficients using leave-one-out. Our study introduces Rice estimator which is an error variance estimator without estimating the coefficients. In particular, we study a comparison of the statistical properties for Rice estimator with and without outliers in simple regression models.
박천건,임창수,임광섭,채효석,Park, Chun Gun,Rim, Chang-Soo,Lim, Kwang-Suop,Chae, Hyo-Sok 대한토목학회 2014 대한토목학회논문집 Vol.34 No.5
본 연구에서는 2011년 5월, 6월, 7월에 덕유산 덕곡제에서 관측된 플럭스자료를 이용하여 에디공분산방법으로부터 증발산량을 측정하는 경우 발생할 수 있는 연직방향 풍속의 이상치 판별 및 대체에 대한 통계적 분석을 실시하였다. 연직방향 풍속의 이상치를 파악하기 위해 적용된 통계분석방법은 사분위수를 바탕으로 상자그림(boxplot)의 분석결과 중에 이상치를 판별하기 위한 interquartile range (IQR)을 적용하여 이상치를 탐색하였다. 또한 삭제하거나 평균값으로 대체하는 방법을 통하여 보완된 연직방향 풍속자료를 이용하여 증발산량을 측정하였으며, 이를 보완전의 증발산량과 비교분석하였다. 비교분석한 결과에 의하면 이상치를 대체하기 전의 증발산량과 이상치를 대체한 후의 증발산량 사이에 차이를 보였으며, 특히 강우 시에 보다 큰 차이를 보였다. 따라서 증발산량 측정과정에서 발생하는 이상치를 보완하기 위해 이상치를 삭제하거나 대체하여 증발산량을 측정하는 것이 필요하다. In this study, using flux data measured in Deokgokje reservoir watershed near Deokyu mountain in May, June, and July 2011, statistical analysis was conducted for outlier detection and replacement for vertical wind speed in the measurement of evapotranspiration based on eddy covariance method. To statistically analyze the outliers of vertical wind speed, the outlier detection method based on interquartile range (IQR) in boxplot was employed and the detected outliers were deleted or replaced with mean. The comparison was conducted for the measured evapotranspiration before and after the outlier replacement. The study results showed that there is a difference between evapotranspiration before outlier replacement and evapotranspiration after outlier replacement, especially during the rainy day. Therefore, based on the study results, the outliers should be deleted or replaced in the measurement of evapotranspiration.
박천건,이경은,Park, Chun Gun,Lee, Kyeong Eun 한국데이터정보과학회 2014 한국데이터정보과학회지 Vol.25 No.2
전통적으로 단순선형회귀모형에서 설명변수와 반응변수의 선형성 평가는 산점도로 쉽게 파악되었다. 보통 반복수가 존재하는 자료에서 적합결여검정은 선형성을 평가하는데 사용되었다. 하지만 반복수가 오직 하나인 경우에 선형성 검정이 수월하지 않다. 본 연구에서는 반복수가 오직 하나인 단순선형회귀모형의 선형성을 검정하는 통계량을 제안하고 모의실험 및 실증연구를 통하여 신뢰성을 파악한다. In a simple linear regression, a linear relationship between an explanatory variable and a response variable can be easily recognized in the scatter plot of them. The lack of fit test for the replicated data is commonly used for testing the linearity but it is not easy to test the linearity when the explanatory variable is not replicated. In this paper, we propose three new test statistics for testing the linearity regardless of replication using the principle of average slope and validate them through several simulations and empirical studies.
베이지안 기법을 적용한 Incomplete data 기반 신뢰성 성장 모델의 모수 추정
박천건(Cheongeon Park),임지성(Jisung Lim),이상철(Sangchul Lee) 한국항공우주학회 2019 韓國航空宇宙學會誌 Vol.47 No.10
신뢰성 성장 시험을 수행하며 획득하게 되는 고장 정보와 누적 시험수행시간을 이용하면 신뢰성 성장 모델의 모수 추정이 가능하며, 모수 추정을 통해 해당 제품의 MTBF를 예측할 수 있다. 그러나 시험에 대한 비용, 시간 혹은 제품의 특성 등의 여러 제약으로 인해 고장 정보가 구간적으로 획득되거나, 획득한 고장 정보의 샘플 데이터(Sample Data)의 수가 작을 수 있다. 이는 신뢰성 성장 모델의 모수 추정의 오차를 커지게 하는 원인이 될 수 있다. 본 논문에서는 샘플 데이터의 수가 작을 경우 신뢰성 성장 모델의 모수 추정 시 베이지안 기법 기반의 모수 추정 방법의 적용에대해 연구를 수행하였다. 시뮬레이션 결과 신뢰성 성장 모델의 모수를 추정할 때, MLE를 적용하여 추정하는 방법보다 베이지안 기법을 적용하는 방법이 추정 정확도가 높음을 확인하였다. By using the failure information and the cumulative test execution time obtained by performing the reliability growth test, it is possible to estimate the parameter of the reliability growth model, and the Mean Time Between Failure (MTBF) of the product can be predicted through the parameter estimation. However the failure information could be acquired periodically or the number of sample data of the obtained failure information could be small. Because there are various constraints such as the cost and time of test or the characteristics of the product. This may cause the error of the parameter estimation of the reliability growth model to increase. In this study, the Bayesian method is applied to estimating the parameters of the reliability growth model when the number of sample data for the fault information is small. Simulation results show that the estimation accuracy of Bayesian method is more accurate than that of Maximum Likelihood Estimation (MLE) respectively in estimation the parameters of the reliability growth model.