        군산풍력발전단지의 풍력발전량 단기예측모형 비교에 관한 연구

        이영섭,김진,장문석,김현구,Lee, Yung-Seop,Kim, Jin,Jang, Moon-Seok,Kim, Hyun-Goo 한국데이터정보과학회 2013 한국데이터정보과학회지 Vol.24 No.3

        최근 신재생에너지와 대체에너지의 필요성이 증가함에 따라 환경오염과 온실효과를 초래하지 않는 풍력에너지 개발에 많은 연구와 투자가 이루어지고 있다. 풍력에너지는 무공해 에너지이며 자원양이 무한대이고 바람이 부는 곳이라면 어디에서든지 전력생산이 가능하다. 그러나 풍력에너지는 바람에 크게 의존하며 불규칙적인 특성이 있어 효율적인 풍력발전이 어렵다는 단점이 있다. 이러한 이유로 풍력발전에 있어서 정확한 풍력발전량 예측은 매우 중요한 요소이다. 본 연구에서는 이러한 풍력발전량의 효율적인 예측을 위해 군산 풍력단지의 자료를 이용해 시계열모형인 ARMA모형과 데이터 마이닝 기법 중 신경망모형을 사용하여 풍력발전량을 예측하고 비교분석 하였다. 그 결과 신경망모형 적합결과가 ARMA모형 적합결과 보다 더 좋은 예측력을 나타내었다. As the needs for alternative energy and renewable energy increase, there has been a lot of investment in developing wind energy, which does not cause air pollution nor the greenhouse gas effect. Wind energy is an environment friendly energy that is unlimited in its resources and is possible to be produced wherever the wind blows. However, since wind energy heavily relies on wind that has unreliable characteristics, it may be difficult to have efficient energy transmissions. For this reason, an important factor in wind energy forecasting is the estimation of available wind power. In this study, Gunsan wind farm data was used to compare ARMA model to neural network model to analyze for more accurate prediction of wind power generation. As a result, the neural network model was better than the ARMA model in the accuracy of the wind power predictions.

      • KCI등재

        데이터 마이닝에서 배깅, 부스팅, SVM 분류 알고리즘 비교 분석

        이영섭,오현정,김미경,Lee Yung-Seop,Oh Hyun-Joung,Kim Mee-Kyung 한국통계학회 2005 응용통계연구 Vol.18 No.2

        데이터 마이닝에서 데이터를 효율적으로 분류하고자 할 때 많이 사용하고 있는 알고리즘을 실제 자료에 적용시켜 분류성능을 비교하였다. 분류자 생성기법으로는 의사결정나무기법 중의 하나인 CART, 배깅과 부스팅 알고리즘을 CART 모형에 결합한 분류자, 그리고 SVM 분류자를 비교하였다. CART는 결과 해석이 쉬운 장점을 가지고 있지만 데이터에 따라 생성된 분류자가 다양하여 불안정하다는 단점을 가지고 있다. 따라서 이러한 CART의 단점을 보완한 배깅 또는 부스팅 알고리즘과의 결합을 통해 분류자를 생성하고 그 성능에 대해 평가하였다. 또한 최근 들어 분류성능을 인정받고 있는 SVM의 분류성능과도 비교?평가하였다. 각 기법에 의한 분류 결과를 가지고 의사결정나무를 형성하여 자료가 가지는 데이터의 특성에 따른 분류 성능을 알아보았다. 그 결과 데이터의 결측치가 없고 관측값의 수가 적은 경우는 SVM의 분류성능이 뛰어남을 알 수 있었고, 관측값의 수가 많을 때에는 부스팅 알고리즘의 분류성능이 뛰어났으며, 데이터의 결측치가 존재하는 경우는 배깅의 분류성능이 뛰어남을 알 수 있었다. The goal of this paper is to compare classification performances and to find a better classifier based on the characteristics of data. The compared methods are CART with two ensemble algorithms, bagging or boosting and SVM. In the empirical study of twenty-eight data sets, we found that SVM has smaller error rate than the other methods in most of data sets. When comparing bagging, boosting and SVM based on the characteristics of data, SVM algorithm is suitable to the data with small numbers of observation and no missing values. On the other hand, boosting algorithm is suitable to the data with number of observation and bagging algorithm is suitable to the data with missing values.

      • KCI우수등재

        A Study of Combined Splitting Rules in Regression Trees

        이영섭,Lee, Yung-Seop 한국데이터정보과학회 2002 한국데이터정보과학회지 Vol.13 No.1

        Regression trees, a technique in data mining, are constructed by splitting function-a independent variable and its threshold. Lee (2002) considered one-sided purity (OSP) and one-sided extreme (OSE) splitting criteria for finding a interesting node as early as possible. But these methods cannot be crossed each other in the same tree. They are just concentrated on OSP or OSE separately in advance. In this paper, a new splitting method, which is the combination and extension of OSP and OSE, is proposed. By these combined criteria, we can select the nodes by considering both pure and extreme in the same tree. These criteria are not the generalized one of the previous criteria but another option depending on the circumstance.

      • KCI등재

        기업 인적자원 관련 변수를 이용한 기업 신용점수 모형 구축에 관한 연구

        이영섭,박주완,Lee, Yung-Seop,Park, Joo-Wan 한국통계학회 2007 응용통계연구 Vol.20 No.3

        본 논문의 목적은 기업 신용점수에 영향을 미치는 기업 인적자원 요소들을 찾아서 기업 신용점수 모형을 구축하는 것이다. 모형 구축을 위해 사용된 자료는 2005년 한국직업능력개발원의 인적자본 기업패널 (Human Capital Corporate Panel, HCCP) 설문조사 자료와 한국신용평가(주)의 KIS-신용평점모델에서 생성된 기업 신용점수이다. 모형 구축을 위한 독립변수는 McLagan (1989)의 '인적자원 바퀴모델'을 토대로 인적자본 기업패널 설문조사 문항을 선택하여 사용하였으며, 종속변수로는 기업 신용평가점수를 사용하였다. 또한 기업 인적자원 관련 변수를 이용한 기업 신용점수 모형 구축을 위해 로지스틱 회귀모형을 사용하였다. 모형 구축 결과 최종적으로 선택된 변수는 22개였다 영역별로 세분화해서 살펴보면 대분류 기준으로 HRD 영역은 6개, HRM 영역은 15개, 기타 1개이고, 중분류 기준으로 개인개발 2개, 경력개발 2개, 조직개발 2개, 조직직무설계 1개, 인적자원계획 4개, 정보체계 2개, 보상 및 장려 6개, 복지후생 1개, 노사관계 1개, 기업규모 1개가 선택되었다. 구축된 모형을 평가하기 위하여 10등급 교차타당성 분석을 통한 오분류율, G-mean은 각각 30.81, 68.27이었다. 그리고 반응율은 가장 좋은 십분위가 가장 나쁜 십분위보다 약 6.08배가 크고 점차 감소하는 경향을 보이고 있다. 그러므로 구축된 모형은 기업 인적자원 관련 변수를 이용해 기업 신용점수를 측정하는데 적당한 모형이라는 결론을 내릴 수 있다 Although various models have been developed to establish the enterprise credit scoring, no model has utilized the enterprise human resource so far. The purpose of this study was to build an enterprise credit scoring model using enterprise human resource factors. The data to measure the enterprise credit score were made by the first-year research material of HCCP was used to investigate the enterprise human resource and 2004 Credit Rating Score generated from KIS-Credit Scoring Model. The independent variables were chosen among questionnaires of HCCP based on Mclagan(1989)'s HR wheel model, and the credit score of Korean Information Service was used for the dependent variables. The statistical method used for data analysis was logistic regression. As a result of constructing a model, 22 variables were selected. To see these specifically by each large area, 6 variables in human resource development(HRD) area, 15 in human resource management(HRM) area, and 1 in the other area were chosen. As a consequence of 10 fold cross validation, misclassification rate and G-mean were 30.81 and 68.27 respectively. Decile having the highest response rate was bigger than the one having the lowest response rate by 6.08 times, and had a tendency to decrease. Therefore, the result of study showed that the proposed model was appropriate to measure enterprise credit score using enterprise human resource variables.

      • KCI등재

        모의실험에 의한 온실가스 인벤토리 불확도 산정을 위한 지수분포 신뢰구간 추정방법

        이영섭,김희경,손덕규,이종식,Lee, Yung-Seop,Kim, Hee-Kyung,Son, Duck Kyu,Lee, Jong-Sik 한국데이터정보과학회 2013 한국데이터정보과학회지 Vol.24 No.4

        온실가스 인벤토리 불확도 산정을 위해서는 인벤토리의 신뢰구간 추정이 필수적이다. 일반적으로 모수에 대한 신뢰구간 추정시에는 모집단이 정규분포를 따른다고 가정한다. 그러나 자료의 구조가 복잡해짐에 따라 정규분포가 아닌 비대칭형 자료, 즉 양의 왜도를 갖는 자료의 경우 기존의 정규분포를 가정한 신뢰구간 추정 방식은 적합하지 않다. 본 연구에서는 비대칭형 분포인 지수분포의 신뢰구간추정 방법으로 모수적인 방법과 비모수적인 방법에 대해 각각 비교분석하였다. 모의실험을 통한 신뢰구간 추정 결과를 바탕으로 범위확률, 신뢰구간 길이, 상대적 편의를 비교한 결과 모수적 방법 중에서 예상했던 대로 정확한 방법인 카이제곱방법이 신뢰계수와 유사한 범위확률을 보이고 상대적 편의도 작아 모수적 방법 중에서 신뢰구간 추정에 가장 적합한 것으로 나타났다. 마찬가지로 비모수적 방법 중에서는 표준화된 t-붓스트랩 방법이 가장 적합한 것으로 나타났다. An estimation of confidence intervals is essential to calculate uncertainty for greenhouse gases inventory. It is generally assumed that the population has a normal distribution for the confidence interval of parameters. However, in case data distribution is asymmetric, like nonnormal distribution or positively skewness distribution, the traditional estimation method of confidence intervals is not adequate. This study compares two estimation methods of confidence interval; parametric and non-parametric method for exponential distribution as an asymmetric distribution. In simulation study, coverage probability, confidence interval length, and relative bias for the evaluation of the computed confidence intervals. As a result, the chi-square method and the standardized t-bootstrap method are better methods in parametric methods and non-parametric methods respectively.

      • 태양광 발전량의 1일 예보 성능평가를 위한 다양한 시계열 모델 비교 분석

        이영섭(Yung-Seop Lee),진대현(Daehyun Jin),김동희(Donghee Kim),김창기(Chang Ki Kim),김현구(Hyun-Goo Kim) 한국신재생에너지학회 2021 한국신재생에너지학회 학술대회논문집 Vol.2021 No.7

        시계열 모델 기반의 태양광 발전량 예보모델은 연간 신재생설비 운영비를 절감하기 위한 핵심적인 기술이며 예보의 정확성이 무엇보다 중요하다. 본 연구에서는 태양광 발전량에 대한 Day-ahead(1일 선행) 예보 성능평가를 위한 다양한 시계열 모델을 구축하여 그 성능을 비교분석 하였다. 이를 위하여 우리나라 5개 지역에서의 태양광 발전량의 데이터를 이용하였으며, 예보 선행시간으로는 10시 발표 예보기준으로 38시간, 17시 발표 예보기준으로 31시간 예보 선행시간을 고려하였다. 또한 시계열 모형으로는 관측지역별 ARIMA모형과 관측지역별 계절성을 고려한 SARIMA 모형, 지점의 군집화를 통한 군집별 VAR 모형을 구축하였으며, 모델 성능 평가지표로는 RMSE와 nRMSE(max)를 사용하였다. 그 결과 10시 발표 예보기준, 17시 발표 예보기준과 대부분의 지역에서 ARIMA 모형의 예측오차가 다른 시계열모형보다 예측오차가 낮아서 예측력이 높음을 확인하였다.

      • KCI등재

        태양소양인(太陽少陽人)과 태음소음인(太陰少陰人)의 수면(睡眠), 대편(大便), 소편(小便)에 관한 임상적 고찰

        김정주,이영섭,박성식,Kim, Jung-Ju,Lee, Yung-Seop,Park, Seong-Sik 사상체질의학회 2005 사상체질의학회지 Vol.17 No.3

        1. Objectives : There are many studies on the ordinary symptoms based on Sasang constitution. But there are not quite satisfactory between the types of Sasang constitution. So This study is for learning the characteristics of ordinary symptoms depending on Taeyangin Soyangin(the rest Yangin) and Taeumin Soeumin(the rest Eumin) of the Sasang constitution. 2. Methods : We classified them into the each type of Sasang Constitutional Medicine(SCM) by the well-trained SCM specialist, and assessed their ordinary features by the questionnaire. Binary logistic regression analysis was applied to evaluate the influence of ordinary features to the diagnosis of SCM. 3. Results : There are a result of the binary logistic analysis on the observed questionnaire. 1) Regarding sleeping, Yangin do not dream much as Eumin do when they sleep. The time they are sleeping is not longer, and they usually do not sleep well. 2) Regarding stools, Yangin go to stool more than Eumin do. The constipation does not occur when they are not in a good condition, and they do not feel uncomfortable when they do not go to stool for a day. The length of time taken for emptying the bowels is much longer, and the hardness of their stools is much more, but the hardness does not mean that they have the constipation. 3) Regarding urine, Yangin have much more foam than Eumin. 4. Conclusions: We found that Yangin and Eumin have characteristics of ordinary symptoms, but partly there are not in accordance with ones what Lee Je-ma said in his book. So in future we hope clinical studies are required steadily.

      • KCI등재

        소양소음인(少陽少陰人)과 태양태음인(太陽太陰人)의 한(汗), 대변(大便), 소변(小便), 소화(消化)에 관한 임상적 비교 연구

        박효진,이영섭,박성식,Park, Hyo-Jin,Lee, Yung-Seop,Park, Seong-Sik 사상체질의학회 2006 사상체질의학회지 Vol.18 No.1

        1. Objectives There are many studies on the ordinary symptoms based on Sasang constitution. But there. are not quite satisfactory between the types of Sasang constitution. So This study is for learning the characteristics of ordinary symptoms depending on Soyangin Soeumin and Taeyangin Taeumin of the Sasang constitution. 2. Methods One thousand and two hundred twenty nine subjects were included in Bundang Oriental Hospital of Dongguk University. We classified them into the each type of Sasang Constitutional Medicine(SCM) by the well-trained SCM specialist, and assessed their ordinary features by the questionnaire. Binary logistic regression analysis was applied to evaluate the influence of ordinary features to the diagnosis of SCM. 3. Results (1) Compared to Taeyangin Taeumin, Soyangin Soeumin do not sweat a lot. Even if Soyangin Soeumifl do sweat, one does not feel refreshed. Soyangin Soeumin do not sweat while sleeping at night nor eating meals, but discharges cold sweat if one does not feel well. (2) Compared to Taeyangin Taeumin, Soyangin Soeumin go to stool less frequently and have diarrhea when one does not feel well. Soyangin Soeumin do not feel irritated even though one is not able to go to stool for one day. (3) Compared to Taeyangin Taeumin, Soyangin Soeumin do not have foams in urine. (4) Compared to Taeyangin Taeumin, Soyangin Soeumin tend to eat slow, do not eat a lot normally, do not have a great appetite, have problems for digestion, and especially have difficulties in digestion when one is stressed. 4. Conclusions We found that Taeyangin Taeumin and Soyangin Soeumin have characteristics of ordinary symptoms, but partly there are not in accoradance with ones what Lee ]e-Ma said in his book. So in future we hope clinical studies are required steadily.

