RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 프로그래밍 학습을 위한 AJAX의 활용

        이성임 ( Sungim Lee ),우종정 ( Jongjung Woo ) 한국정보처리학회 2008 한국정보처리학회 학술대회논문집 Vol.15 No.1

        학교 현장에서 이루어지는 교육의 대부분은 교수자 중심의 내용 전달식이다. 프로그래밍 언어와 같은 실습을 필요로 하는 학습에 교수자 중심의 교육을 적용할 경우 문제점이 많다. 실습을 통한 활용보다 언어 자체의 기능 설명에 비중을 두기 때문에 학생들의 흥미와 관심을 유발하지 못하고 있다. 따라서 최근 주목받고 있는 Web 2.0 패러다임인 참여, 공유 및 개방을 교육 분야에 적용하는 것은 당연할 것이다. 본 연구는 C 프로그래밍 언어 학습에 있어서 Web 2.0 클라이언트 기술 중 Ajax를 활용하여 학습자의 참여를 북돋우며, 또한 학습 시스템의 효율적인 자원 사용을 도모하고자 한다.

      • KCI등재

        호텔링 T<sup>2</sup>의 이상신호 원인 식별

        이성임,Lee, Sungim 한국통계학회 2018 응용통계연구 Vol.31 No.6

        호텔링 $T^2$ 통계량에 근거한 다변량 관리도는 공정의 이상상태를 식별하는 통계적 공정관리의 강력한 도구 중 하나이다. 다수의 품질 특성치를 동시에 모니터링하는데 사용된다. $T^2$ 관리도를 통해 이상신호가 탐지된다는 것은 평균 벡터의 변화가 있다는 것을 의미하게 된다. 그러나, 이러한 다변량 통계량의 신호는 이상신호에 대한 원인을 식별하기 어렵게 한다. 이 논문에서는 $T^2$ 통계량을 서로 독립인 항으로 분해한 Mason, Young, Tracy (MYT) 분해에 기반한 원인 식별 방법들을 살펴본다. 또한, R 소프트웨어를 사용하여 사례분석을 하고, 모의실험을 통해 각 절차의 성능을 비교 평가해보고자 한다. Multivariate control chart based on Hotelling's $T^2$ statistic is a powerful tool in statistical process control for identifying an out-of-control process. It is used to monitor multiple process characteristics simultaneously. Detection of the out-of-control signal with the $T^2$ chart indicates mean vector shifts. However, these multivariate signals make it difficult to interpret the cause of the out-of-control signal. In this paper, we review methods of signal interpretation based on the Mason, Young, and Tracy (MYT) decomposition of the $T^2$ statistic. We also provide an example on how to implement it using R software and demonstrate simulation studies for comparing the performance of these methods.

      • KCI등재

        자기상관 데이터 모니터링에서 일단계 모수 추정이 이단계 관리한계선에 미치는 영향 연구

        이성임,Lee, Sungim 한국통계학회 2015 응용통계연구 Vol.28 No.5

        Traditional Shewhart control charts assume that the observations are independent over time. Current progress in measurement and data collection technology lead to the presence of autocorrelated process data that may affect poor performance in statistical process control. One of the most popular charts for autocorrelated data is to model a correlative structure with an appropriate time series model and apply control chart to the sequence of residuals. Model parameters are estimated by an in-control Phase I reference sample since they are usually unknown in practice. This paper deals with the effects of parameter estimation on Phase II control limits to monitor autocorrelated data. 1920년대에 소개되었던 Shewhart 관리도는 관측치가 서로 독립임을 가정했다. 오늘날은 데이터 측정과 자료수집 기술이 발전하면서 자기상관 공정 데이터가 많이 발생하고 있으며, 이것은 통계적 공정 관리의 성능에 부정적인 영향을 끼치게 된다. 자기상관이 존재하는 데이터에 대하여 가장 쉽게 접근할 수 있는 관리도는 먼저 자기상관구조를 모형화할 수 있는 적절한 시계열 모형을 가정한 다음 잔차를 구하여, 그 잔차에 기반한 Shewhart 관리도를 적용하는 것이다. 실제 문제에서 시계열 모형의 참 모수값은 알려져 있지 않으므로, 이 값은 일단계 표본(과거의 관리상태 표본)으로부터 추정된다. 본 논문에서는 이러한 모수추정이 이단계 표본을 모니터링하는데 어떠한 영향이 있는지 살펴보았다.

      • KCI등재

        데이터 구조에 강건한 K 관리도의 관리 모수 결정

        박잉근,이성임,Park, Ingkeun,Lee, Sungim 한국데이터정보과학회 2015 한국데이터정보과학회지 Vol.26 No.6

        공정의 안정성을 평가하기 위해 사용되는 Shewhart 관리도 기법은 최근 다양한 분야에서 널리 응용되고 있지만, 품질 특성치에 대한 엄격한 확률분포를 가정한다. 하지만 현업에서 수집되고 있는 데이터의 확률분포는 알려진 경우가 많지 않으며, 다변량 데이터로 확장될수록 확률분포를 결정하는데 더 큰 어려움이 따른다. 이러한 문제점을 해결하기 위해 다양한 비모수 관리도 기법이 연구되었는데, 최근 연구되고 있는 비모수 관리도 기법 중 하나인 RBF (Radial Basis Function) 커널 기반의 SVDD (Support Vector Data Description) 관리도는 관리상태 하의 데이터 영역에 대한 경계를 결정함으로써 공정의 이상상태를 탐지하는 기법으로 K 관리도로 불리우며, 다양한 분야에서 적용되고 있다. 그런데 K 관리도를 적용하기 위해서는 관리도의 성능을 결정짓는 커널모수 등의 선택이 중요하며, 관리도를 작성하기 전에 미리 결정되어야 한다. 이를 위해 기존의 연구들은 격자 탐색법 등을 활용하여 모수를 결정하고 있지만, 선택 가능한 범위에 대한 반복적인 계산으로 최적값을 선택하고 있어 계산 비용이 커지고 또 시간 등의 문제로 실제 문제에 적용하기 어려운 점이 있다. 따라서 본 연구에서는 데이터의 구조에 따라 모의실험을 통해 선택 가능한 영역에서의 효율성을 비교 검토하고, 이를 바탕으로 쉽게 적용할 수 있는 새로운 모수 선택 방법을 제안하고자 한다. 이를 통해 데이터 구조에 대해 강건함을 보이는 모수의 선택과 K 관리도의 구성을 논의하고 실제 자료에 적용해 보았다. These days Shewhart control chart for evaluating stability of the process is widely used in various field. But it must follow strict assumption of distribution. In real-life problems, this assumption is often violated when many quality characteristics follow non-normal distribution. Moreover, it is more serious in multivariate quality characteristics. To overcome this problem, many researchers have studied the non-parametric control charts. Recently, SVDD (Support Vector Data Description) control chart based on RBF (Radial Basis Function) Kernel, which is called K-chart, determines description of data region on in-control process and is used in various field. But it is important to select kernel parameter or etc. in order to apply the K-chart and they must be predetermined. For this, many researchers use grid search for optimizing parameters. But it has some problems such as selecting search range, calculating cost and time, etc. In this paper, we research the efficiency of selecting parameter regions as data structure vary via simulation study and propose a new method for determining parameters so that it can be easily used and discuss a robust choice of parameters for various data structures. In addition, we apply it on the real example and evaluate its performance.

      • KCI등재

        데이터 전처리와 앙상블 기법을 통한 불균형 데이터의 분류모형 비교 연구

        이희재,이성임,Leea, Hee-Jae,Lee, Sungim 한국통계학회 2014 응용통계연구 Vol.27 No.3

        There are many studies related to imbalanced data in which the class distribution is highly skewed. To address the problem of imbalanced data, previous studies deal with resampling techniques which correct the skewness of the class distribution in each sampled subset by using under-sampling, over-sampling or hybrid-sampling such as SMOTE. Ensemble methods have also alleviated the problem of class imbalanced data. In this paper, we compare around a dozen algorithms that combine the ensemble methods and resampling techniques based on simulated data sets generated by the Backbone model, which can handle the imbalance rate. The results on various real imbalanced data sets are also presented to compare the effectiveness of algorithms. As a result, we highly recommend the resampling technique combining ensemble methods for imbalanced data in which the proportion of the minority class is less than 10%. We also find that each ensemble method has a well-matched sampling technique. The algorithms which combine bagging or random forest ensembles with random undersampling tend to perform well; however, the boosting ensemble appears to perform better with over-sampling. All ensemble methods combined with SMOTE outperform in most situations. 최근 들어 데이터 마이닝의 분류문제에 있어 목표변수의 불균형 문제가 많은 관심을 받고 있다. 이러한 문제를 해결하기 위해, 이전 연구들은 원 자료에 대하여 데이터 전처리 과정을 실시했는데, 전처리 과정에는 목표변수의 다수계급을 소수계급의 비율에 맞게 조정하는 과소표집법, 소수계급을 복원추출하여 다수계급의 비율에 맞게 조정하는 과대표집법, 소수계급에 K-최근접 이웃 방법 등을 활용하여 과대표집법을 적용 후 다수계급에는 과소표집법을 적용한 하이브리드 기법 등이 있다. 또한 앙상블 기법도 이러한 불균형 데이터의 분류 성능을 높일 수 있다고 알려져 있어, 본 논문에서는 데이터의 전처리 과정과 앙상블 기법을 함께 고려한 여러 모형들을 사용하여, 불균형 자료에 대한 이들모형의 분류성능을 비교평가한다.

      • KCI등재

        다변량 관리도를 활용한 블로거 정서 변화 탐지

        문정훈,이성임,Moon, Jeounghoon,Lee, Sungim 한국통계학회 2013 응용통계연구 Vol.26 No.6

        최근 소셜 네크워크 서비스의 발달로 인해 개인의 감정이나 의견을 표현하는 소셜 데이터들이 하루에도 수백만 건씩 생산되고 있다. 또한 소셜 데이터는 개인의 의견에 또 다른 생각을 더하는 등 정보의 생산과 소비가 누구나 가능해짐으로써 사회현상을 잘 반영해주는 도구로 성장하고 있다. 본 연구에서는 블로그에 올라온 부정적인 감성어들을 분석하여 블로거의 감성변화를 탐지하기 위해 다변량 관리도를 이용하고자 한다. 이를 위해 2008년 1월 1일부터 2009년 12월 31일 사이에 생성되었던 모든 블로그를 사용하였다. 품질 특성치가 다변량으로 주어지는 경우 호텔링의 $T^2$ 관리도가 널리 사용된다. 그러나 이 관리도는 품질 특성치들의 분포가 다변량 정규분포라는 가정을 하고 있어, 비정규 다변량 자료에 대한 관리도의 성능은 좋지 않다. 이에 본 논문에서는 Sun과 Tsung (2003)이 제안한 써포트 벡터머신에서 단일 집합 분류 기법 중 하나인 SVDD(support vector data description) 알고리즘과 이를 확장한 K-관리도를 소개하고, 실제 데이터 분석에 적용해 보았다. Social network services generate a considerable amount of social data every day on personal feelings or thoughts. This social data provides changing patterns of information production and consumption but are also a tool that reflects social phenomenon. We analyze negative emotional words from daily blogs to detect the change in blooger sentiment using multivariate control charts. We used the all the blogs produced between 1 January 2008 and 31 December 2009. Hotelling's T-square control chart control chart is commonly used to monitor multivariate quality characteristics; however, it assumes that quality characteristics follow multivariate normal distribution. The performance of a multivariate control chart is affected by this assumption; consequently, we introduce the support vector data description and its extension (K-control chart) suggested by Sun and Tsung (2003) and they are applied to detect the chage in blogger sentiment.

      • KCI우수등재

        CUSUM 통계량과 FLSA의 변화점 식별 성능에 대한 실증적 비교

        이가령(Garyeong Lee),손원(Won Son),이성임(Sungim Lee),유동현(Donghyeon Yu) 한국데이터정보과학회 2021 한국데이터정보과학회지 Vol.32 No.6

        CUSUM 통계량은 오차의 누적합을 기반으로 정의된 통계량으로 binary segmentation (BS), circular BS, wild BS 등의 알고리즘에 적용되어 변화점 식별을 위해 널리 사용되고 있다. Fused lasso signal approximator (FLSA)는 총변동 벌점이 부여된 최소제곱법을 사용하여 구간별 상수 구조를 구현하는 방법으로 다중변화점 식별을 위해 자주 활용되고 있다. 한편, FLSA는 변화점 식별에서의 점근적 일치성이 보장되지 않으므로 Son과 Lim (2019)은 FLSA을 변형한 modified FLSA (mFLSA)을 제안하고 점근적 일치성을 보인 바 있다. 이 연구에서는 서로 다른 관점에서 개발된 이 변화점 식별방법들이 실제로는 간단한 정리 과정을 통해 매우 비슷한 형태의 통계량으로 변환될 수 있음을 보였다. 또, 다중변화점 식별 문제에 있어서 CUSUM 통계량, FLSA, mFLSA의 특징을 살펴보고 모의실험을 통해 각 방법들의 성능을 실증적으로 비교보았다. 모의실험 결과, 세 변화점 식별 방법 중 어느 하나가 다른 방법보다 절대적으로 우월하다고 볼 수 없으며 오차항의 분산, 평균모형의 구조 등에 따라 변화점 식별 성능에 차이가 발생을 확인하였다. In this paper, we study the performance of the Cumulative Sum (CUSUM) and the Fused Lasso Signal Approximator (FLSA) for detecting change points in a mean model. The two methods are widely used for identifying change points. The CUSUM statistic is based on the cumulative sums over the two intervals separated by a candidate change point. On the other hand, the FLSA is a form of regularized method, a combination of the residual sum of squares and a total variation penalty term. Although the two methods are developed from quite a different motivation, these statistics can be expressed in very similar form. The FLSA statistics derived from the pathwise algorithm (Hoefling, 2010) and the modified FLSA statistics (Son and Lim, 2019) can be used for false change points elimination and eventually for change points detection. The modified FLSA statistics are equivalent to the CUSUM statistics divided by the standard error of the difference between the means of the neighboring two blocks. We compare the performance of these statistics in various situations and find that each method has its own advantage and disadvantage for change point detection.

      • KCI등재

        관리도를 활용한 국민청원 토픽 모니터링 연구

        이희연,최지은,이성임,손원,Lee, Heeyeon,Choi, Jieun,Lee, Sungim,Son, Won 한국통계학회 2021 응용통계연구 Vol.34 No.5

        Recently, as text data through online channels have become vast, there is a growing interest in research that summarizes and analyzes them. One of the fundamental analyses of text data is to extract potential topics. Although the researcher may read all the data and summarize the contents one by one, it is not easy to deal with large amounts of data. Blei and Lafferty (2007) and Blei et al. (2003) proposed topic modeling methods for extracting topics using a statistical model. Since the text data is generally collected over time, it is worthwhile to monitor the topic's changes. In this study, we propose a topic index based on the results of the topic model. In addition, a control chart, a representative tool for statistical process management, is applied to monitor the topic index over time. As a practical example, we use text data collected from Blue House National Petition boards between March 5, 2018, and March 5, 2020. 최근 온라인 채널을 통한 텍스트 자료가 방대해 지면서 이를 요약하고 분석하는 연구에 관한 관심이 커지고 있는 추세이다. 먼저 텍스트 자료에 대한 기본적인 분석 중 하나는 어떤 주제나 내용을 포함하고 있는지 잠재된 토픽을 추출하는 것이다. 연구자가 일일이 모든 자료를 읽고 내용을 요약할 수도 있겠지만, 대용량 데이터를 다루는 경우에는 결코 쉽지 않기 때문에, 통계적 모형을 사용하여 토픽을 추출하는 토픽모형 방법들이 제안되어 왔다 (Blei와 Lafferty, 2007; Blei 등, 2003). 시간에 따라 수집된 텍스트 데이터로부터 토픽의 변화를 모니터링하기 위하여, 본 연구에서는 잠재적 디리슈레 할당(latent Dirichlet allocation) 모형을 통해 토픽을 분류하고 그 결과를 바탕으로 한 토픽 지수를 제안하였다. 또한, 이를 통계적 공정관리의 대표적 도구인 관리도에 적용하여 시간 경과에 따른 토픽의 변화를 모니터링하는 데 적용해 보았다. 실제 데이터로 2018년 3월 5일부터 2020년 3월 5일 사이에 청와대 국민청원 온라인 게시판에 접수된 텍스트 데이터를 사용하였으며, 토픽 지수를 모니터링함으로써 토픽에 대한 이상변화를 탐지할 수 있음을 살펴 보았다.

      • KCI등재

        이단계 다변량 공정 모니터링에서 Hotelling T² 관리도와 PCA를 이용한 관리도와의 관리 성능비교 연구

        조영민(Youngmin Cho),이성임(Sungim Lee) 한국자료분석학회 2014 Journal of the Korean Data Analysis Society Vol.16 No.5

        최근에는 데이터 저장기술의 발달로 여러 품질 특성치를 동시에 모니터링 할 수 있는 다변량 관리도의 필요성이 증가하고 있으며, 실제 현업에서는 Hotelling의 T² 관리도와 주성분 분석을 이용한 T² 관리도가 주로 사용된다. Hotelling의 T² 관리도는 품질 특성치의 수가 늘어나거나 특성치 간의 상관관계가 존재할 경우 성능이 떨어진다고 알려져 있고, 그에 비해 주성분 분석을 이용한 T² 관리도는 차원을 축소하는데 효과적인 방법으로 알려져 있으며 서로 직교하는 새로운 변수들을 생성한 후 T² 통계량을 계산하는 방법이다. 또한, 두 관리도가 이단계 공정 모니터링에 실제로 사용되기 위해서는 충분한 과거 데이터 수집으로부터 관리 상태 하에서의 공정모수를 추정해야한다. 따라서 본 논문에서는 관리 상태 하에서의 공정모수를 추정할만한 충분한 과거 관측치가 있고, 각 시점별로 관측치가 하나씩 관측되어지는 부분군의 크기가 1인 경우로 한정한다. 이러한 경우에 Hotelling의 T² 관리도와 주성분 분석을 이용한 T² 관리도를 사용하는 경우에 품질 특성치의 수와 공분산 구조의 변화에 따른 평균 런길이(average run length)의 변화를 관측함으로써 두 관리도의 성능평가를 비교 및 검토하였다. With the development of data storage technology, there is a growing need for monitoring several quality characteristics simultaneously in various fields. The Hotelling’s T² chart and principal components analysis (PCA) based T² chart are the most familiar multivariate control charts. When the number of quality characteristics we are interested to monitor increases or they are highly correlated, the Hotelling’s T² chart does not perform well. On the other hand, the T² chart based on PCA, which is usually used as dimensionality reduction methods, can be usefully performed. For phase II monitoring we assume that we have enough data under the control to estimate the process parameters, In this paper, we compare the performance of these two multivariate control charts via the average run length according to the changes of the number of quality characteristics and covariance structures by simulation studies. A real example is also provided.

      • KCI등재

        관리도를 활용한 혈액재고관리

        황형태 ( Hyungtae Hwang ),이성임 ( Sungim Lee ),고찬규 ( Chan Kyu Ko ),나경인 ( Kyoung In Na ) 한국보건정보통계학회 2015 보건정보통계학회지 Vol.40 No.3

        Objectives: Blood inventory level is required to predict blood shortage at a national level. The purpose of this report is to monitor the blood inventory level based on the data provided by the Korea blood inventory monitoring system (KBIMs), the ongoing national surveillance system for blood management. Methods: The current report includes data from 25 sentinel hospitals that participate in the KBIMs. The blood inventory ratio for 25 sentinel hospitals is proposed and the individual control chart is used to detect the changes in the mean of the inventory ratio. Results: Blood type A has an inventory ratio between 5.2 and 4.4 days, the lowest among all blood types, during 2009-2012. In addition, the annual mean value of the inventory ratios of both blood type A and O decreased consistently every year. Control chart shows that all blood types are out-of-control status since the mid of 2010. Conclusions: Simply by setting and modifying the control chart, we can develop a reasonable control chart which reflects the current status.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼