        재현그림을 통한 우리나라 환율 자료에 대한 탐색적 자료분석

        장대흥,Jang, Dae-Heung 한국데이터정보과학회 2013 한국데이터정보과학회지 Vol.24 No.6

        Exploratory data analysis focuses mostly on data exploration instead of model fitting. We can use the recurrence plot as a graphical exploratory data analysis tool. With the recurrence plot, we can obtain the structural pattern of the time series and recognize the structural change points in time series at a glance. 탐색적 자료분석에서는 자료를 통계적 모형에 바로 적합시키기 보다는 자료를 있는 그대로 보려는 데 주안점을 둔다. 우리는 시계열 자료에 대한 그래픽 탐색적 자료분석방법의 하나로서 재현그림을 사용할 수 있다. 재현그림의 장점은 통계모형에 대한 가정 없이 시계열 자료의 구조적 패턴을 확인할 수 있고 이 패턴을 통하여 탐색적으로 시계열 데이터의 구조 변화점을 한 눈에 확인할 수 있다는 데 있다.

      • KCI등재

        군집분석 방법들을 비교하기 위한 상사그림

        장대흥,Jang, Dae-Heung 한국통계학회 2013 응용통계연구 Vol.26 No.2

        There are a wide variety of clustering algorithms; subsequently, we need a measure of similarity between two clustering methods. Such a measure can compare how well different clustering algorithms perform on a set of data. More numbers of compared clustering algorithms allow for more number of valuers for a measure of similarity between two clustering methods. Thus, we need a simple tool that presents the many values of a measure of similarity to compare many clustering methods. We suggest some graphical tools to compareg many clustering methods. 군집분석을 위한 알고리즘은 매우 많다. 이러한 군집분석 방법들이 개체들을 어떻게 여러 개의 군집으로 나누는 지를 서로 비교하기 위해서는 나누어지는 군집들이 얼마나 동일한가를 알 수 있는 동의 측도가 필요하다. 우리가 고려하여야 할 군집분석 방법들이 많아질수록 덩달아 동의 측도들 값도 많아지게 된다. 그래서 복수 개의 군집분석 방법들과 대응되는 동의 측도값들을 한 눈에 확인할 수 있는 도구가 필요하다. 본 논문을 통하여 군집분석 방법들과 대응되는 동의 측도값들을 한 눈에 확인할 수 있는 그래픽도구들을 제안하고자 한다.

      • KCI등재

        황금비와 인간의 신체

        장대흥,Jang Dae-Heung 한국통계학회 2006 응용통계연구 Vol.19 No.1

        본 논문을 통하여 인간의 신체 중 신장을 배꼽 높이로 나눈 비가 황금비가 되는 지를 부산 소재 부경대학교 학생들을 대상으로 조사하여 통계분석을 하고 미국대학생들과 비교하여 보았다. 비교 결과 미국대학생들의 키/배꼽높이 비는 황금비를 이루나 부경대학교 학생들의 키/배꼽높이 비는 황금비를 이루지 않음을 알 수 있었고, 부경대학교 학생들의 키/배꼽높이 비에서 남녀간에 차이가 없음을 알 수 있었다. 또한 부경대학교 학생들의 키/배꼽높이 비는 황금비(1.618)에 가까운 그룹과 1.71에 가까운 그룹이라는, 두개의 최빈값이 나타나는 특이한 분포를 이룸을 알 수 있었다. We tested that height/navel height ratio of Pukyong national university students is the same as golden ratio and compared height/navel height ratio of Pukyong national university students with height/navel height ratio of American university students.

      • KCI등재

        표본분산에 대한 고찰

        장대흥,Jang Dae-Heung 한국통계학회 2005 응용통계연구 Vol.18 No.3

        우리는 모분산 ${\sigma}^2$에 대한 추정량으로서 표본분산 $S^2=\frac{{\Sigma}^n_{i=1}(X_i-\={X})^2}{n-1}$을 주로 사용한다. 그러나, 제 7차 교육과정에 따른 고등학교 수학 교과서(10-가, 수학 I과 실용수학)에서는 표본분산의 정의를 $S^2_n=\frac{{\Sigma}^n_{i=1}(X_i-\={X})^2}{n}$로 사용하고 있다. 이 두 표본분산들의 관계를 알아보고, 시뮬레이션을 통하여 확인하여 본다. 또한, 이 두 표본분산들을 포함하여 일반적으로 정의할 수 있는 표본분산을 제안한다. We usually use $S^2=\frac{{\Sigma}^n_{i=1}(X_i-\={X})^2}{n-1}$ as sample variance. Korean high school text-books use $S^2_n=\frac{{\Sigma}^n_{i=1}(X_i-\={X})^2}{n}$as sample variance. We can compare the above two definitions of sample variance through their theoretical relationship and simulation.

      • KCI등재

        모형과 오차구조의 불확실성하에서의 강건 외삽 실험설계

        장대흥,김영일,Jang, Dae-Heung,Kim, Youngil 한국통계학회 2015 응용통계연구 Vol.28 No.3

        실험영역을 벗어나는 점에 해당하는 반응값 예측을 위한 최적실험을 고려할 때 실험에 필요한 받힘점을 위한 실험기준을 선택하는 경우 매우 신중하여야 한다. 왜냐하면 가정한 모형과 오차구도가 실험영역을 벗어나도 타당하다는 가정을 하여야 되기 때문이다. 따라서 기존문헌의 외삽최적의 실험기준을 이러한 상황에 맞게 설계될 수 있도록 수정하였다. 본 연구에서는 maximin방법을 적용하여 새로운 실험기준의 특징 및 강건성을 단순회귀모형과 이차회귀모형을 기준으로 검정하였다. When we consider an optimal design to predict the response corresponding to the point outside the design region, we are extremely careful about choosing the design criteria for selecting the support points. The assumed model and its accompanying error structure should be assumed to extend beyond the design region for the selected design criteria to be valid. Thus, we modify the existing design criteria such as extrapolation-optimality to be suited to those situations. We propose some maximin approaches in this paper. Simple and quadratic regression models are tested to find the basic characteristics of such maximin approaches. Some main findings are discussed in the conclusion.

      • KCI등재

        다변량공정에서 이상상태를 탐지하기 위한 DD-plot

        장대흥,이성백,김영일,Jang, Dae-Heung,Yi, Seongbaek,Kim, Youngil 한국통계학회 2013 응용통계연구 Vol.26 No.2

        DD-plot은 분류문제를 풀기 위한 유용한 비모수적 방법이다. 우리는 이러한 DD-plot을 다변량공정에서 이상상태를 탐지하기 위한 그래픽 방법으로 사용할 수 있다. 본 논문을 통하여 이상상태를 탐지하기 위한 그래픽 방법으로서 동적 DD-plot과 동적 품질지수그림을 제시하고자 한다. It is well known that the DD-plot is a useful graphical tool for non-parametric classification. In this paper, we propose another use of DD-plot for detecting the out-of-control state in multivariate process. We suggested a dynamic version of DD-plot and its accompanying a quality index plot in such case.

      • KCI등재

        단어 구름과 동적 그래픽스 기법을 이용한 영어성경 텍스트 시각화

        장대흥,Jang, Dae-Heung 한국통계학회 2014 응용통계연구 Vol.27 No.3

        단어 구름은 문자 텍스트 상의 복수개의 단어들을 대상으로 그 단어들의 출현 빈도에 비례하는 글자의 크기나 글자의 색깔로 중요도를 나타내는 텍스트 시각화 방법이다. 이 그림은 텍스트 상의 핵심단어를 재빨리 인지하고 단어들의 상대적 출현빈도수에 맞추어 배열하는 데 유용하다. 동적 그래픽스를 이용하여 텍스트 장들의 변화에 따른 핵심단어와 단어출현빈도의 패턴의 변하는 모습을 살필 수 있다. 행들이 텍스트 상의 장들이고 열들이 텍스트에 출현하는 단어들의 출현빈도수 순위들인 단어출현빈도행렬을 정의할 수 있고 이 행렬을 이용하여 단어출현빈도행렬그림을 그릴 수 있다. 동적 그래픽스를 이용하여 출현빈도수 순위의 변화에 따른 단어출현빈도행렬의 패턴의 변하는 모습을 살필 수 있다. 우리는 단어 구름과 동적 그래픽스 기법을 사용하여 영어성경 텍스트 시각화를 수행할 수 있다. A word cloud is a visualization of word frequency in a given text. The importance of each word is shown in font size or color. This plot is useful for quickly perceiving the most prominent words and for locating a word alphabetically to determine its relative prominence. With dynamic graphics, we can find the changing pattern of prominent words and their frequencies according to the changing selection of chapters in a given text. We can define the word frequency matrix. In this matrix, rows are chapters in text and columns are ranks corresponding to word frequency about the words in the text. We can draw the word frequency matrix plot with this matrix. Dynamic graphic can indicate the changing pattern of the word frequency matrix according to the changing selection of the range of ranks of words. We execute an English Bible text visualization using word clouds and dynamic graphics technology.

      • KCI등재

        혼합물 실험에서 특이값의 영향을 평가하기 위한 그래픽 탐색적 자료분석 도구로서의 불꽃그림

        장대흥,안소진,김영일,Jang, Dae-Heung,Ahn, SoJin,Kim, Youngil 한국통계학회 2014 응용통계연구 Vol.27 No.4

        It is common to check the validity of an assumed model with the heavy use of diagnostics tools when conducting data analysis with regression techniques; however, outliers and influential data points often distort the regression output in undesired manner. Jang and Anderson-Cook (2013) proposed a graphical method called a firework plot for exploratory analysis that could visualize the trace of the impact of possible outlying and/or influential data points on individual regression coefficients and the overall residual sum of squares(SSE) measure. They developed 3-D plot as well as pair-wise plot for the appropriate measures of interest. In this paper, the approach was extended further to tell the strength of their approach; in addition, a more meaningful interpretation was possible by adding a measure not mentioned in their paper. This approach was applied to the mixture experiment because we felt that a detailed analysis of statistical measure sensitivity is required in a small experiment. 회귀모형을 이용하여 자료를 분석하는 경우 이상점이나 영향점과 같은 특이값들의 유무를 검정하는 회귀진단기법은 모형의 적합성을 체크하기 위한 필수적인 도구로 잡은 지 오래이다. 이러한 점들이 존재 하는 경우 회귀분석의 결과가 왜곡되어 해석이 된다. Jang과 Anderson-Cook (2013)은 불꽃그림이란 이름을 붙인 그림도구를 발표하였는데 관측값에 부여된 가중치를 1에서 0으로 변화함에 따라 이상점이나 영향점이 회귀계수 및 잔차제곱합(SSE)에 어떠한 영향을 미치는지 3차원 그림에 추적곡선을 그려 보았을 뿐 아니라 쌍으로 대비시켜 봄으로써 분석의 시각적인 효과를 증대시켰다. 본 연구에서는 더 나아가 이러한 시도가 기존 방법과 어떤 차이점이 있는지 2013년에는 반영치 않은 통계량을 포함해서 더 많은 해석이 가능한지 혼합물 실험 계획을 통해 다양한 통계량의 민감도 분석을 실행하였다. 왜냐하면 작은 혼합물실험인 자료인 경우 더욱 세밀한 통계량에 대한 민감도 분석이 필요하기 때문이다.

      • KCI등재

        재현그림을 통한 우리나라 주식 자료에 대한 탐색적 자료분석

        장대흥,Jang, Dae-Heung 한국통계학회 2013 응용통계연구 Vol.26 No.5

        확증적 시계열 자료분석 전의 그래픽 탐색적 자료분석방법으로서 재현그림을 사용할 수 있다. 재현그림을 통하여 시계열 자료의 구조적 패턴을 확인할 수 있고 이 패턴을 통하여 탐색적으로 시계열 데이터의 구조 변화점을 한 눈에 확인할 수 있게 된다. 우리나라 주식 자료를 이용하여 재현그림이 시계열 자료를 위한 그래픽 탐색적 자료분석방법으로서 유용함을 보였다. A recurrence plot can be used as a graphical exploratory data analysis tool before confirmatory time series analysis. With the recurrence plot, we can obtain the structural pattern of the time series and recognize the structural change points in a time series at a glance. Korean stock data shows the usefulness of the recurrence plot as a graphical exploratory data analysis tool for time series data.

      • KCI등재

        실험계획의 시각화

        장대흥,Jang, Dae-Heung 한국통계학회 2011 응용통계연구 Vol.24 No.5

        The lecture of the experimental designs consists of two main part-experimental designs and model analysis. Mostly, the progress of the visualization has been made on a model analysis. As the visualization of experimental designs, we can consider the visualization of Latin squares, supersaturated designs, and balanced incomplete block designs. We can propose the design plots as well as use the scatterplots and the scatterplot matrices for the visualization of experimental designs. Through the visualization of experimental designs, we can use the synergy effect in teaching the lecture of the experimental designs. 실험계획법의 강의내용은 크게 두 개의 파트인 실험계획과 모형분석으로 대별되는데 시각화 작업은 주로 모형분석 중심으로 이루어져 왔다. 실험계획법의 강의내용에 대한 시각화 작업의 일환으로 우리는 실험계획의 시각화를 라틴 방격법의 시각화, 초포화계획법의 시각화, 불완비블럭계획법의 시각화로 나누어 고려하여 볼 수 있다. 실험계획을 시각화하는 작업을 위하여 우리는 계획그림을 제안 할 수 있고 기존의 산점도나 산점도행렬을 사용할 수 있다. 이러한 실험계획의 시각화를 통하여 우리는 이론 중심의 실험계획법 강의에 그림들을 삽입함으로써 실험계획법 수업에서의 시너지효과를 얻을 수 있다.

