RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        데이터마이닝을 활용한 인구집단 구성과 경제적 불평등 평가

        민대기 ( Dai Ki Min ) 아시아.유럽미래학회 2016 유라시아연구 Vol.13 No.1

        최근 인구의 고령화 현상에 의하여 연금제도의 중요성이 증가하고 있다. 본 연구에서는 경제적 불평등 완화를 목적으로 하는 연금제도의 특성을 고려할 때 불평등 수준 평가의 기초가 되는 우리나라 인구집단 구성의 적정성을 평가하고자 한다. 이를 위하여 한국노동패널조사 자료 중 60대와 70대 고령 은퇴가구를 대상으로 데이터 마이닝 기법 중 군집분석 (clustering analysis)을 수행하여 다양한 요인들 사이의 암묵적 관계에 따라 유사한 특성을 가질 것으로 예상되는 세부 인구집단을 구성한다. 군집분석은 변수의 선정, 계층적 군집분석을 이용한 군집의 수 결정, 비계층적 군집분석을 이용한 집단 구성, 인구집단별 특성 분석 등의 네 단계로 수행한다. 군집분석 과정에서 근로기간과 풀타임 근로기간 등의 직업이력이 은퇴가구의 경제 불평등 수준에 미치는 영향을 분석하기 위하여 근로이력을 군집분석을 주요 요인으로 포함하였다. 가구특성, 소득, 소비, 자산의 관점에서 군집분석 결과를 살펴보면 기존 연구에서 고려한 우리나라 인구집단의 일부 특성이 적절하지 않음을 확인하였다. 특히 고용기간과 총 고용기간에서 파트타임 고용기간이 차지하는 비중은 은퇴가구의 소득과 자산에 영향이 큼에도 불구하고 현실과 기존연구의 가정에서 다소 차이가 있음을 확인하였다. 이와 같은 연구를 통하여 우리나라 연금제도의 효과적 설계에 필요한 현실적인 인구집단의 구성과 분석을 위한 가정 설정의 기반을 제공하였다는데 의의가 있다. 인구집단 사이의 경제적 불평등에 영향을 미치는 요인을 적절하게 고려하는 것은 매우 중요하다. 경제적 불평등에 다수의 요인이 복합적으로 작용함에도 불구하고 기존 연구는 단일 요인 별로 표준 인구집단을 구성하는 문제가 있다. 본 연구에서는 엔트로피 지수 (Generalized Entropy Index; GE Index) 분해 기법을 이용하여 인구집단 사이의 불평등 수준을 평가하고 이에 영향을 주는 주요 요인을 확인하였다. 표준 인구집단 구성 및 경제적 불평등 기여 요인으로는 성별, 교육수준, 가구 구성원 수와 같은 가구특성과 함께 근로기간 및 풀타임 근로기간과 같은 직업이력을 고려하였다. 분석 결과 다수의 요인을 복합적으로 활용하는 군집분석을 이용하여 구성한 인구집단은 표준 인구집단과 비교하여 불평등 수준을 효과적으로 설명하고 있음을 확인하였다. 이는 불평등 수준을 완화하기 위한 효과적인 연금제도를 설계함에 있어 인구집단 구성을 위한 군집분성 방안의 타당성을 제시한다. The importance of public pension system recently has been growing because of an ageing population in Korea. One of the major purposes of public pension system is to reduce economic inequalities across population groups that have been mainly defined by a single variable such as age, income, sex, etc in the literature. This paper aims to evaluate how well the population groups are practically and clearly designed in the literature so as to specify economic inequalities across different groups. For this purpose, we investigate the retired household sample obtained from KLIPS (Korean Labor and Income Panel Study) and conduct the clustering analysis to organize population groups. The clustering analysis consists of four steps: variable selection, hierarchical clustering analysis to determine the number of clusters and centroid, non-hierarchical clustering analysis (we use K-means clustering analysis) and define population groups, and describing the characteristics of population groups. The clustering analysis divides the population into six subgroups that have similar characteristics. We compare the characteristics of the population groups obtained from the clustering analysis with those designed in the literature with respect to household, income, consumption and asset. From the comparison, we observe that the assumptions on population groups in the literature are somewhat different from the findings from the clustering analysis. In particular, the period of employment and the full-time period are significantly different from the literature. The clustering analysis reveals that the period of employment is approximately 31-45 years, which is shorter than the period of employment assumed in the literature. Furthermore, few research has clearly considered the full-time period, which accounts for 14%-45% of the total period of employment. We believe that the findings in this study provides meaningful information on how to practically organize population groups as a part of designing public pension system. For example, researchers are encouraged to consider the employment periods and full-time periods obtained from the data analysis when considering the significant impact of working periods on pension payment and benefits. Population should be well grouped so as to specify the difference in economic inequalities across groups. In general, various variables are jointly involved in determining the economic inequalities, but populations have been simply grouped by a single variable such as age, gender, education level, household size, etc. in the literature. This paper employs the Generalized Entropy (GE) measure of economic inequality and its decomposition to evaluate the contributions of several variables on the overall economic inequality. For this analysis, populations are first grouped by several variables such as clusters obtained from the analysis, sex, education level, period of employment and household size. Then, we measure the inequaltiy index and its decomposition for monthly income, monthly consumption and asset. Grouping populations using the clustering analysis specifies the economic inequality more precisely provides better measure of similarity within a group and difference between groups. This result supports the effectiveness of the clustering analysis in grouping populations.

      • KCI등재후보

        FCAnalyzer: A Functional Clustering Analysis Tool for Predicted Transcription Regulatory Elements and Gene Ontology Terms

        Kim, Sang-Bae,Ryu, Gil-Mi,Kim, Young-Jin,Heo, Jee-Yeon,Park, Chan,Oh, Berm-Seok,Kim, Hyung-Lae,Kimm, Ku-Chan,Kim, Kyu-Won,Kim, Young-Youl Korea Genome Organization 2007 Genomics & informatics Vol.5 No.1

        Numerous studies have reported that genes with similar expression patterns are co-regulated. From gene expression data, we have assumed that genes having similar expression pattern would share similar transcription factor binding sites (TFBSs). These function as the binding regions for transcription factors (TFs) and thereby regulate gene expression. In this context, various analysis tools have been developed. However, they have shortcomings in the combined analysis of expression patterns and significant TFBSs and in the functional analysis of target genes of significantly overrepresented putative regulators. In this study, we present a web-based A Functional Clustering Analysis Tool for Predicted Transcription Regulatory Elements and Gene Ontology Terms (FCAnalyzer). This system integrates microarray clustering data with similar expression patterns, and TFBS data in each cluster. FCAnalyzer is designed to perform two independent clustering procedures. The first process clusters gene expression profiles using the K-means clustering method, and the second process clusters predicted TFBSs in the upstream region of previously clustered genes using the hierarchical biclustering method for simultaneous grouping of genes and samples. This system offers retrieved information for predicted TFBSs in each cluster using $Match^{TM}$ in the TRANSFAC database. We used gene ontology term analysis for functional annotation of genes in the same cluster. We also provide the user with a combinatorial TFBS analysis of TFBS pairs. The enrichment of TFBS analysis and GO term analysis is statistically by the calculation of P values based on Fisher’s exact test, hypergeometric distribution and Bonferroni correction. FCAnalyzer is a web-based, user-friendly functional clustering analysis system that facilitates the transcriptional regulatory analysis of co-expressed genes. This system presents the analyses of clustered genes, significant TFBSs, significantly enriched TFBS combinations, their target genes and TFBS-TF pairs.

      • KCI등재

        군집분석을 통한 K리그 축구팀 플레이스타일 분류

        김종원(Jongwon Kim),최형준(Hyongjun Choi) 한국체육측정평가학회 2021 한국체육측정평가학회지 Vol.23 No.1

        본 연구는 2020 K리그 경기에서 발생한 패스 관련 분석인자들을 이용하여 군집분석을 통해 K리그 팀들의 플레이스타일을 알아보고자 하였다. 2020 K리그 모든 팀들의 전 경기(스플릿 후 경기 제외)를 대상으로 하였으며, 연구의 대상이 된 경기 수는 총 132경기였으며, 양 팀의 자료를 각각 고려하였다(n=264). K리그 프로축구연맹 ‘데이터포탈’에서 제공받은 18개의 패스 관련 분석인자들을 Microsoft Office Excel 2007을 이용하여 정리하였고, 그 후 R 3.6.2를 이용하여 자료 처리하였다. 통계적 검증을 위하여 기술통계 분석(descriptive statistics analysis)을 실시한 후, 데이터 마이닝 기법 중 하나인 k-평균 군집분석(k-means cluster analysis)과 교차분석(cross-tabulation analysis)을 실시하였다. 본 연구의 군집분석을 통하여 얻어진 군집의 수는 3개였다. 절반 이상의 팀들이 군집 1에 속하였고, 군집2(전북, 울산, 강원)와 군집3(대구, 광주, 인천)에는 각각 3팀이 속하였다. 최상위 팀인 1위 팀 전북과 2위 팀 울산이 속한 군집2는 다른 군집들과 비교해 공격 1/3지역 패스 비율, 숏 패스 비율, 전진 패스 비율을 제외한 나머지 15개의 분석인자들에서 가장 높은 평균값을 나타냈고, 군집3의 경우 가장 낮은 평균값을 보였다. 분석인자들 간의 유사성을 이용하여 군집을 나누는 방법으로 직접적인 팀의 플레이스타일을 표현하는데 한계가 있지만, 본 연구에서 사용된 분석인자들을 통해 비슷한 유형의 팀들을 군집하는데 의미가 있다. The purpose of this study was to identify the playing styles of football clubs in K-League through cluster analysis using performance indicators related to pass. All matches excepted to split matches were used for analysis and all data were provided from Korea Football League(n=264). All data were preprocessed on Microsoft Office Excel 2007 and statistical analysis was conducted on R 3.6.2. Descriptive statistical analysis was firstly used to calculate means and standard deviations for each performance indicators and then k-means cluster analysis, one of the data mining method, was conducted to identify clusters. Finally, cross-tabulation analysis was used to identify K-League teams into each cluster. Three clusters were identified and Jeonbuk, Ulsan and Gangwon was included in cluster 2 whilst Daegu, Gwangju and Incheon was included in cluster 3. The other teams were included in cluster 1. Cluster 2 had greater performance indicators related to pass rather than other clusters. Although cluster analysis, grouping performance indicators in such a way that performance indicators in the same cluster are more similar each other compared to other clusters, could not determine accurate playing styles in football, it is literally meaningful to group the similar type of teams. There needs to be a great interpretation of the characteristics of the formed clusters.

      • KCI등재

        결측치를 포함한 데이터의 k-평균 군집분석 방법 비교

        양대경(Daegyeong Yang),명재성(Jasung Myung),이승훈(Seunghoon Lee),송주원(Juwon Song) 한국자료분석학회 2023 Journal of the Korean Data Analysis Society Vol.25 No.6

        군집분석이란 개체 간 유사성을 포착하여 유사한 특징을 공유하는 개체들을 동일 군집으로 모으고 이질적인 개체들을 다른 군집을 정의해내는 비지도 학습 방법이다. 다양한 군집분석 방법이 제안되어 있으며 최적화 군집 방법 중 각 군집의 중심과 개체 간의 유클리디안 거리를 최소화하는 k-평균 군집분석은 가장 기본적인 방법으로 널리 사용되고 있다. 하지만 데이터에 결측이 존재하는 경우, 각 군집의 중심에서 결측이 발생한 개체까지의 거리를 계산하는 것이 불가능하므로 결측자료는 군집으로 분류되지 않는 문제가 발생하며 결측 자료를 제외한 군집분석의 결과는 예측하기 어렵다. 이러한 상황에 대해 대처하기 위해 결측치가 발생하더라도 관측된 정보만을 근거하여 군집분석을 수행하거나 결측치를 대체한 후 군집분석을 수행하는 다양한 방법들이 제안되어 있다. 본 연구에서는 결측 자료를 포함하고 있는 데이터에 대해 k-평균 군집분석을 수행할 방법들을 탐구하였으며, 모의실험을 통해 해당 방법들의 성능을 평가하였다. 모의실험을 통한 평가 결과, 결측치를 대체한 다음 k-평균 군집분석을 수행하는 것이 가장 좋은 성능을 보였으며, 결측치 대체 방법 중에서는 k-최근접 이웃(k-nearest neighbors) 대체가 가장 좋은 성능을 보였다. Cluster analysis is an unsupervised learning method to find heterogeneous clusters that capture similarities among items and separate different items into different clusters. Various cluster analysis techniques have been proposed, and the k-means clustering method, which minimizes the sum of Euclidean distances between cluster centroids and individual entities, is widely recognized as a standard cluster analysis method. When data include missing values, it is challenging to conduct cluster analysis, because it is impossible to calculate distances between centroids of clusters and incomplete items, resulting in excluding classification of these items. Techniques have been suggested to handle missing values in k-means clustering, including conducting cluster analysis after imputation of missing values or cluster analysis based on available information. In this study, we explore methods to perform k-means cluster analysis on data with missing values and evaluate performance of these methods using a simulation. The results of simulation studies indicate that conducting k-means cluster analysis after imputation yields the better performance than the one based on available information. Among the various imputation methods, k-nearest neighbors imputation performed the best.

      • KCI등재후보

        다차원 데이터의 군집분석을 위한 차원축소 방법: 주성분분석 및 요인분석 비교

        홍준호 ( Jun-ho Hong ),오민지 ( Min-ji Oh ),조용빈 ( Yong-been Cho ),이경희 ( Kyung-hee Lee ),조완섭 ( Wan-sup Cho ) (사)한국빅데이터학회 2020 한국빅데이터학회 학회지 Vol.5 No.2

        본 논문은 농식품 소비자패널 데이터에서 소비자의 유형을 나눌 때에 변수간 연관성이 많은 장바구니 분석에서 전처리 방법과 차원축소의 방법을 제안한다. 군집분석은 다변량 자료에서 관측 개체를 몇 개의 군집으로 나눌 때 널리 사용되는 분석기법이다. 하지만 여러 개의 변수가 연관성을 가진 경우에는 차원축소를 통한 군집분석이 더 효과적일 수 있다. 본 논문은 1,987 가구를 대상으로 조사한 식품소비 데이터를 K-means 방법을 사용하여 군집화하였으며, 군집을 나누기 위해 17개의 변수를 선정하였고, 17개의 다중공선성 문제와 군집을 나누기 위한 차원축소의 방법 중 주성분 분석과 요인분석을 비교하였다. 본 연구에서는 주성분분석과 요인분석 모두 2개의 차원으로 축소하였으며 주성분분석에서는 3개의 군집으로 나뉘었지만 분석하고자 하였던 소비 패턴에 대한 군집의 특성이 잘 나타나지 않았으며 요인분석에서는 분석가가 보고자 하는 소비 패턴의 특징이 잘 나타났다. This paper proposes a pre-processing method and a dimensional reduction method in the analysis of shopping carts where there are many correlations between variables when dividing the types of consumers in the agri-food consumer panel data. Cluster analysis is a widely used method for dividing observational objects into several clusters in multivariate data. However, cluster analysis through dimensional reduction may be more effective when several variables are related. In this paper, the food consumption data surveyed of 1,987 households was clustered using the K-means method, and 17 variables were re-selected to divide it into the clusters. Principal component analysis and factor analysis were compared as the solution for multicollinearity problems and as the way to reduce dimensions for clustering. In this study, both principal component analysis and factor analysis reduced the dataset into two dimensions. Although the principal component analysis divided the dataset into three clusters, it did not seem that the difference among the characteristics of the cluster appeared well. However, the characteristics of the clusters in the consumption pattern were well distinguished under the factor analysis method.

      • KCI등재

        2022 FIBA 남자농구 아시아컵 경기기록을 통한 선수들의 군집분석

        예원진,이성노,유덕수 한국체육과학회 2023 한국체육과학회지 Vol.32 No.5

        The purpose of this study is to determine whether there is a difference in performance level among participating players and the participation of star players in the 30th Men's Basketball Asia Cup in 2022, based on box score data provided on the official Asian Cup website. Clustering was performed using k-means cluster analysis, one of the machine learning techniques. The subject of this study was the game records of 189 players out of 16 teams participating in the tournament obtained through the official records of the 2022 Men's Basketball Asian Cup tournament, and differences in the players' performance characteristics were compared through a total of 21 variables. This study used the statistical program Python version 3.10.1 along with the library to perform cluster analysis. All significance levels for statistical analysis were set to .05, and the results obtained were as follows. First, as a result of cluster analysis using official records provided by the 2022 Men's Basketball Asian Cup competition, players from each country at the Basketball Asian Cup could be classified into three clusters. Second, there was a statistically significant difference in performance by cluster between cluster 1, cluster 2, and cluster 3, and the post-hoc test results showed that the players in cluster 2 had the best performance. Next, it was confirmed in the order of cluster 3 > cluster 1. Third, the abnormality detection results showed that there were 9 abnormal values among the cluster analysis results. Looking at this, ‘Q. Zhou’, ‘H. EHaddadi’, ‘A. Al Dwairi’, ‘G. ‘RA’, ‘D. Chism’, ‘A. Alderazi’, ‘W. Artino’, ‘M. Bolden’, ‘W. Arakji’ 9 were found to be basketball players. Fourth, the outlier players and all remaining players are divided into points, shots made, shot attempts, 2-point shots made, 2-point shots attempted, free throws made, free throw attempts, offensive rebounds, defensive rebounds, turnovers, There was a significant difference in block and efficiency. Summarizing the results of this study, from the perspective of a leader, strategies and tactics for the next men's basketball Asia Cup tournament can be designed and implemented based on the characteristics of the players in each group. On the player side, based on the performance characteristics of players in each group, it is possible to determine the individual's performance level and the gap in performance with other excellent players in this competition.

      • KCI등재

        결측자료의 k-평균 군집분석

        송주원 한국자료분석학회 2017 Journal of the Korean Data Analysis Society Vol.19 No.2

        Cluster analysis is an analysis technique to classify observations with similar characteristics into the same cluster. The k-means cluster analysis conducts grouping of observations based on an optimization method minimizing the sum of Euclidean distances between observations and their cluster centers. In real data, missing values often occur in some variables, and when cluster analysis is conducted for missing data, it is common to exclude observations with missing values. However, in this case, missing values cannot be classified into any group, and it may cause biases in estimating cluster centers. Therefore, to include observations with missing values in cluster analysis, it is often to impute missing values and conduct cluster analysis using imputed data. A disadvantage of this imputation approach is to conduct imputation without using cluster information. In this study, we propose methods to impute missing values using cluster information. Simulation is conducted to compare performance of the suggested imputation method with the one based on imputation without using cluster information. The proposed imputation method provides better results than the one ignoring cluster information. 군집분석은 유사한 특성을 지닌 관측치들을 동일한 그룹으로 분류하는 분석 기법이다. k-평균 군집분석은 관측치들과 군집 평균의 유클리디언 거리의 합을 최소화하는 그룹을 찾는 최적화 기법을 통해 자료를 군집으로 분류한다. 실제 자료의 경우 일부 변수에서 결측이 발생하는 경우가 흔하며 결측을 포함한 자료에 대하여 군집분석을 실시하는 경우 결측이 발생한 관측치를 제거한 후 분석을 실시하는 것이 일반적이다. 하지만 이 경우 결측이 발생한 자료는 어느 군집에도 할당할 수 없고 각 그룹의 평균의 추정에 편향이 발생할 가능성이 높다. 따라서 결측치를 포함한 자료를 군집분석에 포함하기 위하여 흔히 사용되는 방법은 결측값에 대해 대체를 실시한 후 대체된 자료에 대하여 군집분석을 실시하는데 이 경우 군집 정보를 포함하지 않고 대체를 실시하는 단점을 지닌다. 따라서 본 연구에서는 결측치에 대한 대체를 실시할 때 군집 정보를 이용하여 대체하는 방법을 제안한다. 모의실험을 통해 본 연구에서 제안한 방법을 군집 정보를 포함하지 않고 대체를 실시한 후 군집분석을 실시하는 경우와 비교하였는데 본 연구에서 제안한 대체 방법이 더 나은 결과를 보였다.

      • KCI등재

        히트맵 이미지를 활용한 딥러닝 기반의 EPL 경기유형 분석: 비전 트랜스포머 알고리즘 적용

        윤효준 한국체육측정평가학회 2023 한국체육측정평가학회지 Vol.25 No.3

        The purpose of this study is to pre-process soccer heat map image data using a vision transformer model and to classify soccer game types through cluster analysis. To achieve the purpose of the study, 760 heat map images and 35 match records of 380 matches in the 2022-2023 season of the English Premier League were selected as research data. As for the analysis method, after embedding was performed using the DINO-ViT16 model among vision transformer models, principal component analysis was performed for dimension reduction. Afterwards, the k-means algorithm was applied to cluster the game types, and at this time, the silhouette index was used to select the optimal number of clusters. The results of this study are as follows. First, the game type of soccer was classified into two clusters, and as a result of comparing the game records of each cluster, it was found that the number of passes and ball occupancy of cluster 2 was higher than that of cluster 1. Cluster 1 is the direct type, and cluster 2 is the build-up type. Second, as a result of detailed cluster analysis on cluster 1, it was classified into two clusters. As a result of comparing game records and heat maps for each cluster, cluster 1-1 was a defense-oriented unified attack pattern type, and cluster 1-2 was a defense-oriented various attack pattern. Third, as a result of detailed cluster analysis on cluster 2, it was classified into 3 clusters, and as a result of comparing the match records and heat maps for each cluster, it is determined that cluster 2-1 was a type with various attack patterns through high ball occupancy in the central area, cluster 2-2 is a type that dominates the game with very high ball occupancy and passes, and cluster 2-3 is a type that has a pattern of attack focused on a space behind the defense through high ball occupancy or a specific area.

      • KCI등재

        라이프스타일 요인에 따른 세부집단별 특성분석 - 항공서비스에 대한 함의 -

        강명수 ( Myung Soo Kang ),이정훈 ( Jeonghoon Lee ),안제성 ( Jesung Ahn ) 한국항공경영학회 2020 한국항공경영학회지 Vol.18 No.1

        본 연구는 항공서비스가 빠르고 다양하게 변화하는 소비자들의 요구를 충족시키기 위해서는 라이프스타일 유형별로 군집화하여 세분화된 군집의 특징을 파악하여 군집별 맞춤형 항공서비스를 개발 및 제공해야 하는 필요성을 제시하고자 하였다. 이를 위해 이론적 고찰을 바탕으로 설문 문항을 작성하고 데이터를 수집하였으며, 요인분석과 신뢰도분석을 실시하여 측정변수의 타당성을 확보하였다. 라이프스타일 요인분석 결과 외모지향, 사교지향, 가족지향, ‘브랜드/과시지향, 여가지향, 목표지향, 사회지향의 7개 요인으로 구분되었고, 도출된 요인을 가지고 군집분석을 실시한 결과 4군집으로 나뉘어졌다. 라이프스타일에 따라 세분화된 군집 간의 차이를 파악하기 위해 일원분산분석을 실시하였고, 세분화된 군집별로 유의한 차이가 나는 것을 확인할 수 있었다. 군집별 라이프스타일 속성은 각 군집에서 평균값이 높은 양수를 가진 요인을 선택하였고, 이를 토대로 각 군집별 특징을 확인할 수 있다. 군집1은 삶에서 다양한 문화생활을 즐기는 것을 좋아하고, 인간관계를 중요하게 하며, 군집2는 공동체 의식이 강하며 인간관계를 중요하게 생각하는 성향이라 할 수 있다. 군집3은 여러 사람과 어울리는 것을 좋아하고 가족과 보내는 시간을 중요하게 생각하며, 군집4는 삶에서 지향하는 바가 뚜렷하며 남들에게 보이는 것을 중요하게 생각하는 성향이라 할 수 있다. 따라서 라이프스타일에 따른 세분화된 각 군집별로 중요하다고 여기는 속성을 파악함으로써 라이프스타일에 따른 시장세분화가 실무적으로 유용하게 쓰일 수 있음을 확인할 수 있었다. 또한, 소비자들이 항공서비스를 이용할 때 세분화된 군집별로 고객관리 측면에서 중요하게 다뤄져야 할 영역을 파악할 수 있었으며, 라이프스타일에 따른 세분화 된 군집에 대한 속성 정보는 점점 다양해지고 증가하는 항공서비스 이용자의 욕구가 충족될 수 있는 효과적인 마케팅전략 수립과 고객 만족을 달성할 방안 마련에 많은 도움을 줄 수 있을 것으로 판단된다. The purpose of this study is to suggest the necessity of developing and providing customized aviation service for each cluster by grasping the characteristics of segmented clusters by clustering by lifestyle type in order to meet the needs of consumers who have fast and diversified aviation services. For this, a questionnaire was prepared based on theoretical considerations, and data were collected. Factor analysis and reliability analysis were conducted to secure the validity of the measured variables. The lifestyle factor analysis was divided into seven factors: appearance-oriented, social-oriented, family-oriented, brand/showoriented, leisure-oriented, goal-oriented, and social-oriented, and the result of cluster analysis was divided into four groups. A one-way analysis was conducted to identify differences between groups that were subdivided into different life styles. The results showed that there were significant differences between the subdivided clusters. The lifestyle attribute of each cluster was selected by factors with high positive values in each cluster. Based on this, the characteristics of each cluster could be identified. Cluster 1 enjoys various cultural life in life, makes human relations important, and cluster 2 has a strong sense of community and tends to regard human relations as important. Cluster 3 likes to get along with people and thinks about spending time with family, and cluster 4 has a clear intention in life and a tendency to value what is seen by others. As a result, it was found that life style was useful for market segmentation by identifying the attributes that were considered important for each cluster that were subdivided into different life styles. In addition, it was also possible to identify areas of importance in customer management by segmented clusters when using aviation services, and it is believed that the fragmented breakdown of characteristics according to lifestyle will help establish marketing strategies to meet the growing needs of air service users and also help them find directions for customer satisfaction.

      • KCI등재

        차원축소를 통한 결측자료의 군집분석

        송주원(Juwon Song) 한국자료분석학회 2020 Journal of the Korean Data Analysis Society Vol.22 No.2

        군집분석은 유사한 특성들을 지닌 관측값들을 같은 군집으로, 다른 특성들을 지닌 관측값들은 서로 다른 군집으로 분류하는 분석 기법이다. 많은 변수를 포함한 고차원 자료에서는 일반적인 군집분석 대신 차원축소를 통하여 군집분석을 실시하는 방법들이 제안되어 왔다. 주성분 분석을 통해 차원을 축소한 후 축소된 차원에서 군집분석을 실시하는 직렬분석 방법보다 차원축소와 군집분석을 결합하여 동시에 실시하는 방법들이 더 우수한 성능을 보인다는 것이 알려져 있다. 한편, 대부분의 자료는 결측값을 포함하고 있는데 결측값이 포함된 자료에 대하여 군집분석을 실시하는 경우 불완전하게 관측된 자료들은 어느 군집으로도 분류되지 않는 문제가 발생한다. 따라서 군집분석을 실시하기 전에 먼저 결측값 대체를 실시하는 것이 일반적이다. 본 연구에서는 고차원 결측자료에 대하여 차원축소를 통한 k-평균 군집분석을 실시할 때 결측값 대체를 결합하여 실시하는 방법을 제안한다. 이 방법은 군집 정보를 이용한 결측값 대체를 통해 정확한 차원축소를 통한 군집분석이 가능하게 하는 장점을 지닌다. 제안된 방법은 모의실험을 통해 성능을 평가하였고 결측값을 대체한 후 대체된 자료에 대하여 차원축소를 통한 군집분석을 실시하는 직렬식 분석방법과 비교하였다. 제안된 방법은 적절한 차원축소를 통한 k-평균 군집분석을 실시한다면 직렬식 분석보다 오분류율이 낮게 나타났다. Cluster analysis classify similar observations into the same cluster and different observations into different clusters. When data include many variables, reduced dimension clustering methods have been suggested instead of the standard clustering methods. The joint analysis of dimension reduction and clustering is known to perform better than tandem analysis that sequentially conducts dimension reduction and clustering. On the other hand, most data include missing values. When cluster analysis is conducted with incomplete data, incomplete observations can not be classified into any group. To avoid this problem, it is common to impute missing values before conducting cluster analysis. In this study, we suggest a method for combining dimension reduction k-means clustering and missing data imputation. The suggested method has an advantage to accurate classify observations through imputation using cluster information. A simulation is conducted to evaluate performance of the suggested method and compare the result with the one based on tandem analysis. The suggested method using an appropriate dimension reduction k-means clustering showed lower misclassification rates than tandem analysis.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼