http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
강창완,김규곤,김태완 한국자료분석학회 2009 Journal of the Korean Data Analysis Society Vol.11 No.1
Recently, the field of scientific research has been moved from off-line spaces to on-line spaces of the computer via World Wide Web, due to the development in computer technology. Websites of academic societies provides lots of academical information to the researchers and play important role as a indicator in evaluating academic societies. Specially, the contents, structures and management system of academic societies' websites make it possible for the exchange and search of research information, and improve the satisfaction and also increase the participation of the members in academic societies. Therefore we can justify that the evaluation for the activities of academic societies could be done effectively by website log analysis. In this paper, we analyze weblog data of the Korean Data Analysis Society's website using Google Analytics, derive the current states of it and finally suggest some plans for the efficient managements of this website. The results showed that total number of visits is 411, the number of the pages per visit is 1.65 and the average time on the site is 1 minute. 최근 급속한 컴퓨터 기술의 발전으로 인하여 과학 기술 분야의 연구 정보의 장이 인터넷 공간으로 옮겨오고 있는 실정이다. 이러한 인터넷 시대에서 대부분 학술단체의 활동 중 학회 웹사이트를 이용한 정보 제공은 학회 활동의 평가지표로 매우 중요한 역할을 담당하고 있다. 특히, 학회 웹사이트의 구성 내용과 운영방식은 학회 정보를 이용하거나 연구 정보의 교환 및 탐색하는데 효율적인 밑바탕이 되고 이는 학회 구성원의 학회 참가도 및 만족도에 지대한 영향을 끼친다고 할 수 있다. 본 연구에서는 한국자료분석학회의 웹로그 분석을 하고 이를 통해 학회 웹사이트의 현황을 분석하고 학회 웹사이트의 효율적 운영을 위한 몇 가지 개선 방안을 제시한다. 웹로그 분석 결과 1달 동안에 본 학회를 방문한 방문자 수는 총 411번으로 나타났으며, 방문 당 페이지뷰 수는 1.65, 그리고 평균 머문 시간은 1분으로 나타났다.
강창완,김규곤,최승배 한국자료분석학회 2018 Journal of the Korean Data Analysis Society Vol.20 No.6
Journal of the Korean Data Analysis Society founded in 1998 has played the role of a major application journal. In this study, we checked the objective of this journal by checking the abstracts for 10 years. Abstract data was crawled from the online journal site (kdas.jems.or.kr) and analyzed by topic model. As a result, we found 18 topics from 2680 abstracts that had several contents, for example, nursing, marketing, economics, regression, factor analysis, data mining and statistical inferences. Topic1 (regression) is most frequent with 460 documents and we found the usefulness of regression in the applied science area. We confirmed the significant 10 association rules using by Fisher’s exact test. Also, for exploring the trend of topics, we conducted the topic analysis for two periods which are 2006-2011 period and 2012-2016 period. We found that the control study was more frequent than survey study over time and regression and factor analysis were frequent regardless of time. 1998년에 창립한 한국자료분석 학회지는 자료분석에 기반한 다양한 전공분야를 위해 현재까지 응용학회지로서 역할을 해오고 있다. 본 연구에서는 이러한 한국자료분석 학회지의 본연의 목적을 잘 수행해오고 있는지 최근 10년간 학회지 요약문을 통해 분석하였다. 분석은 한국연구재단에서 제공한 온라인 저널 홈페이지를 통해 2006년부터 2016년까지의 영문 요약문 2680개를 웹크롤링하여 토픽모델을 적용하였다. 분석결과로 18개의 토픽이 선정되었으며 이에 대한 토픽을 해석한 결과 자료분석학회지는 간호학, 경영학(마케팅), 경제학 등 여러 분야를 다루고 있으며 분석방법으로 회귀분석, 가설검정, 데이터마이닝(연관성분석), 요인분석 등이 많이 이용되고 있음을 볼 수 있었다. 그리고 단어들의 연관성(association rule)분석을 통하여 통계적으로 유의한 연관성 규칙 10개를 제시하였다. 여기서 연관성규칙의 통계적 유의성검정은 피셔의 정확검정(Fisher’s exact test)을 사용하였다. 또한 연구주제(토픽)의 변화를 살펴본 결과 전반기에는 조사연구가, 후반기에는 대조 연구가 많아졌음을 볼 수 있고 또한 회귀분석과 요인분석은 전, 후반기 구분 없이 자료분석에서 공통적으로 많이 사용하는 통계적 방법임을 알 수 있었다.
이광진 한국자료분석학회 2008 Journal of the Korean Data Analysis Society Vol.10 No.1
A so-called 'functional data correspondence analysis' is not yet introduced in and is not yet commented about, which is combined with methodologies of recently-developed functional data analysis and a fundamental concept of classical correspondence analysis. So this paper makes an attempt to standardize it with an artificial problem of data analysis. Its main steps are followings: ①to estimate probability density functions by group, ②to make an optimal contingency table of which each row represents a group, each column a sub-interval, each cell-value an estimated frequency from the estimated pdf, ③to get row coordinates and column coordinates from a simple correspondence analysis of the last optimal contingency table, and finally ④to get a curve of correspondence function by smoothing the column coordinates. The decision on the proper number of sub-intervals depends maybe on the pattern of the values of chi-square statistic. 비교적 최근에 개발된 자료분석기법인 함수자료분석(functional data analysis)의 방법론과 전통적인 자료분석기법인 대응분석(correspondence analysis)의 기본개념이 결합된 소위 '함수자료대응분석(functional data correspondence analysis)'이란 기법은 아직까지 소개되거나 언급조차 된 적이 없다. 이에 본 연구에서는 가상의 한 자료분석 문제를 제기하고 이를 통해 '함수자료대응분석'이란 이름의 자료분석기법에 대해 그의 정형화를 시도한다. 기본 흐름은 다음과 같다. ①집단별 자료로부터 각 집단의 확률밀도함수를 추정하고, ②집단을 행, 부분구간을 열, 추정된 확률밀도함수에 근거하여 계산된 추정 자료수를 셀의 값으로 갖는 이원분할표들 중 카이제곱 통계량 값을 최대로 하는 이원분할표를 얻고, ③이에 대해 단순대응분석을 실시하여 행범주 및 열범주 좌표점들을 구한다. ④마지막으로 열범주 좌표점들에 대한 평활화를 통해 '대응함수곡선'을 구한다. 물론 부분구간의 적절한 개수 결정은 카이제곱통계량 값들이 변화하는 패턴을 참조하여 이루어진다.
결측자료 분석에서 결측 비율이 결측자료 k-평균 군집분석에 미치는 영향
송주원 한국자료분석학회 2017 Journal of the Korean Data Analysis Society Vol.19 No.3
In the analysis of missing data, nonresponse rates have been considered as an important factor to influence on the quality of the analysis, but recent empirical researches show that nonresponse rates are not related to bias of the estimates. These researches consider the effect of nonresponse rates in the estimation of the population mean in survey data, and it is hard to find researches to evaluate the effect of nonresponse rates on other types of analysis. Cluster analysis groups similar observations into the same cluster. Since the main interest of the cluster analysis is on the misclassification rates, not on the estimation of the cluster means, it is necessary to approach this problem differently. This research focuses on k-means cluster analysis when missing values are imputed and evaluates how nonresponse rates are related to misclassification rates. Especially, overlaps on distributions among clusters, missing data mechanisms, and imputation methods are considered as factors that may influence on the quality of the k-means clustering, and a simulation is conducted to evaluate the effect of these factors on the relationship between the nonresponse rates and misclassification rates. When distributions among clusters do not overlap, it shows that nonrespose rates are not related to misclassification rates. 결측자료의 분석에서 결측 비율은 분석의 질에 영향을 주는 주요 요소로 생각되어 왔다. 최근 결측 비율이 추정량의 편향에 영향을 주지 않는다는 연구 결과들이 발표되면서 결측 비율이 향상 분석의 질을 감소시키는 것은 아니라는 주장이 힘을 싣고 있다. 하지만 관련 연구들은 조사 자료에서 결측이 발생한 경우 모집단 평균을 추정하는데 결측 비율이 영향을 주는지를 논의하고 있으며 다른 분석에서의 영향을 평가한 연구는 찾기 힘들다. 군집분석은 자료 내 유사한 특성을 지닌 개체들을 동일한 군집으로 분류하는 분석기법으로 군집의 평균 추정보다는 적절한 분류를 실시하지 못하는 정도에 중점을 두고 분석이 실시되므로 조사 연구에서 모평균 추정과는 다른 문제로 접근하는 것이 필요하다. 본 연구에서는 군집분석 기법 중 하나인 k-평균 군집분석에 대하여 대체를 실시한 후 k-평균 군집분석을 시행할 때 결측 비율이 어떤 영향을 미치는 지 고찰하였다. 특히 k-평균 군집분석의 성능 및 결측자료의 성능과 연관된 요인들인 군집 간 분포의 겹침 정도, 결측자료 메커니즘, 그리고, 결측자료 대체 방법에 따라 결측 비율이 증가할 때 군집분석의 오분류율이 증가하는지 모의실험을 통해 평가하였다. 군집 간 분포의 겹침 정도가 적은 경우 결측비율이 증가해도 오분류율은 비례적으로 증가하지 않는 것으로 나타났다.
경제정책 불확실성이 장단기 국채 수익률에 미치는 영향 분석
박유현(Yuhyeon Bak),송철종(Cheol Jong Song) 한국자료분석학회 2023 Journal of the Korean Data Analysis Society Vol.25 No.5
본 연구는 국내와 해외의 경제정책 불확실성이 국내 장·단기 국채 수익률에 미치는 영향을 분석하였다. 우선 국내 경제정책불확실성이 장기와 단기의 국채 수익률에 미치는 영향을 분석하고, 해외 경제정책 불확실성에 대한 국내 경제정책 불확실성의 비율로 구성한 상대적 불확실성을 이용하였다. 해외 경제정책 불확실성으로 일본, 중국, 미국을 고려하였다. 또한 주성분분석을 통해 한국의 경제정책 불확실성을 한국 고유 요인과 주변국과의 공통 요인으로 구분하였다. 분석 결과는 다음과 같다. 첫째, 한국의 경제정책 불확실성은 장기와 단기 국채 수익률에 유의한 영향을 미치지 않았다. 둘째, 경제정책 불확실성 중 한국의 고유 요인은 단기 국채 수익률을 유의하게 상승시키는 것으로 나타났다. 셋째, 일본, 중국, 미국의 경제정책 불확실성은 한국의 단기국채 수익률을 상승시키는 것으로 나타났다. 넷째, 상대적 경제정책 불확실성을 이용한 경우, 한국의 경제정책 불확실성이 중국보다 상대적으로 커질 때 한국의 단기 국채수익률이 상승하였다. 이는 경제정책 불확실성을 국가 고유 요인과 공통 요인으로 구별해야 불확실성이 국채 수익률에 미치는 영향을 명확하게 이해할 수 있음을 시사한다. This study analyzes the impact of Korean and foreign economic policy uncertainty on Korean short-term and long-term government bond yield. First of all, the effect of domestic economic policy uncertainty on short-term and long-term government bond yields was analyzed, and then relative policy uncertainty, which was constructed as a ratio of Korean economic policy uncertainty to foreign economic policy uncertainty, was used. Japan, China, and the United States were considered for foreign economic policy uncertainty. In addition, through principal component analysis, Korea's economic policy uncertainty was divided into Korea-specific factors and common factors with Japan, China and USA. The analysis results are as follows. First, Korea's economic policy uncertainty did not have a significant effect on long-term and short-term government bond yields. Second, Korea's unique factor in economic policy uncertainty was found to significantly increase short-term government bond yields. Third, the economic policy uncertainties of Japan, China, and the US have been shown to increase Korea's short-term government bond yields. Fourth, in case of analyzing the effect of relative economic policy uncertainty, Korea's short-term government bond yield rises when Korea's economic policy uncertainty is relatively greater than China's. This implies that the impact of uncertainty on government bond yields can be clearly understood only when economic policy uncertainty is distinguished as a country-specific factor and a common factor.
한상태(Sang-Tae Han) 한국자료분석학회 2023 Journal of the Korean Data Analysis Society Vol.25 No.1
대응분석은 일반적으로 2차원 이상의 분할표를 저차원 공간에 표현하여 행과 열의 결합 형태를 볼 수 있는 자료분석기법이다. 일반적으로 분할표 분석에 적용하는 통계적 분석 방법은 카이제곱 검정(chi-square test)을 이용하는데, 카이제곱 검정은 행과 열에 대한 결합양상을 보여주지 못하는 한계가 있다. 이에 대한 대안으로 대응분석을 활용한다. 일반적으로 대응분석의 행 프로파일은 합이 1이다. 각 개체의 다양한 속성이 리커트 척도로 평가한 자료는 행 합계가 행마다 달라 일반적인 대응분석을 수행할 수 없다. 이런 자료는 각 속성을 긍정성과 부정성을 합해서 합이 같게 열 범주 수를 두 배로 늘려 대응분석을 적용할 수 있는데, 이를 더 블링 기법이라 한다. 리커트 자료에 대해 정규분포 및 통계적 모형에 의존하지 않은 탐색적 다변량 자료 분석의 결과로 더블링 기법을 활용한 대응분석 연구를 제안하였다(Han, 2019). 심사자와 대상들을 수량화하고, 그 결과를 그래픽적 기법을 사용하여 표현함으로써 기하적인 명쾌한 의미해석과 시각적으로 쉽게 인지할 수 있도록 하였다. 그러나, Han(2019)에 의해 제안된 방법에 대해 수량화 분석결과에 대한 안정성 평가는 아직 개발되지 않았다. 따라서, 여론조사라든가 소비자 선호도 조사 등 실제 생활에서 자주 보이지만 분석 방법의 개발이 부족한 리커트 자료 분석에 대한 자료론적 방법에 대한 안정성 평가에 대한 방법론을 개발하고, 사례분석을 통해 이에 대한 유용성을 보이고자 한다. Correspondence analysis is generally a data analysis technique that expresses a two-dimensional or higher contingency table in a low-dimensional space to see the combination of rows and columns. In general, a statistical analysis method applied to contingency table analysis uses a chi-square test, but the chi-square test has a limitation in that it cannot show the coupling pattern for rows and columns. As an alternative, correspondence analysis is used. In general, the row profiles of correspondence analysis sum to 1. For data evaluated on the Likert scale for various attributes of each entity, the sum of rows is different for each row, so general correspondence analysis cannot be performed. Correspondence analysis can be applied to such data by doubling the number of column categories by adding the positive and negative values of each attribute so that the sum is equal. This is called the doubling technique. As a result of exploratory multivariate data analysis that does not rely on normal distribution and statistical models for Likert data, a correspondence analysis study using a doubling technique was proposed (Han, 2019). By quantifying the examiners and subjects, and expressing the result using a graphic technique, it was easy to visually recognize and interpret geometrically clear meaning. However, for the method proposed by Han (2019), the stability evaluation for quantification analysis results has not yet been developed. Therefore, in order to develop a methodology for the stability evaluation of the materialistic method for Likert data analysis, which is often seen in real life such as public opinion surveys or consumer preference surveys, but lacks development of analysis methods, and to show its usefulness through case analysis do.
임연수(Yon Soo Lim) 한국자료분석학회 2023 Journal of the Korean Data Analysis Society Vol.25 No.1
이 연구는 사회적 쟁점을 추적하고 탐색하는 쟁점 분석 측면에서 토픽모델링의 활용 가능성을 탐지하는 데 목적이 있다. 토픽모델링 방식 중 잠재 디리클레 할당(Latent Dirichlet Allocation: LDA) 알고리즘에 기반한 토픽 분석과 구조적 토픽모델링(Structural Topic Modeling: STM) 방법은 연구 접근 방식에 따라 구분해서 사용할 필요가 있다. 가설 검증을 위한 확인적 자료 분석(Confirmatory Data Analysis) 방식에는 STM이 적합하고, 언론 보도에 대한 쟁점 분석과 같이 자료에 대한 탐색적 자료 분석(Exploratory Data Analysis)에는 LDA가 적합하다. LDA 기반 토픽 분석에서 문서 내 메타 정보를 활용해 문서 범주를 분류한다면 동태적 자료 분석도 가능할 수 있다. 이를 실증적으로 살피기 위해서 10개의 국내 주요 전국일간지에서 보도한 증오 관련 기사를 대상으로 LDA 기반 토픽 분석을 수행했다. 분석 결과, 모든 언론사에서 여성 증오 범죄를 2021년에 주요하게 다루고 있었고, 증오와 혐오 정치 토픽이 2022년에 상승하는 추세를 보였다. 증오문제에 대한 보도 방향이 언론사 간 큰 차이를 나타내지 않고 있으며, 정치적 편향에 따른 보도특성도 크지 않았다. 이는 증오 문제가 언론 보도에서는 중요한 쟁점으로 아직은 부상하지 않음을 나타낸다. 결론적으로, 이 연구는 쟁점을 추적하고 탐지하는 활동에 LDA 기반 토픽모델링 방법이 충분히 활용될 수 있다는 점을 실증 분석을 통해 보여준다. This study aims to explore the possibility of using topic modeling in terms of issue analysis in tracking and detecting social issues. Among the topic modeling methods, LDA(Latent Dirichlet Allocation) based topic analysis and STM(Structural Topic Modeling) need to be used separately according to the research approach. STM is suitable for Confirmatory Data Analysis for hypothesis test, and LDA is suitable for Exploratory Data Analysis, such as issue analysis on news media. Dynamic data analysis may be possible if document categories are classified using meta-information in documents in LDA based topic modeling. In order to empirically examine, an LDA based topic analysis was conducted on hatred articles reported by 10 major national daily newspapers in Korea. From the results, all newspapers mainly dealt with hatred crimes against women in 2021, and hatred politics of politicians showed an upward trend in 2022. The direction of news reporting on the hatred issue did not show much difference among newspapers, and the characteristics of news reporting due to political bias were not large. This indicates that the issue of hatred has not yet emerged as an important issue in news coverage. In conclusion, this study demonstrates through empirical analysis that LDA based topic modeling can be fully utilized for research activities that track and detect issues.
양호진(Hojin Yang) 한국자료분석학회 2022 Journal of the Korean Data Analysis Society Vol.24 No.5
미세먼지는 인체에 유해한 화합물 등으로 구성되어 눈에 보이지 않는 입자로 공기 중에 떠다니며 대기 오염을 유발하거나 인체에 흡입되어 각종 질병을 유발한다. 기상청 개방포털에 의하면 미세먼지는 전국 28개 관측소에서 측정되어 이와 관련한 예보 및 경보 시스템 등에 널리 사용 된다. 본 연구에서는 측정된 미세먼지 자료를 함수형 공간 자료 모형에 의하여 추출된 자료라 가정하고 공간 통계학적 접근 방법과 함수형 자료 분석 방법을 결합하여 고정효과인 전국 평균 함수를 추정하고 예측할 수 있는 기법을 소개하고자 한다. 기존의 연구는 측정된 미세먼지를 설명하는 방법이 경시적 자료 분석법에 집중하였는데 이는 관측소의 위치가 균일하게 분포 되어 있지 않은 현실적 상황과 관측소간 거리의 차이 따라 종속성이 존재할 수 있다는 공간 자료의 특성을 고려하지 않은 접근법이다. 따라서 기존 분석법과 관련한 부분을 함수형 자료로 대체하여 적용하고 크리깅과 같은 공간 통계학적 방법을 적용하여 2021년 한 해 동안 획득된 미세먼지 자료를 분석하고자 한다. 구체적으로 전국 28개 관측소에서 얻어진 자료로부터 전국 미세먼지 평균을 이상치에 덜 민감한 가중평균을 통해 고정효과를 추정하고자 한다. 이를 위하여 경험적 베리오그램 분석을 통하여 공분산 과정을 추론하고 최적의 가중치들을 계산하고자 한다. 또한 어떠한 관측 장소에서도 미세먼지 농도를 예측할 수 있는 크리깅 방법을 소개하고 적용해보고자 한다. Particulate matter consisting of the chemical compounds harmful to human body and floating in the air as the invisible dust has been affecting on the air pollution or the various disease by inhaling into the human body. According to the Korea Meteorological Administration’s open portal, the particulate matter is measured at 28 sites and is widely used in forecasting and warning systems related to the particulate matter. In this paper, we will introduce an approach that can estimate the fixed effect and predict the future value by incorporating the spatial approach with the functional approach, assuming that the nature of the measurement for the particulate matter is a functional nature. While the existing studies have focused on the longitudinal data approaches, these approaches did not consider the characteristics of the spatial data that can have dependency between the sites and of the irregularity that the sites are not uniformly distributed across the spatial domain. To address this issue, we consider extending the existing approach to the functional data approach and applying the spatial approach such as kriging. Specifically, we consider the weighted mean being insensitive to extreme observations to account for the fixed effect from the real data obtained from 28 sites for 2021 year. To do this, we estimate the covariance process and compute the optimal weight through the empirical variogram analysis. Also, we apply a kriging method that can predict the value associated with the particulate matter at any given observational site.
한국인의 주관적 건강상태와 우울이 건강관련 삶의 질에 미치는 매개효과: 제7기 2016년도 국민건강영양조사를 활용한 이차자료 분석
유혜연 한국자료분석학회 2019 Journal of the Korean Data Analysis Society Vol.21 No.2
This study is a secondary data analysis study to investigate mediating effects of subjective health status and depression and impact factors on health related quality of life (HRQoL) using data of the first year (2016) of the 7th national health and nutrition examination survey. The subjects were sampled nationwide using the stratified cluster sampling method. The extracted data were analyzed by composite sample general linear model t-test, and composite sample logistic regression model. A hierarchical regression analysis proposed by Kenny (2008) and Mackinnon, Dwyer (1993) was conducted. Then the mediating effects of subjective health status and depression was validated using the formula of Sobel (1982). In results, the number of comorbidities, HbA1c and hs-CRP mediated through subjective health status indirectly influence on HRQoL. And the number of comorbidities mediated by depression and indirectly affect HRQoL, respectively. Therefore, further study is needed comprehensive approach for program considering subjective health status and depression to improve HRQoL of Korean adults. 본 연구는 국민건강영양조사 제7기의 1차(2016년)자료를 이용하여 한국인의 주관적 건강상태와 우울이 건강관련 삶의 질에 미치는 매개효과를 확인하기 위한 이차자료 분석연구이다. 추출된 자료는 복합표본 일반선형모형 t-검정, 복합표본 로지스틱 회귀모형, 다중회귀분석 등을 이용하여 분석하였다. 범주형 변수인 주관적 건강상태와 우울의 매개효과를 분석하기 위해 MacKinnon, Dwyer(1993)가 제안한 내용을 바탕으로 Kenny(2008)의 공식을 적용하여 회귀분석을 실시하였고, Sobel(1982)의 공식을 활용한 매개효과 검증을 실시하였다. 일반적인 특성을 통제한 후 한국인의 건강관련 삶의 질에 영향을 미치는 요인을 분석한 결과, 동반질환 개수, 주관적 건강상태, 우울이 건강관련 삶의 질의 유의한 영향요인으로 나타났다. 동반질환 개수, HbA1c, hs-CRP는 주관적 건강상태를 매개하여 건강관련 삶의 질에 영향을 미치는 것으로 검증되었고, 동반 질환 개수는 우울을 매개하여 건강관련 삶의 질에 영향을 미치는 것으로 검증되었다. 따라서 한국인의 건강관련 삶의 질을 개선하기 위해서는 평소 건강상태에 대한 관리 수준을 높이고 신체적 영역의 주관적 건강상태와 심리적 영역의 우울을 통합적으로 스크리닝할 필요가 있으며 건강문제 대처 능력과 자가 간호를 증진할 수 있는 통합적으로 접근할 수 있는 체계적인 간호 중재 프로그램 개발이 필요하다.
강현철,한상태 한국자료분석학회 2004 Journal of the Korean Data Analysis Society Vol.6 No.6
The multiple choice data, which can be considered a sort of multivariate binomial response data, is frequently observed in many applications of marketing research. For this type of data, a principal component analysis based on the correlation matrix(or covariance matrix), which is a Euclidean measure of association, is commonly used method. But actually a wide choice is available since such measures have been developed over the years which embody Euclidean as well as non-Euclidean properties. In this study, we propose several measures of association which can be used for multiple choice data when carrying out a principal component analysis. Also, some results are accompanied by the associated marketing research examples. 마케팅 리서치에서 자주 다루게 되는 자료의 형태 중 하나는 다중선택(multiple choice) 자료이며 이는 일종의 이항반응(binomial response) 다변량 자료로 간주될 수 있다. 일반적으로 이항반응 다변량 자료에 대해서 변수들의 구조적 연관성을 파악하기 위해 마케팅 리서치에서 가장 널리 사용되는 방법 중 하나는 상관행렬(또는 공분산행렬)에 기초한 주성분분석(또는 인자분석)이다. 그러나 다중선택 자료는 통상적인 이항반응 자료와는 약간 독특한 성격을 가지고 있기 때문에 그러한 성질을 고려할 수 있는 연관성 측도와 분석기법을 사용하는 것이 바람직한 경우가 종종 있다. 본 연구에서는 이러한 문제점을 보완하기 위해 자료분석적 측면에서 실제적으로 사용할 수 있는 몇 가지 연관성 측도들을 제시하고 사례분석을 통해 그 결과를 살펴보았다.