RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      • 좁혀본 항목

      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
          • 원문제공처
          • 등재정보
          • 학술지명
          • 주제분류
          • 발행연도
          • 작성언어
          • 저자

        오늘 본 자료

        • 오늘 본 자료가 없습니다.
        더보기
        • 무료
        • 기관 내 무료
        • 유료
        • KCI등재

          자료통합을 위한 통계적 매칭방법 비교

          송지나,김영원 한국자료분석학회 2016 Journal of the Korean Data Analysis Society Vol.18 No.6

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          Recently, demand of statistics-users becomes more complex and diverse. And survey environment is also getting worse due to increasing of survey cost and personal information protection policy. As a way of solving such problems, study on the statistical matching has been actively done by many researchers. Statistical matching is a methodology used to merge microdata from several sample surveys into a single synthetic microdata file. Among various statistical matching methods, we investigated the methods proposed by Kadane (1978) and Moriarity (2009), and a new method which is a modification of the Moriarity for considering the non-normality of the survey materials is introduced. The case studies for comparison of efficiency of statistical matching methods were conducted using 2012 NaSTaB and KLIPS. In this study, we compared several statistical matching methods from the viewpoint of maintenance of assumed covariance for the matching, and differences and distributions of the imputed values and the actual values of recipient file. We found that the Mariarity method and the proposed new method are efficient than Kadane method in terms of mean squared imputed error and preservation of covariance structure. 최근 통계 자료 이용자들이 요구하는 자료의 형태나 수준이 매우 다양하고 복잡해지고 있으며, 이런 수요를 비용을 절감하면서 수용하기 위해서는 두 개의 독립적인 조사를 병합해서 활용하는 방안을 고려할 필요가 있다. 이런 관점에서 본 연구에서는 독립적인 두 조사 자료를 통계적인 방법을 이용하여 하나의 자료로 통합하는 통계적 매칭(statistical matching) 방법들의 장단점을 살펴보기 위해 두 개의 조사 자료를 활용한 사례분석 결과를 제시한다. 다양한 통계적 매칭 방법 중 Kadane(1978)과 Moriarity(2009)가 제안한 매칭 방법과 함께, 조사 자료의 비정규성을 고려하여 Moriarity의 방법을 변형한 새로운 방법을 제안하고, 세 가지 매칭방법의 효율성을 사례연구를 통해 비교하였다. 2012년도 재정패널조사 자료와 한국노동패널조사 자료 중 일부 변수를 대상으로 통계적 매칭 방법을 적용해 통합자료를 구축한 후 매칭방법의 효율성을 비교하였다. 조건부독립가정이 성립하는 경우와 성립하지 않는 경우를 모두 검토하였으며, 매칭방법의 효율성 비교를 위해 모형 설정을 위해 가정한 공분산이 통합자료에서도 그대로 유지될 수 있는지, 원래 자료의 값과 매칭 과정을 통해 대체된 값의 차이, 통합 자료의 분포가 원래 자료의 분포와 어느 정도 일치하는지 등의 관점에서 매칭 방법들의 장단점을 비교하였다. 사례분석 결과 조건부 독립 가정의 성립 여부와 관계없이 Moriarity의 방법과 본 연구에서 제안한 새로운 방법이 Kadane 방법에 비해 설정된 모형의 공분산을 유지한다는 것과 수용자 파일의 분포와 비슷한 분포를 복구할 수 있다는 관점에서 우수한 것으로 나타났다.

        • KCI등재

          DataGuide와 TS2000의 재무자료의 질에 대한 연구

          남현정 한국자료분석학회 2016 Journal of the Korean Data Analysis Society Vol.18 No.4

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          The purpose of this research is to examine errors of financial data produced by Korean financial information database providers' produce. In Korea, there are two major financial information database providers; DataGuide provided by FnGuide and TS2000 operated by Korea Listed Company Association. As these two financial information databases are the most prestige database, almost empirical researches in Korea use them. Additionally, we examine whether faulty financial data may affect or even mislead decision making by using bankruptcy prediction model suggested by Altman's (1980) based on different data sources. The study examines errors and differences of financial data produced by two major Korean financial information database providers, DataGuide and TS2000. We analyze differences of ten variables for the 677 firms listed in the KSE and 20,310 observations over three years (2011-2013). We find 1,194 (5.88%) differences out of 20,310 observations from financial statement, income statement, and stock data provided by DataGuide and TS2000 and also five variables out of ten key variables are statistically significant different. We also test insolvent firm forecasting employing Altman (1968)'s bankruptcy prediction model using DataGuide and TS 2000. The empirical results shows that 8 (42.9%) insolvent firms are wrongly predicted as normal firms in using DataGuide while TS2000 predicts 7 (50%) insolvent firms as normal firms out of 14 insolvent firms. In addition, comparing Altman (1968) Z-score using DataGuide and TS2000 shows significant different results statistically. 본 연구의 목적은 재무정보회사에서 제공하는 재무자료를 비교하여 오류 가능성을 알아보는 것이다. 분석을 위하여 첫째, 상장사협의회에서 제공하는 TS2000의 재무자료와 FnGuide에서 제공하는 DataGuide의 재무자료를 비교하여 재무자료의 오류 여부를 살펴보고 이 때 발생한 오류가 사소한 오류인지 혹은 오류의 범위가 큰 심각한 오류인지를 알아볼 것이며 오류가 통계적으로 유의한 차이가 있는가를 파악한다. 둘째, Altman(1968)이 제시한 도산예측모형에 DataGuide와 TS2000의 데이터를 이용한 기업의 파산예측결과가 일치하는가를 살펴본다. 또한 Altman(1968)이 제시한 Z-score를 측정하여 재무정보회사의 자료간의 Z-score의 일치여부를 알아볼 것이다. 이를 위하여 한국의 677개 비금융 상장기업의 2011년에서 2013년에 해당하는 3년간의 자료를 사용하여 TS2000과 DataGuide의 재무상태표, 손익계산서 및 주가자료로 구성된 자료를 비교하였다. 20310개의 데이터의 오류를 비교한 결과, 1194개(5.88%)가 불일치하는 것으로 나타났으며, 10개의 변수 중 5개 변수에서 통계적으로 유의한 차이를 발견하였다. 또한 Altman(1968)의 파산예측모형을 도입하여 재무정보회사에 따라 부실기업의 예측력에 대한 분석결과, DataGuide의 자료를 이용한 경우, 14개의 기업 중 10개를 부실기업으로 예측하였으며 TS2000의 자료를 이용한 경우, 14개중 9개로 나타났다. 또한 Z-score의 경우, DataGuide와 TS2000의 자료의 차이가 유의하게 다른 것으로 나타났다. 이상의 연구결과는 한국시장을 대상으로 재무정보회사에서 제공하는 재무자료의 오류를 분석함으로써 지금까지 미국을 대상으로 시행된 연구의 갭을 보완할 수 있었다. 한편, 재무정보회사가 제공하는 재무정보는 신뢰성 높은 데이터로 간주되고 있으나, 재무정보회사에서 제공하는 재무자료의 오류 수준을 공개함으로써 재무정보회사의 재무자료의 질을 높일 수 있는 기회가 될 것이다.

        • KCI등재

          한국기업의 대리인비용과 소유․지배구조 : 패널자료분석법에 의한 재벌기업과 비재벌기업 비교

          권정욱,김동욱,김병곤 한국자료분석학회 2011 Journal of the Korean Data Analysis Society Vol.13 No.4

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          This study analyzed the relationship between ownership structure and corporate governance and agency costs in the Korean firms. This paper used three different proxies which are the asset turnover ratio, the operating expense ratio, and the entertainment expense ratio for agency cost. The sample included the 4,317 non-financial companies that are listed in the Korea Exchange over the period from 2000 to 2008. We find that ownership structure and corporate governance affect on agency costs. Especially chaebol affiliate firms are affected by the size of board of directors for efficiency of asset utilization, and by the insider ownership and the ownership-control disparity for reduction of perquisite consumption. 본 연구는 한국기업을 대상으로 소유구조와 지배구조, 대리인비용의 관계를 분석하였다. 또한 한국기업의 특성을 반영하여 재벌기업과 비재벌기업으로 구분하여 비교분석하였다. 2000년부터 2008년까지의 9개년을 분석대상으로 하였으며, 한국거래소 유가증권시장에 상장되어 있는 총 4,317개 비금융업종 기업의 시계열・횡단면 자료를 통합한 불균형 패널자료를 사용하였다. 분석결과에 의하면 첫째, 한국의 기업들은 내부지분율이 증가하면 경영자와 주주의 이해가 일치하게 되어 대리인비용이 감소한다는 것을 알 수 있었다. 그러나 비재벌기업의 경우에는 내부지분율의 일정수준 이하 구간에서는 지분율 증가에 따라 경영자의 안주현상이 나타나 대리인비용은 증가하고, 내부지분율이 일정수준을 넘어서게 되면 경영자와 주주의 이해가 일치하게 되어 대리인비용이 감소하는 역U자형의 형태를 갖는 것으로 분석되었다. 둘째, 외국인지분율이 높아질수록 외국인투자자는 외부감시자의 역할을 하게 되어 자산운용의 효율성을 높이고, 접대비 비율을 낮춘다는 것을 알 수 있었다. 셋째, 이사회는 규모가 커질수록 경영진에 대한 감시기능이 강화되어 대리인비용을 낮추는 것으로 분석되었다. 넷째, 비재벌기업에서 사외이사비율이 높아질수록 경영진에 대한 감시기능이 강화되어 대리인비용이 낮아진다는 것을 알 수 있었다. 다섯째, 소유지배괴리도가 커질수록 지배권이 경영자의 경영권을 강화시키는 역할을 하여 대리인비용을 감소시키는 것으로 분석되었다.

        • KCI등재

          스캔통계량을 활용한 공간자료의 공간상관성 연구

          최빛나,박만식 한국자료분석학회 2017 Journal of the Korean Data Analysis Society Vol.19 No.3

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          The scan statistics method is an exploratory detection method of spatial clusters commonly used in the epidemiology research field for protecting against some infectious diseases. In this paper, we detect potential spatial clusters from spatially correlated lattice data when assuming the normal distribution for the measurements. We estimated the pooled sample variance at each monitoring station with a certain scanning window. We also examine the statistical significance of the variance at each location via the Monte-Carlo method in the spatial data where the measurement at a location is quite similar with those at its neighbors and its homogeneity decreases as the distance between the locations increases. The empirical p-values are obtained from the comparison of the variance from the raw data versus each of the simulated variances from randomly permutated data. Finally we realize that the scan statistics method can be applied for the detection of spatial clusters when we compare with the results from an iid random sample. For the real application, we considered the Meuse river dataset. 스캔통계학(scan statistics)이란 공간 군집(spatial cluster)을 탐색하는 한 방법으로, 특히 역학(epidemiology) 분야에서 특히 널리 쓰이는 방법론이다. 본 논문에서는 이러한 스캔통계량을 공간상관성(spatial correlation)이 내재된 정규분포를 가정한 격자자료(lattice data)에 적용하여 관측 공간 내에 존재하는 군집(cluster)을 탐색하고 임의의 관측지점에서의 스캐닝 윈도우(scanning window)에 대한 합동표본분산(pooled sample variance)을 계산하였다. 특정 지점의 측정값과 인접한 지점들의 측정값들이 매우 유사하고 지점들 간의 거리가 증가할수록 연관성이 감소한다는 자료의 특성을 지닌 격자자료에 대해 몬테카를로 방법(Monte-Carlo method)을 활용하여 각 관측지점에서의 합동표본분산에 대한 통계적 유의성(statistical significance)을 확인하였다. 이를 위해 원 자료로부터 임의 순열(random permutation)된 자료의 합동표본분산을 계산한 후 원 자료와의 비교를 통해 경험적 유의확률(empirical p-value)을 추정하였다. 또한 임의표본(random sample)자료의 결과를 비교함으로써 그리고 실증분석을 통해서도 공간상관성의 존재 여부를 파악하는 데 스캔통계량이 활용될 수 있음을 확인하였다.

        • KCI등재

          불균형 패널회귀모형에서의 이중 일반화 최대엔트로피 추정

          이재준,전수영 한국자료분석학회 2015 Journal of the Korean Data Analysis Society Vol.17 No.3

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          Recently Lee, Cheon (2014) proposed the generalized maximum entropy estimator in the balanced panel regression model. However, the majority of many studies dealing with the panel regression model are considering the unbalanced data. In addition, these data are practically often ill-posed data with the restriction on the generative processes of data rather than complete data. Since the statistical inference without consideration of these situations makes the conclusion incorrect, the form of data should be investigated sufficiently. This paper proposes a dual generalized maximum entropy (DGME) estimator for panel regression models of ill-posed data with unbalanced one-way error components based on a dual maximum entropy form using the unconstrained dual Lagrange multiplier method. DGME was compared with MLE and MINQUE through the real data analysis of Harrison Rubinfeld. The real data analysis shows that the proposed DGME estimator is the most reliable and efficient estimator. 최근에 균형 패널회귀모형에서의 일반화 최대엔트로피 추정량이 Lee, Cheon(2014)에 의해 제안되었다. 하지만, 패널회귀모형을 다루는 대부분의 많은 연구들에서 사용되고 있는 자료는 대부분 불균형 자료를 고려하고 있다. 또한, 실제적으로 이러한 자료들은 완전한 자료라기보다는 자료의 생성과정에 제한이 주어지는 불완전한 상태(ill-posed)의 자료가 많다. 이러한 상황을 고려하지 않고 통계적인 추론을 하게 되면 결론이 안정적이지 못하거나 잘못된 결론이 도출될 수 있으므로 자료의 형태를 충분히 고려해야 한다. 이에 본 연구는 불완전한 상태의 자료가 불균형 일원 오차성분을 가지는 패널회귀모형에서 Lee, Cheon(2014)이 제안한 추정방법을 확장하여, 제한조건이 없는 이중 라그랑지 배수 방법을 이용한 이중 최대엔트로피형식으로 부터 일반화 최대엔트로피 추정량을 제안한다. 본 연구에서 제안한 추정량의 효율성을 보기 위해 Harrison Rubinfeld의 실 자료 분석을 통하여 MLE와 MINQUE 등과 비교하였다. 실 자료 분석 결과, 이중 일반화 최대엔트로피 추정량이 가장 안정적이고 효율적인 추정량임을 보여주었다.

        • KCI등재

          불균형 자료의 분류분석 방법별 성능 비교와 접근 전략 연구

          유병주(Byung Joo Yoo) 한국자료분석학회 2021 Journal of the Korean Data Analysis Society Vol.23 No.1

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          불균형 자료에 대한 분류분석을 하기 위해서는 두 가지 선택의 문제에 직면하게 된다. 하나는 분류분석을 위한 모형의 선택이고 또 다른 하나는 불균형 문제를 해결하기 위한 방법의 선택이다. 그래서 이 논문에서는 훈련표본의 규모나 독립변수의 수, 불균형 정도 등과 같은 데이터의 특징을 고려한 불균형 자료에 대한 순차적인 접근 전략 문제를 다루었다. 이를 위해 이진 분류 분석의 대표적인 모형인 로지스틱 회귀모형, 서포트벡터 머신, 딥러닝 방법을 자료의 특성에 따른 분류 성능을 비교하기 위한 이론적 고찰과 모의실험을 시행하였다. 그리고 자료의 불균형을 해결하기 위한 개선 방법들과 조합했을 때 Tukey의 다중비교를 통하여 분류 성능이 좋은 최적의 결과를 얻기 위한 접근 전략을 식별하기 위한 모의실험을 하였다. 모의실험 결과 자료의 특성중 훈련표본의 수량과 불균형 여부가 지배적인 요소로 작동되는 것을 확인할 수 있었으며, 훈련 표본이 적은 경우는 로지스틱 회귀모형으로 접근하여 과대추출 방법으로 자료의 불균형 문제를 해결하는 방법이 좋고, 훈련표본이 많은 경우는 딥러닝 방법으로 접근하여 가중치 방법이나 과소추출 방법으로 자료의 불균형을 개선하는 방법이 성능이 우수한 추정 결과를 얻을 수 있는 접근 전략임을 확인하였다. In order to perform a classification analysis on imbalanced data, we are faced with two choices. One is the selection of a model for classification analysis, and the other is the selection of a method to solve the imbalance problem. Therefore, in this paper, I dealt with the problem of sequential approach to imbalanced data, taking into account the characteristics of the data such as the size of the training sample, the number of independent variables, and the degree of imbalance. A simulation is conducted to compare the logistic regression model, support vector machine, and deep learning, which are representative models used for binary classification analysis, to compare the classification performance according to the characteristics of the data. In addition, a simulation was performed to identify the approach strategy for obtaining the optimal result with good classification performance through Tukey s multiple comparison when combined with the methods to resolve the imbalance problem. As a result of the simulation, it was confirmed that the number of acquired samples and the presence of imbalance among the characteristics of the data operate as the dominant factors. In the case of small data, the logistic regression model is the best when combine with the over-sampling method to solve the data imbalance problem. In the case of big data, it was confirmed that the deep learning is the best when combine with the weighed estimation or the under sampling method to resolve the data imbalance problem.

        • KCI등재

          통신사별 휴대폰 이용금액에 미치는 미디어 패널 요인 분석

          전수영 한국자료분석학회 2018 Journal of the Korean Data Analysis Society Vol.20 No.4

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          As the use of smart phones expands rapidly, and the service transfer from 3G to 4G is also accelerated, the revenue of mobile phone continues to increase. We need to consider media panel data affecting the revenue. The data used in most studies considers complete data. However, in reality many data are not complete data with limitations on the process of data generation and multi-collinearity, so statistical inference can be drawn incorrect conclusions. Recently, a dual generalized maximum entropy (DGME) estimator has been proposed by Lee, Cheon (2017) to analyze incomplete data in a panel regression model. This study analyzes the panel data for 2011-2017 by DGME when the data is incomplete, and finds out how media usage time affects monthly average mobile phone revenue by telecommunication companies and regions. The results show that talk, chat/messenger, SNS, TV real time, movie/video and game usage time affect positively mobile phone revenue, but others affect negatively. This is because around 2013 users switched from regular phones to smart phones, the usage patterns of users' data-intensive apps are affecting the data-centric plans. 스마트폰 사용이 급격히 확산되고 동시에 3G에서 4G로의 서비스 전이 역시 급속히 이루어지면서 휴대폰 이용금액이 계속 증가하고 있어 이용금액에 영향을 미칠 수 있는 다양한 미디어 패널자료를 살펴볼 필요성이 대두되고 있다. 미디어 패널자료를 다루는 대부분의 연구들에서 사용되고 있는 자료는 완전한 자료를 고려하고 있다. 그러나 실제 많은 자료들은 완전한 자료라기보다는 자료의 생성과정에 제한이 주어져 다중 공선성 등이 생기는 불완전한 상태의 자료가 많아 잘못된 추론이 도출될 수 있다. 최근에 패널회귀모형에서 불완전한 상태의 자료를 분석하기 위해 이중 일반화 최대엔트로피 추정량이 Lee, Cheon(2017)에 의해 제안되었다. 본 연구는 자료가 불완전한 상태인 경우에 효율적인 이중 일반화 최대엔트로피 추정량을 이용하여 2011년–2017년 기간 동안의 패널 자료를 분석하여 미디어 이용시간이 통신사별·지역별 월 평균 휴대폰 이용금액에 미치는 영향을 알아보고자 한다. 통신사와 지역을 고려한 패널회귀모형의 분석 결과, 통화·채팅/메신저·SNS·TV 실시간·영화/동영상·게임 이용시간은 통신사의 휴대폰 이용금액에 양의 영향을 주고, 문자·이메일·TV 다시보기·음악청취 이용시간은 음의 영향을 주는 것으로 나타났다. 이는 일반폰에서 스마트폰으로의 교체가 일어난 2013년 전후로 사용자들의 데이터를 많이 사용하는 앱의 이용형태가 통신사의 데이터 중심의 요금제에 영향을 미치고 있음을 알 수 있다.

        • KCI등재

          공간 점 패턴 자료에 대한 공간분석

          최승배(Seung Bae Choi), 김규곤(Kyu Kon Kim) 한국자료분석학회 2000 Journal of the Korean Data Analysis Society Vol.2 No.2

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          공간 점 패턴(SPP: Spatial Point Patterns) 자료는 공간 위치 그 자체가 관심의 변수인 경우에 얻어지는 자료로서 유한한 공간 지역 내에 불규칙적으로 위치한 점들의 집합이다. SPP 자료에 대한 공간분석은 주로 점 분포 패턴(point distribution pattern)을 기술하기 위해서 행해진다. 본 논문의 목적은 자료 분석적인 차원에서 실제 자료에 대한 점 분포 패턴을 기술하고, 자료의 수가 많은 경우 공간 구조를 명확히 하기 위한 자료 그룹화 및 차원축소 기법인 육각형 상자(hexagonal binning) 기법을 적용하여 분석 결과를 해석하는 것이다. 이를 위해서 일본에서 발생된 2개의 지진 자료를 이용한 실제 예가 고려된다. Spatial point patterns data arise when locations themselves are the variable of interest. Spatial point patterns consist of a finite number of locations observed in a spatial region. Spatial point patterns analysis is mainly conducted to describe point distribution pattern. The aims of this article are to describe point distribution pattern by using a real data and to analysis the spatial point patterns data by applying hexagonal binning as a data grouping or reduction method in case there are a large data. To do this, the two data sets for earthquake occurred in Japan are considered.

        • KCI등재

          스캐너 자료에서 거래량에 관한 가격 변화율 분산의 동질성 검정

          이성임,김영래,임요한 한국자료분석학회 2021 Journal of the Korean Data Analysis Society Vol.23 No.2

          Many national statistical institutions are recently actively researching to calculate various statistical indices, such as the consumer price index, using scanner data containing retail store transaction information. In general, critical national policies are affected by these statistics. If outliers are not detected, and various indices are incorrect, it will cause great confusion. Therefore, the detection of outliers in scanner data becomes crucial research. However, popular methods for conducting such outlier detection are based only on price changes and not on any of the other covariates (e.g., sales volume or types of retail shops) available from scanner data. Kim et al. (2020) proposed a new outlier detection method using the variance of the price change rate depending on the sales volume. However, there was no rigorous discussion on whether the price change rate variance depends on the sales volume. Therefore, in this study, we devised a permutation test procedure for testing the homogeneity of the price change rate variance for the sales volume. It also applied to the scanner data collected by the Korea Chamber of Commerce and Industry to test whether the transaction price variance depends on the transaction volume. 최근 많은 국가통계기관에서 소매점의 거래 정보를 담은 스캐너 자료 (scanner data)를 활용하여 소비자물가지수와 같은 다양한 통계 지수를 산출하는 연구를 활발하게 하고 있다. 일반적으로 이러한 통계 수치들은 국가의 정책을 결정하는 데 중요한 정보를 제공하기 때문에, 만약 자료의 이상점을 탐지하지 못해 각종 지수를 잘못 산정한다면 큰 혼란을 야기하게 된다. 따라서, 스캐너 자료의 이상점 탐지는 매우 중요한 연구주제 중 하나이다. 기존에는 스캐너 자료에 대한 이상점을 탐지하기 위해서 가격변화율의 정보만 사용하였는데, 스캐너 자료는 가격변화율 이외에도 판매량이나 소매점 형태 등에 관한 다양한 정보를 포함하고 있다. 이에 Kim et al.(2020)은 스캐너 자료에 대한 이상점 탐지방법으로 다른 정보를 활용할 수 있는 새로운 방법을 제안하였다. 즉, 품목의 거래량을 공변량으로 하여 가격 변화율의 분산을 추정하고, 이를 이용하여 이상점을 탐지하는 방법을 제안하였다. 하지만 실제로 가격 변화율의 분산이 거래량에 따라 달라진다는 가정이 성립하는가에 대한 엄밀한 논의가 없어, 본 연구에서는 순열검정 절차를 고안하여 거래량에 관한 가격변화율 분산의 동질성을 검정할 수 있는 간단한 절차를 제안하였다. 또한, 대한상공회의소에서 수집한 스캐너 자료에 적용해 실제로 거래 가격 분산이 거래량에 따라 달라지는지 적용해 보았다.

        • KCI등재

          반복자료에 대한 Proc Mixed의 이용에 관한 소고

          김호일(Hoil Kim) 한국자료분석학회 2005 Journal of the Korean Data Analysis Society Vol.7 No.6

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

          개체에 대해 반복하여 측정된 자료는 개인, 동물과 같은 실험대상에서 얻어질 수가 있다. 이런 실험 단위를 개체라 하고 각 개체 내에 시간의 변화에 따른 반복 측정되는 자료를 추적자료라고도 한다. 이 반복 측정된 자료의 분석은 일반선형회귀분석과 혼합모형분석에서 가능하다. 특히 반복 측정된 모형의 경우의 혼합모형분석은 사회과학의 경우와 유사하게 각 개인이 집락형태의 자료가 될 수 있고 그 개인에 대한 시간대별 자료가 사회과학의 경우 예에서 학생이나 환자가 될 수 가 있다. 반복 측정된 자료분석은 자기회귀나 Toeplitz 공분산구조와 같은 다양한 공분산구조와 관련된 분석에 사용될 수 있다. 본 논문은 4가지 모형에 대한 8가지 방법에 대해서 공분산행렬을 추정, 비교하였다. The analysis of repeated measures involve data which consist of multiple measurements on experimental units such as individual, animal or machines. These experimental units are called subjects. This paper focuses on longitudinal data in which the repeated measurement on a subject occur over time. The SAS MIXED procedure employs a more general structure approach. This paper compare the 4 models and 8 covariance structures.

        맨 위로 스크롤 이동