RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        2020년 장애인 경제활동 실태조사 표본설계 사례연구

        박민규(Mingue Park),김태영(Taeyoung Kim),임요한(Yo-Han Lim) 한국자료분석학회 2021 Journal of the Korean Data Analysis Society Vol.23 No.4

        표본조사 분야에서 효율적인 표본설계와 추정을 위한 보조정보의 수집 및 활용은 필수적이다. 일반적으로 추출틀에 포함된 보조정보는 구체적이며, 따라서, 표본설계를 위하여 사용되고, 국내 거주 인구 규모나 가구 규모와 같은 모집단의 특성을 나타내는 보조정보는 추정량의 효율성을 높이기 위하여 흔히 사용된다. 이상추출법은 이러한 보조정보가 존재하지 않을 경우에 사용할 수 있는 매우 효과적인 표본설계 방안으로, 일상에서는 대규모의 표본을 추출하여 보조정보를 수집하고, 이상에서는 수집된 보조정보를 활용하여 상대적으로 적은 규모의 표본을 추출하여 추정을 수행하는 통계적인 방법이다. 본 연구에서는 이상추출법을 활용하여 주어진 현실적인 제약하에서 최적의 표본을 추출하는 사례를 소개하였다. 전국에 흩어져 있는 장애인 모집단으로부터 효율적이며 수행 가능한 조사를 위한 표본을 추출하기 위하여 일상에서는 읍면동을, 그리고 이상에서는 장애인을 추출하는 방안이 고려되었다. 이를 위해 장애인 추출틀로부터 계산된 층화 및 표본 배분 방안이 일상에서 읍면동 추출을 위한 표본설계에 활용되는 방안이 제안되었었다. 본 사례 연구는 보조정보 수집이라는 전통적인 이상추출법의 사용 목적 이외에도 다양한 목적으로 이상추출법이 활용될 수 있음을 보여주고 있다. In survey sampling, auxiliary information is often used to select a representative sample and to define an efficient estimator. In general, the information given in sampling frame is used to select a sample but population summaries such as the size of population residents or households are used to define an estimator. Two-phase sampling is an applicable sampling design when useful auxiliary information is absent. To select a two-phase sample, a large scale sample is selected in the first phase, and auxiliary information is obtained. In the second phase, a relatively small sample is selected using the information obtained in the first phase. We propose an example in which an optimal sample is selected using a two-phase sampling design under the practical restriction. Two-phase sampling, for which a sample of up·myun·dong is selected in the first phase and a sample of disabled people is selected in the second phase, is considered to execute an efficient survey in person for disabled people reside over nationwide. To achieve this purpose, a method to get the necessary up·myun·dong sample size and allocation method from the distribution of disabled population is introduced. The example considered in this case study shows a possible extension of the use of a two-phase sampling design.

      • KCI등재

        층화표본에서의 표본 배분에 대한 연구

        이인규,박민규,Lee, Ingue,Park, Mingue 한국통계학회 2015 응용통계연구 Vol.28 No.6

        층화표본추출(stratified sampling)은 모집단을 구성하는 층에 대한 정보를 표본설계에 반영함으로써 추정량의 분산을 낮추기 위한 표본추출 방법으로, 표본배분 방안의 선택이 층화표본의 효과를 결정하는데 매우 중요한 요소이다. 전통적인 표본배분 방법으로는 비례배분법(proportional allocation)과 네이만배분법(Neyman alloction)이 주로 사용되는데, 이는 층별 추정량의 분산에 영향을 미치는 요인들을 표본 배분에 반영함으로써 전체 추정량의 분산을 최적화하기 위한 것이다. 이론적으로는 층크기(size of strata)만을 반영하는 비례배분법보다 층별 표준편차(standard deviation)를 함께 고려하는 네이만배분법이 추정량의 분산을 낮추는데 더 효과적임이 알려져 있다. 그러나 층별 표준편차에 대한 사전 정보가 모집단을 잘 반영하지 못하면 네이만배분법의 효과를 기대할 수 없으며, 특히 복수의 관심변수를 조사하는 다목적조사(multi-purpose survey)에서는 각 관심변수들의 층별 표준편차가 서로 다른 양상을 나타내기 때문에 네이만배분법이 적합하지 않다는 주장이 제기되기도 한다. 한편 표본조사에서는 조사단계에서 발생하는 무응답으로 인한 추정량의 편향을 제거하기 위해 응답률 보정 방법이 사용되는데, 이 또한 추정량의 분산에 영향을 미치는 주요한 요인 중에 하나이다. 그러나 전통적인 표본배분 방법은 응답률(response rate)을 감안하지 않기 때문에 층별 응답율에 차이가 크게 나타날 경우 층화표본에 의한 효과가 저하될 수 있다. 이에 본 연구는 층화표본추출에서 층간 응답률의 차이가 추정량의 분산에 미치는 영향을 살펴보고, 층별 응답률 정보를 표본설계에 반영하는 새로운 표본배분 방법을 제안하였다. 모의실험을 통해 확인한 결과 네이만배분법은 당초 표본배분 시에 적용한 층별 표준편차의 구조가 각 층의 응답률 보정과정에서 증가하는 분산을 반영하지 못하기 때문에 층간 응답률의 편차가 커질수록 효율이 저하되는 것으로 나타났다. 반면 층 크기와 층별 응답률을 함께 반영한 배분방법은 비례배분법에 비해 효율이 개선되며, 층간 응답률의 편차가 클수록 그 효과는 커진다. 특히 층별 응답률의 변동계수(coefficient of variance)가 층별 표준편차의 변동계수를 상회하는 경우는 네이만배분법 보다도 효율적인 추정량을 제공함을 확인하였다. 아울러 응답률을 반영한 배분방법은 기존 배분방법에 비해 각 층별 추정량을 보다 안정적으로 추정할 수 있기 때문에 층별 추정을 목적으로 하는 층화표본조사에서는 여타 추정방법보다 더 효과적이다. 층별 응답률에 대한 정보는 관심변수가 다르더라도 추출틀이 유사한 기존 조사의 결과를 활용할 수 있다는 점에서 표준편차에 비해 비교적 정보 수집이 용이한 장점이 있고, 다목적조사에서도 관심변수의 척도(scale)나 개수와 관계없이 적용 가능하기 때문에 활용도가 높을 것으로 생각된다. Stratified random sampling is a powerful sampling strategy to reduce variance of the estimators by incorporating useful auxiliary information to stratify the population. Sample allocation is the one of the important decisions in selecting a stratified random sample. There are two common methods, the proportional allocation and Neyman allocation if we could assume data collection cost for different observation units equal. Theoretically, Neyman allocation considering the size and standard deviation of each stratum, is known to be more effective than proportional allocation which incorporates only stratum size information. However, if the information on the standard deviation is inaccurate, the performance of Neyman allocation is in doubt. It has been pointed out that Neyman allocation is not suitable for multi-purpose sample survey that requires the estimation of several characteristics. In addition to sampling error, non-response error is another factor to evaluate sampling strategy that affects the statistical precision of the estimator. We propose new sample allocation methods using the available information about stratum response rates at the designing stage to improve stratified random sampling. The proposed methods are efficient when response rates differ considerably among strata. In particular, the method using population sizes and response rates improves the Neyman allocation in multi-purpose sample survey.

      • KCI등재

        중도탈락 후보 지지층과 응답유보층 보정을 통한 선거결과 예측

        김정경 ( Jeong-kyung Kim ),박민규 ( Mingue Park ) 한국조사연구학회 2023 조사연구 Vol.24 No.2

        본 연구에서는 NBS 선거여론조사 결과를 활용하여 2022년 3월에 실시한 20대 대통령선거의 당선자를 예측하는 통계적 방안을 살펴보았다. 20대 대통령선거의 경우 투표일 1주일 전까지 지지 gnqh자를 결정하지 못한 응답유보자가 약 20%에 달하였으며, 선거일 직전에 안철수 후보의 사퇴가 있었던 점을 고려하여 응답유보자와 안철수 후보 지지자를 지도학습 방법을 통해 분류한 후각 후보의 득표율을 예측하였다. 지도학습 도구로는 로지스틱 회귀분석, 의사결정나무 그리고 랜덤포레스트 방안을 고려하였다. 득표율의 예측에 있어서는 랜덤포레스트 방안이 가장 좋은 성능을 보였으며, 모든 방안이 1, 2위 후보자 득표율의 비율을 유사하게 예측하였다. 선거일에 가까울수록 예측의 정확도는 대체로 높아졌으나, 응답률이 상대적으로 낮았던 시점의 예측오차는 매우 크게 나타났다. 여론조사 공표보도 금지기간이 해제되어 투표일 직전 자료를 활용한 응답유보자 분류가 가능하다면 선거여론조사를 활용한 득표율 예측은 더욱 정교해질 것으로 기대된다. This study examines a statistical plan to predict the winners of the 20th presidential election held in March 2022 using the results of the NBS election poll. About 20% of respondents in the 20th presidential election could not decide their supporters until a week before the voting date. Considering that Ahn Cheol Soo resigned just before the election day, the percentage of votes for each candidate was predicted after classifying them through supervised learning. The supervised learning tools considered were logistic regression analysis, decision tree, and random forest measures. The Random Forest method showed the best performance in predicting the vote rate, and all measures similarly predicted the ratio of the vote rate of the first and second candidates. The accuracy of the prediction increased as the election date approached, but the prediction error at the time when the response rate was relatively low was very large. If the prohibition period for reporting public opinion polls is lifted and thus it is possible to classify respondents using data just before the voting day, the prediction of the vote rate using election polls is expected to be more sophisticated.

      • KCI등재

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼