RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        상호정보 추정을 위한 k-최근접이웃 기반방법

        차운옥,허문열,Cha, Woon-Ock,Huh, Moon-Yul 한국통계학회 2008 Communications for statistical applications and me Vol.15 No.6

        본 논문에서는 연속형 변수에 대한 결합확률분포를 추정하지 않고도 상호정보(MI) 추정량을 구할 수 있는 k-최근접이웃 기반방법에 대하여 연구하였다. 변수가 동일한 값들을 가지는 경우 k-최근접이웃을 구할 때 생기는 문제점을 해결하기 위하여 지터링(jittering)과 붓스트랩(bootstrap) 방법을 제안하였다. 몬테칼로 모의실험과 실제 데이터에 대한 실험을 수행한 결과, k=1과 같이 작은 값을 사용한 k-최근접이웃 기반방법에 의해 효율적인 MI 추정량을 구할 수 있었다. k-최근접이웃 기반방법은 연속형 설명변수, 범주형 또는 연속형인 목적변수 형태의 데이터에 적용할 수 있으며, 목적변수에 영향을 주는 중요한 설명변수의 순서를 구할 수 있을 뿐만 아니라 다차원에도 적용할 수 있기 때문에 중요변수의 집합을 구하는 변수 선택(feature subset selection) 문제에도 적용할 수 있다. This study is about the k-nearest neighbor-based approach for the estimation of mutual information when the type of target variable is categorical and continuous. The results of Monte-Carlo simulation and experiments with real-world data show that k=1 is preferable. In practical application with real world data, our study shows that jittering and bootstrapping is needed.

      • KCI등재

        선 모자이크 도표를 이용한 동적 그래픽스

        차운옥,이경미,최병수,Cha, Woon-Ock,Lee, Kyung-Mi,Choi, Byong-Su 한국통계학회 2010 Communications for statistical applications and me Vol.17 No.2

        본 논문에서는 이산형과 연속형 데이터가 혼합되어 있는 데이터 구조를 탐색하기 위하여 동적 기법을 사용하였다. 이산형 변수들간의 관계를 표현하는 선 모자이크 도표와 연속형 변수들의 관계를 위한 산점도, 일변량 변수 관점에서의 데이터의 분포를 파악할 수 있는 상자도표를 동시에 사용하면서, 동적인 기법들을 적용하여 다차원 데이터에 대한 구조를 좀 더 쉽게 파악할 수 있음을 보였다. This study is about the dynamic graphics which can be used for the exploration of the characteristics of data comprising discrete and continuous variables. Simultaneously using line mosaic plot for the relation of discrete variables and box plot together with scatter plot for the relation of continuous variables, we have applied dynamic methods among these plots to demonstrate that the structure and characteristics of the multivariate data could be easily analyzed.

      • KCI등재
      • KCI등재
      • KCI등재

        SAMPLE-SPACING 방법에 의한 상호정보의 추정

        허문열,차운옥,Huh, Moon-Yul,Cha, Woon-Ock 한국통계학회 2008 응용통계연구 Vol.21 No.2

        상호정보(mutual information: MI)는 설명변수의 목적변수에 대한 예측정도를 나타내는 척도로서, 목적변수에 대한 설명 변수의 중요도 순위를 구하거나 목적 변수를 잘 설명해주는 설명변수의 집합을 구하는 변수선택문제에 유용하게 사용된다. 본 논문에서는 연속형 설명변수와 범주형 목적변수로 구성된 데이터로부터 결합확률분포를 추정하지 않고도 MI 추정량을 구할 수 있는 Sample-spacing 방법에 대한 연구를 수행하였다. 몬테 칼로 모의 실험과 실제데이터에 대한 실험결과, MI 추정을 위해 Sample-spacing 방법을 사용할 때 m = 1을 사용하면 충분히 신뢰할만한 결과를 얻을 수 있다는 것을 알 수 있었다. Mutual information is a measure of association of explanatory variable for predicting target variable. It is used for variable ranking and variable subset selection. This study is about the Sample-spacing approach which can be used for the estimation of mutual information from data consisting of continuous explanation variables and categorical target variable without estimating a joint probability density function. The results of Monte-Carlo simulation and experiments with real-world data show that m = 1 is preferable in using Sample-spacing.

      • KCI등재

        데이터마이닝을 위한 동적 결정나무

        최병수,차운옥,Choi, Byong-Su,Cha, Woon-Ock 한국통계학회 2009 Communications for statistical applications and me Vol.16 No.6

        결정나무는 데이터마이닝에서 데이터를 분류하는 기법으로 가장 많이 사용되고 있으며, 데이터 탐색 소프트웨어 DAVIS에서는 동적 기능을 사용하여 데이터 시각화를 하는 것이 가능하다. 본 논문에서는 동적 데이터 분석의 기본 원리와 이를 결정나무에 적용하는 방법을 소개하고, 생성되는 동적 결정나무의 효율성과 유용성을 실제 데이터를 사용하여 분석한다. Decision tree is a typical tool for data classification. This tool is implemented in DAVIS (Huh and Song, 2002). All the visualization tools and statistical clustering tools implemented in DAVIS can communicate with the decision tree. This paper presents methods to apply data visualization techniques to the decision tree using a real data set.

      • KCI등재

        정보이론과 시각화 방법에 의한 여론조사 분석의 새로운 접근방법

        허문열,차운옥,Huh, Moon-Yul,Cha, Woon-Ock 한국통계학회 2007 응용통계연구 Vol.20 No.1

        본 논문에서는 상호정보와 데이터 시각화를 사용하여 여론조사 결과를 분석하는 방법을 제안하였다. 여론조사의 경우, 목적 변수와 이를 위한 설명 변수가 있으며 설명 변수는 수치형과 명목형이 혼재된 형태이다. 상호정보를 사용하면 목적변수에 대한 혼합형 설명변수의 영향을 크기순으로 순위를 매길 수 있고, 데이터 시각화 방법을 사용하여 이들 순위 매김에 대한 평가를 수행할 수 있다. 여론조사에서 목적변수에 미치는 설명변수의 영향력의 크기가 어느 정도인가를 정량화한 것은 이연구에 의해서만 이루어진 것이다. A method for poll analysis using information theory and data visualization is proposed in this paper. Questions of opinion poll consist of a target variable and many explanation variables. The type of explanation variables is either numerical or categorical. In this study, explanation variables of mixed types have been ranked according to the magnitude of their effect on target variable by using mutual information. Likewise, the order of explanation variables has been evaluated using data visualization. This is the first study to quantify the impact of specific explanation variable on the related target variable.

      • KCI등재

        데이터 마이닝을 위한 이산화 알고리즘에 대한 비교 연구

        최병수,김현지,차운옥,Choi, Byong-Su,Kim, Hyun-Ji,Cha, Woon-Ock 한국통계학회 2011 Communications for statistical applications and me Vol.18 No.1

        이산화는 데이터 마이닝을 위한 전처리 과정으로서 연속형 변수를 이산형 변수로 바꾸는 과정이고, 이산화 시킨 데이터가 원래 가지고 있던 정보손실을 최소로 하면서 높은 분류정확도를 가지는 것을 목적으로 한다. 지금까지 많은 이산화 알고리즘이 제안되었는데, 본 논문에서는 분할 이산화와 병합 이산화의 관점에서 최근까지 제안된 대표적인 이산화 알고리즘들을 비교하고, 이산화 알고리즘이 가지고 있는 특성을 연구하였다. 또한 비교 연구한 이산화 알고리즘을 R코드로 작성하여 다른 연구에 사용할 수 있도록 하였다. The discretization process that converts continuous attributes into discrete ones is a preprocessing step in data mining such as classification. Some classification algorithms can handle only discrete attributes. The purpose of discretization is to obtain discretized data without losing the information for the original data and to obtain a high predictive accuracy when discretized data are used in classification. Many discretization algorithms have been developed. This paper presents the results of our comparative study on recently proposed representative discretization algorithms from the view point of splitting versus merging and supervised versus unsupervised. We implemented R codes for discretization algorithms and made them available for public users.

      • OpenCV와 컬러인식을 이용한 교육용 인터랙티브 게임의 구현

        김주희(Ju-hee Kim),심소영(So-young Shim),오병진(Byung-jin Oh),이정아(Jung-a Lee),최혜원(Hye-won Choi),차운옥(Woon-ock Cha) 한국멀티미디어학회 2006 한국멀티미디어학회 학술발표논문집 Vol.2006 No.2

        본 논문은 OpenCV와 컬러인식을 이용한 언어교육용 액션 게임의 구현에 관한 것이다. 본 게임에서는 사용자가 화면에 출력된 자신의 모습을 보며 장갑을 이용해서 동적으로 이벤트를 발생시킨다. 동적인 행동 양식을 보이기 위해, OpenCV 라이브러리의 영상입력을 기반으로 C언어를 이용하여 특정 컬러 검출, 인체와 배경의 합성, 객체의 투영을 구현하였다. 새로운 이벤트 방식을 사용하므로 사용자의 흥미와 참여도를 최대한으로 높여 좋은 교육 효과를 볼 수 있기 때문에 교육용 인터랙티브 게임의 수준을 한 단계 높였다고 할 수 있다.

      • 러프집합이론에 의한 의료데이터베이스로부터의 지식발견

        차운옥 성균관대학교 응용통계연구소 1999 통계연구 Vol.7 No.-

        불완전하고 부정확한 데이터를 포함하고 있는 의료데이터베이스로부터 러프집합 이론에 의한 지식발견 방법을 적용하여 특정한 질병의 진단규칙을 자동으로 도출해 내었다. 생성된 규칙의 성능을 평가하기 위하여 Confusion 행렬을 구하였으며, 러프집합 이론에 근거한 방법은 의료데이테베이스가 가지고 있는 문제점을 해결할 수 있어서 의료데이터베이스로부터 지식을 추출해내는 지식발견시스템이 갖추어야 할 조건을 모두 만족함을 보였다. Knowledge discovery method based on rough set theory has been applied to medical databases which contain incomplete and imprecise data. Medical diagnostic knowledge can be automatically derived in the form of decision rules. Confusion matrices have been used to evaluate the performance of rules. This paper shows that all the specific requirements for the medical knowledge discovery system are satisfied by rough set based method.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼