분류는 데이터 마이닝에서 가장 보편적인 작업이라고 할 수 있는데, 분류라는 것은 어떤 새로운 사물이나 대상의 특징을 파악하여 미리 정의되어 있는 분류코드에 따라 어느 한 범주에 할당...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T13125414
천안 : 호서대학교 대학원, 2013
학위논문(석사)-- 호서대학교 대학원 : 정보통계학과 2013. 2
2013
한국어
충청남도
32 p. ; 26cm
지도교수:강현철
0
상세조회0
다운로드국문 초록 (Abstract)
분류는 데이터 마이닝에서 가장 보편적인 작업이라고 할 수 있는데, 분류라는 것은 어떤 새로운 사물이나 대상의 특징을 파악하여 미리 정의되어 있는 분류코드에 따라 어느 한 범주에 할당...
분류는 데이터 마이닝에서 가장 보편적인 작업이라고 할 수 있는데, 분류라는 것은 어떤 새로운 사물이나 대상의 특징을 파악하여 미리 정의되어 있는 분류코드에 따라 어느 한 범주에 할당하거나 나누는 것을 의미한다. 이러한 통계적 의사결정 문제에서 특정 클래스를 할당하기에 애매한 관측치에 대하여 최종 의사결정을 보류하는 것은 매우 직관적이면서도 유용한 방법으로, 최근 판정보류 옵션을 가진 분류문제는 Bartlett & Wegkamp(2008)에 의해 기계학습 분야에 재조명 받고 있다. 판정 보류 옵션을 가진 분류문제는 기존의 분류규칙에 판정보류를 추가적으로 고려한 분류규칙을 의미한다. 판정보류 옵션을 가진 분류규칙은 분류를 엄밀히 하기 힘든 자료에 유용하다고 알려져 있으며, 이상점 탐지(outlier detection)에도 기존의 분류규칙보다 우수한 성능을 보이는 것으로 보고되고 있다. 한편 분류문제에서 목적변수와 강한 연관성을 가지고 있는 설명변수들은 그렇지 않은 변수들보다 보다 나은 정확도를 도출해줄 가능성이 클 것으로 짐작될 것이다. 따라서 변수 선택방법과 판정보류 옵션을 동시에 적용하여 분류성능을 향상시키고자 한다.
본 논문의 구성은 로지스틱 회귀분석, 변수선택을 적용한 로지스틱 회귀분석, 판정보류 옵션을 적용한 로지스틱 회귀분석, 변수선택 방법과 판정보류 옵션을 적용한 로지스틱 회귀모형에 대하여 기술하고, 실제 자료를 통해 기존에 제안된 방법들과 변수선택과 판정보류 옵션을 적용한 로지스틱 회귀모형의 주요 결과들을 비교하고자 한다.
목차 (Table of Contents)