RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      클래스 불균형 데이터 분류를 위한 군집화 기반 언더샘플링 기법

      한글로보기

      https://www.riss.kr/link?id=A103692649

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      데이터 불균형 문제는 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극단적으로 많거나 적을 때 발생하며, 기계 학습 알고리즘을 통해 학습한 분류기의 성능을 저하시킨다. 본 논문에서는 이 문제를 해결하기 위해 k-대푯값 (k-Medoids) 알고리즘을 사용하여 극단적으로 많은 데이터를 가진 다수 범주의 데이터를 군집화한다. 이후, 소수 범주에 가까운 대푯값에 가중치를 주어 추출될 확률을 높이는 거리 가중(Distance Weighting) 추출 방법을 사용하여 대푯값을 반복적으로 복원 추출함으로써 다수의 균형 데이터를 생성한다. 생성된 각각의 균형 데이터를 사용해 다수의 분류기를 학습시키고 앙상블(Ensemble) 기법 중 배깅(Bagging, Bootstrap Aggregating)을 사용하여 생성된 다수의 분류기 결과들을 종합, 최종 분류를 진행하는 방법을 제안한다. 또한, 실제 데이터를 이용한 실험을 통해 제안 기법이 기존 기법들보다 우수한 성능을 보임을 검증한다.
      번역하기

      데이터 불균형 문제는 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극단적으로 많거나 적을 때 발생하며, 기계 학습 알고리즘을 통해 학습한 분류기의 성능을 저하시킨...

      데이터 불균형 문제는 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극단적으로 많거나 적을 때 발생하며, 기계 학습 알고리즘을 통해 학습한 분류기의 성능을 저하시킨다. 본 논문에서는 이 문제를 해결하기 위해 k-대푯값 (k-Medoids) 알고리즘을 사용하여 극단적으로 많은 데이터를 가진 다수 범주의 데이터를 군집화한다. 이후, 소수 범주에 가까운 대푯값에 가중치를 주어 추출될 확률을 높이는 거리 가중(Distance Weighting) 추출 방법을 사용하여 대푯값을 반복적으로 복원 추출함으로써 다수의 균형 데이터를 생성한다. 생성된 각각의 균형 데이터를 사용해 다수의 분류기를 학습시키고 앙상블(Ensemble) 기법 중 배깅(Bagging, Bootstrap Aggregating)을 사용하여 생성된 다수의 분류기 결과들을 종합, 최종 분류를 진행하는 방법을 제안한다. 또한, 실제 데이터를 이용한 실험을 통해 제안 기법이 기존 기법들보다 우수한 성능을 보임을 검증한다.

      더보기

      목차 (Table of Contents)

      • Abstract
      • 1. 서론
      • 2. k-대푯값 (k-Medoids) 알고리즘
      • 3. 제안하는 기법
      • 4. 실험
      • Abstract
      • 1. 서론
      • 2. k-대푯값 (k-Medoids) 알고리즘
      • 3. 제안하는 기법
      • 4. 실험
      • 5. 결론
      • 7. 참고문헌
      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼