RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      고차원 및 혼합형 데이터의 클래스 불균형을 위한 k-최근접 이웃 기반 오버샘플링

      한글로보기

      https://www.riss.kr/link?id=A109597868

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      머신러닝에서 클래스 불균형 문제는 데이터의 클래스 간 샘플 수가 불균형하여 모델 성능을 저하시킬 수 있다. 이를 위해 Synthetic Minority Oversampling Technique (SMOTE)와 같은 리샘플링 기법이 널리 연구되었지만, 여전히 클래스 중첩 영역 문제, 고차원 및 혼합형 데이터 등 다양한 클래스 불균형 시나리오에서는 한계를 보인다. 본 논문에서는 이러한 한계를 극복하기 위해 고차원 및 혼합형 데이터를 효과적으로 처리하는 새로운 오버샘플링 알고리즘인 k-Nearest Neighbor Oversampling with Weighted Heterogeneous Euclidean Entropy Metric (KNNOR_WHEEM)을 제안한다. 이는 유용한 샘플 선택, 샘플 합성, 합성 샘플 검증의 세 단계로 구성된다. KNNOR_WHEEM은 피처 간 중요도를 반영한 거리 메트릭과 피처 유형 별 샘플 합성 방식을 이용하여 고차원 및 혼합형 데이터의 클래스 불균형 문제를 효과적으로 다룬다. 제안한 알고리즘의 성능을 평가하기 위해 다양한 데이터를 이용해 실험을 진행하였고, 특히 F1-score 측면에서 우수한 성능을 보임을 확인할 수 있었다.
      번역하기

      머신러닝에서 클래스 불균형 문제는 데이터의 클래스 간 샘플 수가 불균형하여 모델 성능을 저하시킬 수 있다. 이를 위해 Synthetic Minority Oversampling Technique (SMOTE)와 같은 리샘플링 기법이 널리...

      머신러닝에서 클래스 불균형 문제는 데이터의 클래스 간 샘플 수가 불균형하여 모델 성능을 저하시킬 수 있다. 이를 위해 Synthetic Minority Oversampling Technique (SMOTE)와 같은 리샘플링 기법이 널리 연구되었지만, 여전히 클래스 중첩 영역 문제, 고차원 및 혼합형 데이터 등 다양한 클래스 불균형 시나리오에서는 한계를 보인다. 본 논문에서는 이러한 한계를 극복하기 위해 고차원 및 혼합형 데이터를 효과적으로 처리하는 새로운 오버샘플링 알고리즘인 k-Nearest Neighbor Oversampling with Weighted Heterogeneous Euclidean Entropy Metric (KNNOR_WHEEM)을 제안한다. 이는 유용한 샘플 선택, 샘플 합성, 합성 샘플 검증의 세 단계로 구성된다. KNNOR_WHEEM은 피처 간 중요도를 반영한 거리 메트릭과 피처 유형 별 샘플 합성 방식을 이용하여 고차원 및 혼합형 데이터의 클래스 불균형 문제를 효과적으로 다룬다. 제안한 알고리즘의 성능을 평가하기 위해 다양한 데이터를 이용해 실험을 진행하였고, 특히 F1-score 측면에서 우수한 성능을 보임을 확인할 수 있었다.

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼