RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      연관성 규칙에서 순수균형화 교차 엔트로피 측도의 제안 = Proposition of a Purely Balanced Cross Entropy Measure in Association Rule Mining

      한글로보기

      https://www.riss.kr/link?id=A105927601

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      The processing techniques for analyzing and utilizing big data are largely divided into analytical technology and presentation technology. One of the most representative techniques of analysis technology is data mining (Park, 2017a). This technique includes association rule, decision tree, and k-means clustering analysis. In this paper, we proposed a purely balanced cross entropy measure by modifying the balanced cross entropy for association threshold. As a result, the cross entropy is an unbalanced measure considering only a part of the confidence measures. The balanced cross entropy is a measure that takes account of all confidence measures, but the terms in each log term are not mutually exclusive. On the other hand, purely balanced cross entropy is a measure by which denominator and molecule are not affected by each other. In addition, when we compare the variation of the values of the cross entropy, the balanced cross entropy, and the purely balanced cross entropy, the purely balanced cross entropy becomes the largest.
      번역하기

      The processing techniques for analyzing and utilizing big data are largely divided into analytical technology and presentation technology. One of the most representative techniques of analysis technology is data mining (Park, 2017a). This technique in...

      The processing techniques for analyzing and utilizing big data are largely divided into analytical technology and presentation technology. One of the most representative techniques of analysis technology is data mining (Park, 2017a). This technique includes association rule, decision tree, and k-means clustering analysis. In this paper, we proposed a purely balanced cross entropy measure by modifying the balanced cross entropy for association threshold. As a result, the cross entropy is an unbalanced measure considering only a part of the confidence measures. The balanced cross entropy is a measure that takes account of all confidence measures, but the terms in each log term are not mutually exclusive. On the other hand, purely balanced cross entropy is a measure by which denominator and molecule are not affected by each other. In addition, when we compare the variation of the values of the cross entropy, the balanced cross entropy, and the purely balanced cross entropy, the purely balanced cross entropy becomes the largest.

      더보기

      국문 초록 (Abstract)

      빅 데이터의 분석 및 활용을 위한 처리 기법은 크게 분석 기술과 표현 기술로 나누어지는데 분석 기술 중에서 가장 대표적인 기법이 데이터 마이닝 기법이다(Park, 2017a). 이에는 연관성 규칙, 의사 결정 나무, 그리고 k-평균 군집분석 등이 있다. 본 논문에서는 연관성 규칙의 평가 기준으로 사용하기 위해 균형화된 교차 엔트로피를 변형하여 순수균형화 교차 엔트로피 측도를 제안하였다. 그 결과, 교차 엔트로피는 신뢰도의 일부만을 계산에 고려한 불균형적 측도인 것으로 나타났다. 균형화된 교차 엔트로피는 모든 신뢰도를 고려한 측도이기는 하나 각 로그 항에 있는 항들이 상호 배반적이지 못한 측도이다. 반면에 순수균형화 교차 엔트로피는 로그 항에 포함되어 있는 분모와 분자가 공통적인 요소가 없기 때문에 분모와 분자가 서로 영향을 받지 않는 측도라고 할 수 있다. 또한 교차 엔트로피 및 균형화된 교차 엔트로피, 그리고 순수균형화 교차 엔트로피의 값의 변화 폭을 비교해보면 순수균형화 교차 엔트로피가 가장 크게 나타나서 각 케이스별로 연관성 규칙의 생성 유무를 더 잘 파악할 수 있으므로 순수균형화 교차 엔트로피가 교차 엔트로피와 균형화된 교차 엔트로피에 비해 더 바람직한 측도라고 할 수 있다.
      번역하기

      빅 데이터의 분석 및 활용을 위한 처리 기법은 크게 분석 기술과 표현 기술로 나누어지는데 분석 기술 중에서 가장 대표적인 기법이 데이터 마이닝 기법이다(Park, 2017a). 이에는 연관성 규칙, ...

      빅 데이터의 분석 및 활용을 위한 처리 기법은 크게 분석 기술과 표현 기술로 나누어지는데 분석 기술 중에서 가장 대표적인 기법이 데이터 마이닝 기법이다(Park, 2017a). 이에는 연관성 규칙, 의사 결정 나무, 그리고 k-평균 군집분석 등이 있다. 본 논문에서는 연관성 규칙의 평가 기준으로 사용하기 위해 균형화된 교차 엔트로피를 변형하여 순수균형화 교차 엔트로피 측도를 제안하였다. 그 결과, 교차 엔트로피는 신뢰도의 일부만을 계산에 고려한 불균형적 측도인 것으로 나타났다. 균형화된 교차 엔트로피는 모든 신뢰도를 고려한 측도이기는 하나 각 로그 항에 있는 항들이 상호 배반적이지 못한 측도이다. 반면에 순수균형화 교차 엔트로피는 로그 항에 포함되어 있는 분모와 분자가 공통적인 요소가 없기 때문에 분모와 분자가 서로 영향을 받지 않는 측도라고 할 수 있다. 또한 교차 엔트로피 및 균형화된 교차 엔트로피, 그리고 순수균형화 교차 엔트로피의 값의 변화 폭을 비교해보면 순수균형화 교차 엔트로피가 가장 크게 나타나서 각 케이스별로 연관성 규칙의 생성 유무를 더 잘 파악할 수 있으므로 순수균형화 교차 엔트로피가 교차 엔트로피와 균형화된 교차 엔트로피에 비해 더 바람직한 측도라고 할 수 있다.

      더보기

      참고문헌 (Reference)

      1 이창환, "정보이론에 기반한 연관 규칙들의 새로운 중요도 측정 방법" 한국정보처리학회 3 (3): 37-42, 2014

      2 박희창, "이분형 자료 분석을 위한 유사성 측도의 상한 및 하한의 설정에 관한 연구" 한국자료분석학회 16 (16): 2987-2997, 2014

      3 류재열, "음의 연관성 규칙 생성을 위한 Jaccard 비유사성 측도들의 고찰" 한국자료분석학회 15 (15): 3111-3121, 2013

      4 진도승, "연관성분석을 이용한 여행업 고객 분석" 한국자료분석학회 13 (13): 2945-2952, 2011

      5 박희창, "연관성 평가 기준으로서의 균형화된 부호 헬링거 측도의 제안" 한국자료분석학회 19 (19): 1315-1325, 2017

      6 박희창, "연관성 규칙에서의 대칭적 기준 확인 측도와 확률적 흥미도 측도와의 비교 연구" 한국자료분석학회 17 (17): 749-758, 2015

      7 박희창, "연관성 규칙에서 균형화된 교차 엔트로피 측도의 제안" 한국자료분석학회 19 (19): 699-708, 2017

      8 박희창, "연관성 규칙 관점에서 수정된 헬링거 측도의 제안" 한국자료분석학회 18 (18): 199-206, 2016

      9 안광일, "연관규칙 탐색에서 새로운 흥미도 척도의 제안" 대한산업공학회 29 (29): 41-48, 2003

      10 황준현, "역 연관규칙을 이용한 타겟 마케팅" 한국지능정보시스템학회 9 (9): 195-209, 2003

      1 이창환, "정보이론에 기반한 연관 규칙들의 새로운 중요도 측정 방법" 한국정보처리학회 3 (3): 37-42, 2014

      2 박희창, "이분형 자료 분석을 위한 유사성 측도의 상한 및 하한의 설정에 관한 연구" 한국자료분석학회 16 (16): 2987-2997, 2014

      3 류재열, "음의 연관성 규칙 생성을 위한 Jaccard 비유사성 측도들의 고찰" 한국자료분석학회 15 (15): 3111-3121, 2013

      4 진도승, "연관성분석을 이용한 여행업 고객 분석" 한국자료분석학회 13 (13): 2945-2952, 2011

      5 박희창, "연관성 평가 기준으로서의 균형화된 부호 헬링거 측도의 제안" 한국자료분석학회 19 (19): 1315-1325, 2017

      6 박희창, "연관성 규칙에서의 대칭적 기준 확인 측도와 확률적 흥미도 측도와의 비교 연구" 한국자료분석학회 17 (17): 749-758, 2015

      7 박희창, "연관성 규칙에서 균형화된 교차 엔트로피 측도의 제안" 한국자료분석학회 19 (19): 699-708, 2017

      8 박희창, "연관성 규칙 관점에서 수정된 헬링거 측도의 제안" 한국자료분석학회 18 (18): 199-206, 2016

      9 안광일, "연관규칙 탐색에서 새로운 흥미도 척도의 제안" 대한산업공학회 29 (29): 41-48, 2003

      10 황준현, "역 연관규칙을 이용한 타겟 마케팅" 한국지능정보시스템학회 9 (9): 195-209, 2003

      11 박희창, "엔트로피 기반 연관성 평가 기준의 제안" 한국자료분석학회 18 (18): 1905-1914, 2016

      12 박희창, "모든 가능한 진단도구를 활용한 균형비교신뢰도의 제안" 한국데이터정보과학회 26 (26): 611-618, 2015

      13 조광현, "데이터마이닝을 이용한 경상남도 사회지표 조사 분석" 한국자료분석학회 15 (15): 2489-2497, 2013

      14 박희창, "기준 확인 측도와 확률적 흥미도 측도와의 관계 탐색" 한국자료분석학회 16 (16): 145-154, 2014

      15 Silberschatz, A., "What makes patterns interesting in knowledge discovery systems" 8 : 970-974, 1996

      16 Tan, P. N., "Selecting the right interestingness measure for association patterns" 32-41, 2002

      17 박희창, "Balanced Association Threshold of Dependency Factor" 한국자료분석학회 17 (17): 19-25, 2015

      18 Smyth, P., "An information theoretic approach to rule induction from databases" 4 (4): 301-316, 1992

      19 Shannon, C. E., "A mathematical theory of communication" 27 : 379-423, 1948

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2026 평가예정 재인증평가 신청대상 (재인증)
      2020-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2017-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2013-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2005-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2004-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2002-07-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 1.26 1.26 1.15
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      1.05 0.98 0.956 0.4
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼