RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      연관성 규칙 수의 결정을 위한 비선형 회귀모형에서의 표준화 향상도 적용 방안 = Development of Regression Models by Standardized Lift for Association Rule Number Estimation

      한글로보기

      https://www.riss.kr/link?id=A101599998

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract)

      By Wikipedia, big data is an all-encompassing term for any collection of data sets so large and complex that it becomes difficult to process using traditional data processing applications. We have used data mining technique for optimal decision making from big data. The most widely used data mining technique is to explore association rules. This technique has been used to find the relationship between each set of items based on the association thresholds such as support, confidence, lift, etc. Multiple regression analysis is an inherently statistical technique applicable to numerous data mining situations. In this paper, we proposed some non-linear regression equations between the number of rules and thresholds such as support, confidence, and standardized lift. And then we compared these models with regression models of elementary thresholds by variation inflation factor, F value, and adjusted coefficients of determination for exploration of the best model through some numerical experiments. The results show that the regression models considering standardized lift were better than those of original thresholds.
      번역하기

      By Wikipedia, big data is an all-encompassing term for any collection of data sets so large and complex that it becomes difficult to process using traditional data processing applications. We have used data mining technique for optimal decision making...

      By Wikipedia, big data is an all-encompassing term for any collection of data sets so large and complex that it becomes difficult to process using traditional data processing applications. We have used data mining technique for optimal decision making from big data. The most widely used data mining technique is to explore association rules. This technique has been used to find the relationship between each set of items based on the association thresholds such as support, confidence, lift, etc. Multiple regression analysis is an inherently statistical technique applicable to numerous data mining situations. In this paper, we proposed some non-linear regression equations between the number of rules and thresholds such as support, confidence, and standardized lift. And then we compared these models with regression models of elementary thresholds by variation inflation factor, F value, and adjusted coefficients of determination for exploration of the best model through some numerical experiments. The results show that the regression models considering standardized lift were better than those of original thresholds.

      더보기

      국문 초록 (Abstract)

      다양한 종류의 대규모 데이터에 대한 수집과 분석을 그 특징으로 하는 빅 데이터는 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동케 하며, 비즈니스적인 요구에 의해 시장에 등장한 데이터마이닝 기법은 각종 분야의 빅 데이터로부터 최적 전략이나 의사결정을 위해 많이 활용되고 있다. 본 논문에서는 연관성 규칙의 수를 추정하기 위한 기존의 연구에 이어 표준화 향상도를 적용한 회귀모형을 제안한 후, 이 모형과 기존의 회귀 모형과의 비교를 통해 그 유용성을 살펴보고자 한다. 이를 위해 각 모형에 대한 회귀계수를 추정하고, 분산팽창계수를 이용하여 다중공선성 문제를 진단하는 동시에 분산분석 결과와 수정 결정계수를 이용하여 각 모형의 적합도와 기여도를 비교하였으며, 이들을 토대로 가장 바람직한 회귀 모형을 구하였다. 그 결과, 분산분석에서의 통계량 값이 모든 유형에서 유의하게 나타난 반면에 기본적인 평가 기준에 의한 회귀모형에서는 향상도가 아무런 의미를 가지지 못했으나 표준화 향상도를 적용한 모형에서는 거의 대부분의 모형들이 지지도와 신뢰도뿐만 아니라 표준화 향상도도 유의미한 결과를 얻을 수 있었다. 따라서 기본적인 연관성 평가 기준을 사용하여 회귀모형을 구축할 때 보다 표준화 향상도를 고려하여 모형을 구축하게 되면 더 많은 평가 기준에 의해 연관성 규칙의 수를 설명할 수 있는 것으로 나타났다.
      번역하기

      다양한 종류의 대규모 데이터에 대한 수집과 분석을 그 특징으로 하는 빅 데이터는 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동케 하며, 비즈니스적인 요구에 의해 시장...

      다양한 종류의 대규모 데이터에 대한 수집과 분석을 그 특징으로 하는 빅 데이터는 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동케 하며, 비즈니스적인 요구에 의해 시장에 등장한 데이터마이닝 기법은 각종 분야의 빅 데이터로부터 최적 전략이나 의사결정을 위해 많이 활용되고 있다. 본 논문에서는 연관성 규칙의 수를 추정하기 위한 기존의 연구에 이어 표준화 향상도를 적용한 회귀모형을 제안한 후, 이 모형과 기존의 회귀 모형과의 비교를 통해 그 유용성을 살펴보고자 한다. 이를 위해 각 모형에 대한 회귀계수를 추정하고, 분산팽창계수를 이용하여 다중공선성 문제를 진단하는 동시에 분산분석 결과와 수정 결정계수를 이용하여 각 모형의 적합도와 기여도를 비교하였으며, 이들을 토대로 가장 바람직한 회귀 모형을 구하였다. 그 결과, 분산분석에서의 통계량 값이 모든 유형에서 유의하게 나타난 반면에 기본적인 평가 기준에 의한 회귀모형에서는 향상도가 아무런 의미를 가지지 못했으나 표준화 향상도를 적용한 모형에서는 거의 대부분의 모형들이 지지도와 신뢰도뿐만 아니라 표준화 향상도도 유의미한 결과를 얻을 수 있었다. 따라서 기본적인 연관성 평가 기준을 사용하여 회귀모형을 구축할 때 보다 표준화 향상도를 고려하여 모형을 구축하게 되면 더 많은 평가 기준에 의해 연관성 규칙의 수를 설명할 수 있는 것으로 나타났다.

      더보기

      참고문헌 (Reference)

      1 박희창, "유사성 측도에 대한 연관성 규칙 평가 기준으로의 적용 방안" 한국자료분석학회 13 (13): 1331-1341, 2011

      2 조광현, "외적 변수를 이용한 의미 없는 연관성 규칙 발견" 한국자료분석학회 13 (13): 1343-1351, 2011

      3 진도승, "연관성분석을 이용한 여행업 고객 분석" 한국자료분석학회 13 (13): 2945-2952, 2011

      4 조광현, "연관성규칙에서의 다중매개관계에 관한 연구" 한국자료분석학회 13 (13): 297-306, 2011

      5 박희창, "연관성 규칙 수의 결정을 위한 비선형 회귀모형의 비교에 관한 연구" 한국자료분석학회 15 (15): 125-132, 2013

      6 박희창, "방향성이 있는 유사성 측도에 의한 연관성 규칙 탐색" 한국자료분석학회 14 (14): 2429-2439, 2012

      7 Yi, W., "Regression analysis in the number of association rules" 8 (8): 78-82, 2011

      8 Han, J., "Mining frequent patterns without candidate generation" 1-12, 2000

      9 Agrawal, R., "Mining association rules between sets of items in large databases" 207-216, 1993

      10 Pei, J., "CLOSET: an efficient algorithm for mining frequent closed itemsets" 21-30, 2000

      1 박희창, "유사성 측도에 대한 연관성 규칙 평가 기준으로의 적용 방안" 한국자료분석학회 13 (13): 1331-1341, 2011

      2 조광현, "외적 변수를 이용한 의미 없는 연관성 규칙 발견" 한국자료분석학회 13 (13): 1343-1351, 2011

      3 진도승, "연관성분석을 이용한 여행업 고객 분석" 한국자료분석학회 13 (13): 2945-2952, 2011

      4 조광현, "연관성규칙에서의 다중매개관계에 관한 연구" 한국자료분석학회 13 (13): 297-306, 2011

      5 박희창, "연관성 규칙 수의 결정을 위한 비선형 회귀모형의 비교에 관한 연구" 한국자료분석학회 15 (15): 125-132, 2013

      6 박희창, "방향성이 있는 유사성 측도에 의한 연관성 규칙 탐색" 한국자료분석학회 14 (14): 2429-2439, 2012

      7 Yi, W., "Regression analysis in the number of association rules" 8 (8): 78-82, 2011

      8 Han, J., "Mining frequent patterns without candidate generation" 1-12, 2000

      9 Agrawal, R., "Mining association rules between sets of items in large databases" 207-216, 1993

      10 Pei, J., "CLOSET: an efficient algorithm for mining frequent closed itemsets" 21-30, 2000

      11 Le, D. T., "A regression-based approach for improving the association rule mining through predicting the number of rules on general datasets" 229-240, 2012

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2026 평가예정 재인증평가 신청대상 (재인증)
      2020-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2017-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2013-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2005-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2004-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2002-07-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 1.26 1.26 1.15
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      1.05 0.98 0.956 0.4
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼