RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      슬라이딩 윈도우 기반 다변량 스트림 데이타 분류 기법 = A Sliding Window-based Multivariate Stream Data Classification

      한글로보기

      https://www.riss.kr/link?id=A82293275

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 입력되는 데이타를 사전에 분류하여 특성에 따라 선택적으로 데이타를 처리하는 데이타 분류 기법이 요구된다. 이 논문에서는 다차원 센서에서 주기적으로 수집되는 스트림 데이타를 슬라이딩 윈도우 단위로 데이타를 분류하는 기법을 제안한다. 제안된 기법은 전처리 단계와 분류단계로 구성된다. 전처리 단계는 다변량 스트림 데이타를 포함한 각 슬라이딩 윈도우 입력에 대해 데이타의 변화 특성에 따라 문자 기호를 이용하여 다양한 이산적 문자열 데이타 집합으로 변환한다. 분류단계는 각 윈도우마다 생성된 이산적 문자열 데이타를 분류하기 위해 표준 문서 분류 알고리즘을 이용하였다. 실험을 위해 우리는 Supervised 학습(베이지안 분류기, SVM)과 Unsupervised 학습(Jaccard, TFIDF, Jaro, Jaro Winkler) 알고리즘을 비교하고 평가하였다. 실험결과 SVM과 TFIDF 기법이 우수한 결과를 보였으며, 특히 속성간의 상관 정도와 인접한 각 문자 기호를 연결한 n-gram방식을 함께 고려하였을 때 높은 정확도를 보였다.
      번역하기

      분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 ...

      분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 입력되는 데이타를 사전에 분류하여 특성에 따라 선택적으로 데이타를 처리하는 데이타 분류 기법이 요구된다. 이 논문에서는 다차원 센서에서 주기적으로 수집되는 스트림 데이타를 슬라이딩 윈도우 단위로 데이타를 분류하는 기법을 제안한다. 제안된 기법은 전처리 단계와 분류단계로 구성된다. 전처리 단계는 다변량 스트림 데이타를 포함한 각 슬라이딩 윈도우 입력에 대해 데이타의 변화 특성에 따라 문자 기호를 이용하여 다양한 이산적 문자열 데이타 집합으로 변환한다. 분류단계는 각 윈도우마다 생성된 이산적 문자열 데이타를 분류하기 위해 표준 문서 분류 알고리즘을 이용하였다. 실험을 위해 우리는 Supervised 학습(베이지안 분류기, SVM)과 Unsupervised 학습(Jaccard, TFIDF, Jaro, Jaro Winkler) 알고리즘을 비교하고 평가하였다. 실험결과 SVM과 TFIDF 기법이 우수한 결과를 보였으며, 특히 속성간의 상관 정도와 인접한 각 문자 기호를 연결한 n-gram방식을 함께 고려하였을 때 높은 정확도를 보였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      In distributed wireless sensor network, it is difficult to transmit and analyze the entire stream data depending on limited networks, power and processor. Therefore it is suitable to use alternative stream data processing after classifying the continuous stream data. We propose a classification framework for continuous multivariate stream data. The proposed approach works in two steps. In the preprocessing step, it takes input as a sliding window of multivariate stream data and discretizes the data in the window into a string of symbols that characterize the signal changes. In the classification step, it uses a standard text classification algorithm to classify the discretized data in the window. We evaluated both supervised and unsupervised classification algorithms. For supervised, we tested Bayesian classifier and SVM, and for unsupervised, we tested Jaccard, TFIDF, Jaro and JaroWinkler. In our experiments, SVM and TFIDF outperformed other classification methods. In particular, we observed that classification accuracy is improved when the correlation of attributes is also considered along with the n-gram tokens of symbols.
      번역하기

      In distributed wireless sensor network, it is difficult to transmit and analyze the entire stream data depending on limited networks, power and processor. Therefore it is suitable to use alternative stream data processing after classifying the continu...

      In distributed wireless sensor network, it is difficult to transmit and analyze the entire stream data depending on limited networks, power and processor. Therefore it is suitable to use alternative stream data processing after classifying the continuous stream data. We propose a classification framework for continuous multivariate stream data. The proposed approach works in two steps. In the preprocessing step, it takes input as a sliding window of multivariate stream data and discretizes the data in the window into a string of symbols that characterize the signal changes. In the classification step, it uses a standard text classification algorithm to classify the discretized data in the window. We evaluated both supervised and unsupervised classification algorithms. For supervised, we tested Bayesian classifier and SVM, and for unsupervised, we tested Jaccard, TFIDF, Jaro and JaroWinkler. In our experiments, SVM and TFIDF outperformed other classification methods. In particular, we observed that classification accuracy is improved when the correlation of attributes is also considered along with the n-gram tokens of symbols.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • 1. 서론
      • 2. 관련연구
      • 3. 다변량 스트림 데이타 분류
      • 요약
      • Abstract
      • 1. 서론
      • 2. 관련연구
      • 3. 다변량 스트림 데이타 분류
      • 4. 실험 및 평가
      • 5. 결론
      • 참고문헌
      • 저자소개
      더보기

      참고문헌 (Reference)

      1 "Wireless Sensor Networks for Habitat Monitoring" 88-97, 2002.

      2 "Time-Series Prediction with Applications to Traffic and Moving Objects Databases" 56-60, 2003.

      3 "The UCI KDD Archive [http://kdd.ics.uci.edu] (Robot Execution Failure, Synthetic Control Chart Time Series)" 1999.

      4 "SecondString (Jave-based Package of Approximate String-Matching)."

      5 "Querying Shapes of Histories" 502-514, 1995

      6 "Pattern Matching in Financial Time Series Data" 1998.

      7 "Pattern Extraction for Time Series Classification" 115-127, 2001.

      8 "On Demand Classification of Data Streams" 503-508, 2004.

      9 "Mining Data Streams: A Review" 34 (34): 18-26, 2005

      10 "Mining Concept-Drifting Data Streams Using Ensemble Classifiers" 226-235, 2003

      1 "Wireless Sensor Networks for Habitat Monitoring" 88-97, 2002.

      2 "Time-Series Prediction with Applications to Traffic and Moving Objects Databases" 56-60, 2003.

      3 "The UCI KDD Archive [http://kdd.ics.uci.edu] (Robot Execution Failure, Synthetic Control Chart Time Series)" 1999.

      4 "SecondString (Jave-based Package of Approximate String-Matching)."

      5 "Querying Shapes of Histories" 502-514, 1995

      6 "Pattern Matching in Financial Time Series Data" 1998.

      7 "Pattern Extraction for Time Series Classification" 115-127, 2001.

      8 "On Demand Classification of Data Streams" 503-508, 2004.

      9 "Mining Data Streams: A Review" 34 (34): 18-26, 2005

      10 "Mining Concept-Drifting Data Streams Using Ensemble Classifiers" 226-235, 2003

      11 "Java Bayesian Network Classifier Toolkit" 2005.

      12 "Introduction to data Mining" Pearson Addison Wesley 2005.

      13 "Intelligent Instance Selection of Data Streams for Smart Sensor Applications" 108-119, 2005.

      14 "Field Testing a Wireless Sensor Network for Reactive Environmental Monitoring" 7-12, 2004.

      15 "Data Mining Concepts and Techniques" ’ Morgan Kaufmann Publishers 2000.

      16 "Comparing Bayesian Network Classifiers" 101-108, 1999.

      17 "Comparative Study of Name Disambiguation Problem using a Scalable Blocking-based Framework" 344-353, 2005

      18 "Classification of multivariate time series and structured data using constructive induction" 58 : 176-216, 2005.

      19 "An Introduction to Support Vector Machines" Cambridge University Press 2000.

      20 "A new method of N-gram statistics for large number of n and automatic extraction of words and phrases from large text data of Japanese" 611-615, 1994.

      21 "A Symbolic Representation of Time Series with Implications for Streaming Algorithms" 2-11, 2003

      22 "A Library for Support Vector Machines."

      23 "A Comparison of String Distance Metrics for Naming- matching tasks" 73-78, 2003.

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2014-09-01 평가 학술지 통합(기타)
      2013-04-26 학술지명변경 한글명 : 정보과학회논문지 : 데이타베이스</br>외국어명 : Journal of KIISE : Databases KCI등재
      2011-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2007-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2005-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2002-01-01 평가 등재학술지 선정(등재후보2차) KCI등재
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼