분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 ...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A82293275
2006
Korean
569
KCI등재
학술저널
163-174(12쪽)
0
0
상세조회0
다운로드국문 초록 (Abstract)
분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 ...
분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 입력되는 데이타를 사전에 분류하여 특성에 따라 선택적으로 데이타를 처리하는 데이타 분류 기법이 요구된다. 이 논문에서는 다차원 센서에서 주기적으로 수집되는 스트림 데이타를 슬라이딩 윈도우 단위로 데이타를 분류하는 기법을 제안한다. 제안된 기법은 전처리 단계와 분류단계로 구성된다. 전처리 단계는 다변량 스트림 데이타를 포함한 각 슬라이딩 윈도우 입력에 대해 데이타의 변화 특성에 따라 문자 기호를 이용하여 다양한 이산적 문자열 데이타 집합으로 변환한다. 분류단계는 각 윈도우마다 생성된 이산적 문자열 데이타를 분류하기 위해 표준 문서 분류 알고리즘을 이용하였다. 실험을 위해 우리는 Supervised 학습(베이지안 분류기, SVM)과 Unsupervised 학습(Jaccard, TFIDF, Jaro, Jaro Winkler) 알고리즘을 비교하고 평가하였다. 실험결과 SVM과 TFIDF 기법이 우수한 결과를 보였으며, 특히 속성간의 상관 정도와 인접한 각 문자 기호를 연결한 n-gram방식을 함께 고려하였을 때 높은 정확도를 보였다.
다국어 초록 (Multilingual Abstract)
In distributed wireless sensor network, it is difficult to transmit and analyze the entire stream data depending on limited networks, power and processor. Therefore it is suitable to use alternative stream data processing after classifying the continu...
In distributed wireless sensor network, it is difficult to transmit and analyze the entire stream data depending on limited networks, power and processor. Therefore it is suitable to use alternative stream data processing after classifying the continuous stream data. We propose a classification framework for continuous multivariate stream data. The proposed approach works in two steps. In the preprocessing step, it takes input as a sliding window of multivariate stream data and discretizes the data in the window into a string of symbols that characterize the signal changes. In the classification step, it uses a standard text classification algorithm to classify the discretized data in the window. We evaluated both supervised and unsupervised classification algorithms. For supervised, we tested Bayesian classifier and SVM, and for unsupervised, we tested Jaccard, TFIDF, Jaro and JaroWinkler. In our experiments, SVM and TFIDF outperformed other classification methods. In particular, we observed that classification accuracy is improved when the correlation of attributes is also considered along with the n-gram tokens of symbols.
목차 (Table of Contents)
참고문헌 (Reference)
1 "Wireless Sensor Networks for Habitat Monitoring" 88-97, 2002.
2 "Time-Series Prediction with Applications to Traffic and Moving Objects Databases" 56-60, 2003.
3 "The UCI KDD Archive [http://kdd.ics.uci.edu] (Robot Execution Failure, Synthetic Control Chart Time Series)" 1999.
4 "SecondString (Jave-based Package of Approximate String-Matching)."
5 "Querying Shapes of Histories" 502-514, 1995
6 "Pattern Matching in Financial Time Series Data" 1998.
7 "Pattern Extraction for Time Series Classification" 115-127, 2001.
8 "On Demand Classification of Data Streams" 503-508, 2004.
9 "Mining Data Streams: A Review" 34 (34): 18-26, 2005
10 "Mining Concept-Drifting Data Streams Using Ensemble Classifiers" 226-235, 2003
1 "Wireless Sensor Networks for Habitat Monitoring" 88-97, 2002.
2 "Time-Series Prediction with Applications to Traffic and Moving Objects Databases" 56-60, 2003.
3 "The UCI KDD Archive [http://kdd.ics.uci.edu] (Robot Execution Failure, Synthetic Control Chart Time Series)" 1999.
4 "SecondString (Jave-based Package of Approximate String-Matching)."
5 "Querying Shapes of Histories" 502-514, 1995
6 "Pattern Matching in Financial Time Series Data" 1998.
7 "Pattern Extraction for Time Series Classification" 115-127, 2001.
8 "On Demand Classification of Data Streams" 503-508, 2004.
9 "Mining Data Streams: A Review" 34 (34): 18-26, 2005
10 "Mining Concept-Drifting Data Streams Using Ensemble Classifiers" 226-235, 2003
11 "Java Bayesian Network Classifier Toolkit" 2005.
12 "Introduction to data Mining" Pearson Addison Wesley 2005.
13 "Intelligent Instance Selection of Data Streams for Smart Sensor Applications" 108-119, 2005.
14 "Field Testing a Wireless Sensor Network for Reactive Environmental Monitoring" 7-12, 2004.
15 "Data Mining Concepts and Techniques" ’ Morgan Kaufmann Publishers 2000.
16 "Comparing Bayesian Network Classifiers" 101-108, 1999.
17 "Comparative Study of Name Disambiguation Problem using a Scalable Blocking-based Framework" 344-353, 2005
18 "Classification of multivariate time series and structured data using constructive induction" 58 : 176-216, 2005.
19 "An Introduction to Support Vector Machines" Cambridge University Press 2000.
20 "A new method of N-gram statistics for large number of n and automatic extraction of words and phrases from large text data of Japanese" 611-615, 1994.
21 "A Symbolic Representation of Time Series with Implications for Streaming Algorithms" 2-11, 2003
22 "A Library for Support Vector Machines."
23 "A Comparison of String Distance Metrics for Naming- matching tasks" 73-78, 2003.
RDF 스키마 함의 규칙 적용 순서를 이용한 RDFS 추론 엔진의 최적화
데이타 웨어하우스에서 데이타 큐브를 위한 효율적인 점진적 관리 기법
시계열 서브시퀀스 매칭을 위한 최적의 다중 인덱스 구성 방안 (pp.201-213)
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2014-09-01 | 평가 | 학술지 통합(기타) | |
2013-04-26 | 학술지명변경 | 한글명 : 정보과학회논문지 : 데이타베이스</br>외국어명 : Journal of KIISE : Databases | ![]() |
2011-01-01 | 평가 | 등재학술지 유지(등재유지) | ![]() |
2009-01-01 | 평가 | 등재학술지 유지(등재유지) | ![]() |
2007-01-01 | 평가 | 등재학술지 유지(등재유지) | ![]() |
2005-01-01 | 평가 | 등재학술지 유지(등재유지) | ![]() |
2002-01-01 | 평가 | 등재학술지 선정(등재후보2차) | ![]() |