기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 ...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A76368925
2009
Korean
알고리즘 ; 군집화 ; 유사도 측정 ; 문서 모델 ; 관계 그래프 ; Suffix Tree ; Algorithms ; Clustering ; Similarity Measure ; Document Model ; Relational Graph
310
KCI등재
학술저널
142-151(10쪽)
0
0
상세조회0
다운로드국문 초록 (Abstract)
기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 ...
기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 측정을 제안한다. 이 방법은 문서 집합 내의 공통 Phrase들의 관계를 나타낸 관계 그래프를 통해 공통 Phrase의 가중치를 부여하는 방법을 제시한다. 또한 실험을 통해 NSTC와 비교하여 본 논문에서 제안한 문서간 유사도 측정 기법이 문서 군집화에 더욱 효과적임을 보였다.
다국어 초록 (Multilingual Abstract)
Previous document clustering method, NSTC measures similarities between two document pairs using TF-IDF during web document clustering. In this paper, we propose new similarity measure using common phrase-based relational graph, not TF-IDF. This metho...
Previous document clustering method, NSTC measures similarities between two document pairs using TF-IDF during web document clustering. In this paper, we propose new similarity measure using common phrase-based relational graph, not TF-IDF. This method suggests that weighting common phrases by relational graph presenting relationship among common phrases in document collection. And experimental results indicate that proposed method is more effective in clustering document collection than NSTC.
목차 (Table of Contents)
참고문헌 (Reference)
1 "http://en.wikipedia.org/wiki/WordNet"
2 O. Zamir, "Web Document Clustering: A Feasibility Demonstration" 46-54, 1998
3 L. Page, "The Pagerank Citation Ranking: Bringing Order to the Web" Stanford Digital Library Technologies Project 1998
4 S. Brin, "The Anatomy of a Large Scale Hypertextual Web Search Engine" 107-117, 1998
5 G. Salton, "Term-Weighting Approaches In Automatic Text Retrieval" 24 (24): 513-523, 1988
6 F. Gelgi, "Term Ranking for Clustering Web Search Results" 2007
7 D. D. Lewis, "RCV1: A New Benchmark Collection for Text Categorization Research" 5 : 361-397, 2004
8 E. Ukkonen, "On-Line Construction of Suffix Trees" 14 (14): 249-260, 1995
9 W. Hersh, "OHSUMED: An Interactive Retrieval Evaluation and New Large Test Collection for Research" 192-201, 1994
10 E. M. Voorhees, "Implementing Agglomerative Hierarchic Clustering Algorithms for Use in Document Retrieval" 22 (22): 465-476, 1986
1 "http://en.wikipedia.org/wiki/WordNet"
2 O. Zamir, "Web Document Clustering: A Feasibility Demonstration" 46-54, 1998
3 L. Page, "The Pagerank Citation Ranking: Bringing Order to the Web" Stanford Digital Library Technologies Project 1998
4 S. Brin, "The Anatomy of a Large Scale Hypertextual Web Search Engine" 107-117, 1998
5 G. Salton, "Term-Weighting Approaches In Automatic Text Retrieval" 24 (24): 513-523, 1988
6 F. Gelgi, "Term Ranking for Clustering Web Search Results" 2007
7 D. D. Lewis, "RCV1: A New Benchmark Collection for Text Categorization Research" 5 : 361-397, 2004
8 E. Ukkonen, "On-Line Construction of Suffix Trees" 14 (14): 249-260, 1995
9 W. Hersh, "OHSUMED: An Interactive Retrieval Evaluation and New Large Test Collection for Research" 192-201, 1994
10 E. M. Voorhees, "Implementing Agglomerative Hierarchic Clustering Algorithms for Use in Document Retrieval" 22 (22): 465-476, 1986
11 M. Rosell, "Comparing comparisons: Document clustering evaluation using two manual classifications" 2004
12 E. M. McCreight, "A Space-Economical Suffix Tree Construction Algorithm" 23 (23): 262-272, 1976
13 H. Chim, "A New Suffix Tree Similarity Measure for Document Clustering" 121-130, 2007
사용자 인터페이스 명세 언어를 이용한 위피 비즈니스 프로그램 저작도구 구현
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2027 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2021-01-01 | 평가 | 등재학술지 유지 (재인증) | ![]() |
2018-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
2015-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
2011-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
2008-01-01 | 평가 | 등재학술지 선정 (등재후보2차) | ![]() |
2007-05-04 | 학회명변경 | 영문명 : The Korea Contents Society -> The Korea Contents Association | ![]() |
2007-01-01 | 평가 | 등재후보 1차 PASS (등재후보1차) | ![]() |
2006-01-01 | 평가 | 등재후보학술지 유지 (등재후보1차) | ![]() |
2004-01-01 | 평가 | 등재후보학술지 선정 (신규평가) | ![]() |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 1.21 | 1.21 | 1.26 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
1.29 | 1.25 | 1.573 | 0.33 |