RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      공통 Phrase의 관계 그래프와 Suffix Tree 문서 모델을 이용한 문서 군집화 기법

      한글로보기

      https://www.riss.kr/link?id=A76368925

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 측정을 제안한다. 이 방법은 문서 집합 내의 공통 Phrase들의 관계를 나타낸 관계 그래프를 통해 공통 Phrase의 가중치를 부여하는 방법을 제시한다. 또한 실험을 통해 NSTC와 비교하여 본 논문에서 제안한 문서간 유사도 측정 기법이 문서 군집화에 더욱 효과적임을 보였다.
      번역하기

      기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 ...

      기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 측정을 제안한다. 이 방법은 문서 집합 내의 공통 Phrase들의 관계를 나타낸 관계 그래프를 통해 공통 Phrase의 가중치를 부여하는 방법을 제시한다. 또한 실험을 통해 NSTC와 비교하여 본 논문에서 제안한 문서간 유사도 측정 기법이 문서 군집화에 더욱 효과적임을 보였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      Previous document clustering method, NSTC measures similarities between two document pairs using TF-IDF during web document clustering. In this paper, we propose new similarity measure using common phrase-based relational graph, not TF-IDF. This method suggests that weighting common phrases by relational graph presenting relationship among common phrases in document collection. And experimental results indicate that proposed method is more effective in clustering document collection than NSTC.
      번역하기

      Previous document clustering method, NSTC measures similarities between two document pairs using TF-IDF during web document clustering. In this paper, we propose new similarity measure using common phrase-based relational graph, not TF-IDF. This metho...

      Previous document clustering method, NSTC measures similarities between two document pairs using TF-IDF during web document clustering. In this paper, we propose new similarity measure using common phrase-based relational graph, not TF-IDF. This method suggests that weighting common phrases by relational graph presenting relationship among common phrases in document collection. And experimental results indicate that proposed method is more effective in clustering document collection than NSTC.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • Ⅰ. 서론
      • Ⅱ. 관련연구
      • Ⅲ. 문서 군집화 과정
      • 요약
      • Abstract
      • Ⅰ. 서론
      • Ⅱ. 관련연구
      • Ⅲ. 문서 군집화 과정
      • Ⅳ. PhraseRank 알고리즘
      • Ⅴ. 실험 및 결과
      • Ⅵ. 결론 및 향후 연구
      • 참고문헌
      • 저자소개
      더보기

      참고문헌 (Reference)

      1 "http://en.wikipedia.org/wiki/WordNet"

      2 O. Zamir, "Web Document Clustering: A Feasibility Demonstration" 46-54, 1998

      3 L. Page, "The Pagerank Citation Ranking: Bringing Order to the Web" Stanford Digital Library Technologies Project 1998

      4 S. Brin, "The Anatomy of a Large Scale Hypertextual Web Search Engine" 107-117, 1998

      5 G. Salton, "Term-Weighting Approaches In Automatic Text Retrieval" 24 (24): 513-523, 1988

      6 F. Gelgi, "Term Ranking for Clustering Web Search Results" 2007

      7 D. D. Lewis, "RCV1: A New Benchmark Collection for Text Categorization Research" 5 : 361-397, 2004

      8 E. Ukkonen, "On-Line Construction of Suffix Trees" 14 (14): 249-260, 1995

      9 W. Hersh, "OHSUMED: An Interactive Retrieval Evaluation and New Large Test Collection for Research" 192-201, 1994

      10 E. M. Voorhees, "Implementing Agglomerative Hierarchic Clustering Algorithms for Use in Document Retrieval" 22 (22): 465-476, 1986

      1 "http://en.wikipedia.org/wiki/WordNet"

      2 O. Zamir, "Web Document Clustering: A Feasibility Demonstration" 46-54, 1998

      3 L. Page, "The Pagerank Citation Ranking: Bringing Order to the Web" Stanford Digital Library Technologies Project 1998

      4 S. Brin, "The Anatomy of a Large Scale Hypertextual Web Search Engine" 107-117, 1998

      5 G. Salton, "Term-Weighting Approaches In Automatic Text Retrieval" 24 (24): 513-523, 1988

      6 F. Gelgi, "Term Ranking for Clustering Web Search Results" 2007

      7 D. D. Lewis, "RCV1: A New Benchmark Collection for Text Categorization Research" 5 : 361-397, 2004

      8 E. Ukkonen, "On-Line Construction of Suffix Trees" 14 (14): 249-260, 1995

      9 W. Hersh, "OHSUMED: An Interactive Retrieval Evaluation and New Large Test Collection for Research" 192-201, 1994

      10 E. M. Voorhees, "Implementing Agglomerative Hierarchic Clustering Algorithms for Use in Document Retrieval" 22 (22): 465-476, 1986

      11 M. Rosell, "Comparing comparisons: Document clustering evaluation using two manual classifications" 2004

      12 E. M. McCreight, "A Space-Economical Suffix Tree Construction Algorithm" 23 (23): 262-272, 1976

      13 H. Chim, "A New Suffix Tree Similarity Measure for Document Clustering" 121-130, 2007

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2027 평가예정 재인증평가 신청대상 (재인증)
      2021-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2018-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2011-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      2007-05-04 학회명변경 영문명 : The Korea Contents Society -> The Korea Contents Association KCI등재후보
      2007-01-01 평가 등재후보 1차 PASS (등재후보1차) KCI등재후보
      2006-01-01 평가 등재후보학술지 유지 (등재후보1차) KCI등재후보
      2004-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 1.21 1.21 1.26
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      1.29 1.25 1.573 0.33
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼