RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      용어 클러스터링을 이용한 단일문서 키워드 추출에 관한 연구 = A Study on Keyword Extraction From a Single Document Using Term Clustering

      한글로보기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      In this study, a new keyword extraction algorithm is applied to a single document with term clustering. A single document is divided by multiple passages, and two ways of calculating similarities between two terms are investigated; the first-order similarity and the second-order distributional similarity. In this experiment, the best cluster performance is achieved with a 50-term passage from the second-order distributional similarity. From the results of first experiment, the second-order distribution similarity was also applied to various keyword extraction methods using statistic information of terms. In the second experiment, (paragraph frequency) and (term frequency by inverse paragraph frequency) were found to improve the overall performance of keyword extraction. Therefore, it showed that the algorithm fulfills the necessary conditions which good keywords should have.
      번역하기

      In this study, a new keyword extraction algorithm is applied to a single document with term clustering. A single document is divided by multiple passages, and two ways of calculating similarities between two terms are investigated; the first-order sim...

      In this study, a new keyword extraction algorithm is applied to a single document with term clustering. A single document is divided by multiple passages, and two ways of calculating similarities between two terms are investigated; the first-order similarity and the second-order distributional similarity. In this experiment, the best cluster performance is achieved with a 50-term passage from the second-order distributional similarity. From the results of first experiment, the second-order distribution similarity was also applied to various keyword extraction methods using statistic information of terms. In the second experiment, (paragraph frequency) and (term frequency by inverse paragraph frequency) were found to improve the overall performance of keyword extraction. Therefore, it showed that the algorithm fulfills the necessary conditions which good keywords should have.

      더보기

      국문 초록 (Abstract) kakao i 다국어 번역

      이 연구에서는 용어 클러스터링을 이용하여 단일문서의 키워드를 추출하는 알고리즘을 제안하고자 한다. 단락단위로 분할한 단일문서를 대상으로 1차 유사도와 2차 분포 유사도를 산출하여 용어 클러스터링을 수행한 결과, 50단어 단락에서 2차 분포 유사도를 적용했을 때 가장 우수한 성능을 나타냈다. 이후, 용어 클러스터링 결과를 이용하여 단일문서의 키워드를 추출하기 위해 단순빈도와 상대빈도의 조합을 통해 다양한 키워드 추출 공식을 도출, 적용한 결과, 단락빈도와 단어빈도×역단락빈도 조건에서 가장 우수한 결과를 나타냈다. 이 결과를 통해, 본 연구에서 제안한 알고리즘은 좋은 키워드가 가져야 할 두 가지 조건인 주제성과 고른 빈도분포라는 측면에서 단일문서를 대상으로 효과적으로 키워드를 추출할 수 있음을 확인하였다.
      번역하기

      이 연구에서는 용어 클러스터링을 이용하여 단일문서의 키워드를 추출하는 알고리즘을 제안하고자 한다. 단락단위로 분할한 단일문서를 대상으로 1차 유사도와 2차 분포 유사도를 산출하여...

      이 연구에서는 용어 클러스터링을 이용하여 단일문서의 키워드를 추출하는 알고리즘을 제안하고자 한다. 단락단위로 분할한 단일문서를 대상으로 1차 유사도와 2차 분포 유사도를 산출하여 용어 클러스터링을 수행한 결과, 50단어 단락에서 2차 분포 유사도를 적용했을 때 가장 우수한 성능을 나타냈다. 이후, 용어 클러스터링 결과를 이용하여 단일문서의 키워드를 추출하기 위해 단순빈도와 상대빈도의 조합을 통해 다양한 키워드 추출 공식을 도출, 적용한 결과, 단락빈도와 단어빈도×역단락빈도 조건에서 가장 우수한 결과를 나타냈다. 이 결과를 통해, 본 연구에서 제안한 알고리즘은 좋은 키워드가 가져야 할 두 가지 조건인 주제성과 고른 빈도분포라는 측면에서 단일문서를 대상으로 효과적으로 키워드를 추출할 수 있음을 확인하였다.

      더보기

      참고문헌 (Reference)

      1 김수연, "텍스트 마이닝 기법을 이용한 연관용어 선정에 관한 실험적 연구" 한국정보관리학회 23 (23): 147-166, 2006

      2 한승희, "클러스터링 기법을 이용한 개별문서의 지식구조 자동 생성에 관한 연구" 한국정보관리학회 21 (21): 251-268, 2004

      3 유사라, "정보학연구와 분석방법론" 나남출판 1999

      4 정영미, "정보검색연구" 구미무역 2005

      5 정영미, "정보검색론" 구미무역 1993

      6 이주호,김학수, "의존관계를 이용한 단일문서의 키워드 추출" 36 (36): 293-296, 2009

      7 서은경, "용어의 자동분류에 관한 연구" 1 (1): 78-99, 1984

      8 이재윤, "분포 유사도를 이용한 문헌클러스터링의 성능향상에 대한 연구" 한국정보관리학회 24 (24): 267-283, 2007

      9 Tombros, Anastasios, "The Effects of Query-based Hierarchical Clustering of Documents for Information Retrieval" Cornell University 2002

      10 Leweis, David D., "Term clustering of syntactic phrases" 385-404, 1990

      1 김수연, "텍스트 마이닝 기법을 이용한 연관용어 선정에 관한 실험적 연구" 한국정보관리학회 23 (23): 147-166, 2006

      2 한승희, "클러스터링 기법을 이용한 개별문서의 지식구조 자동 생성에 관한 연구" 한국정보관리학회 21 (21): 251-268, 2004

      3 유사라, "정보학연구와 분석방법론" 나남출판 1999

      4 정영미, "정보검색연구" 구미무역 2005

      5 정영미, "정보검색론" 구미무역 1993

      6 이주호,김학수, "의존관계를 이용한 단일문서의 키워드 추출" 36 (36): 293-296, 2009

      7 서은경, "용어의 자동분류에 관한 연구" 1 (1): 78-99, 1984

      8 이재윤, "분포 유사도를 이용한 문헌클러스터링의 성능향상에 대한 연구" 한국정보관리학회 24 (24): 267-283, 2007

      9 Tombros, Anastasios, "The Effects of Query-based Hierarchical Clustering of Documents for Information Retrieval" Cornell University 2002

      10 Leweis, David D., "Term clustering of syntactic phrases" 385-404, 1990

      11 이성직, "TF‐IDF의 변형을 이용한 전자뉴스에서의 키워드 추출 기법" 한국전자거래학회 14 (14): 59-73, 2009

      12 Dagan, Ido, "Similarity-based models of cooccurrence probabilities" 34 (34): 43-69, 1999

      13 Callan, James P., "Passage-level evidence on document retrieval" 302-310, 1994

      14 Sneath, P. H. A., "Numerical Taxonomy" Freeman 1973

      15 ] Lee, Lillan, "Measures of distributional similarity" 25-32, 1999

      16 Weeds, J. E., "Measures and Applications of Lexical Distributional Similarity" University of Sussex 2003

      17 Turney, Peter D., "Learning algorithm for keyphrase extraction" 2 (2): 303-336, 2000

      18 Suzuki, Y., "Keyword extraction of radio news using term weighting with an encyclopedia and newspaper articles" 373-374, 1998

      19 Matzuo, Y., "Keyword extraction from a single document using word co-occurrence statistical information" 13 (13): 157-169, 2004

      20 Witten, Ian H., "KEA: practical automatic keyphrase extraction" 254-255, 1999

      21 Kullback, Solomon, "Information Theory and Statistics" Dover Books 1968

      22 Strehl, Alexander, "Impact of similarity measures on web-page clustering" 58-64, 2000

      23 Al-Khalifa, "Folksonomies versus automatic keyword extraction: an empirical study" 2 : 132-143, 2006

      24 Liu, M., "Extractive summarization based on event term clustering" 185-188, 2007

      25 Zobel, J., "Efficient Retrieval of Partial Documents" 31 (31): 36-377, 1995

      26 Lin, J., "Divergence measures based on the Shannon entropy" 37 (37): 145-151, 1991

      27 Pereira, F., "Distributional clustering of English words" 183-190, 1993

      28 Plas, L. van der, "Automatic keyword extraction from spoken text" 2205-2208, 2004

      29 Sparck Jones, K., "Automatic indexing" 30 (30): 393-432, 1972

      30 Hulth, A., "Automatic Keyword Extraction Using Domain Knowledge" 2004/2010 : 472-482, 2010

      31 Sparck Jones, K., "Automatic Keyword Classification for Information Retrieval" Butterworth&Co 1971

      32 White, H. D., "Author cocitation: a literature measure of intellectual structure" 32 : 163-171, 1981

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2023 평가예정 계속평가 신청대상 (등재유지)
      2018-01-01 평가 우수등재학술지 선정 (계속평가)
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2013-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2006-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2004-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2001-07-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      1999-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.59 0.59 0.68
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.69 0.67 0.952 0.33
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼