RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      술어-논항 구조의 어휘 패턴을 이용한 스트링 커널 기반 관계 추출 = String Kernel-based Relation Extraction using Lexical Patterns of Predicate-Argument Structure

      한글로보기

      https://www.riss.kr/link?id=A99532999

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      문서 내에 존재하는 핵심개체들 간의 다양한 상호작용을 정확하게 파악하고 활용하기 위해서는 관계 추출 기술이 필수적이다. 스트링 커널을 이용한 관계 추출은 커널의 입력으로 사용되는...

      문서 내에 존재하는 핵심개체들 간의 다양한 상호작용을 정확하게 파악하고 활용하기 위해서는 관계 추출 기술이 필수적이다. 스트링 커널을 이용한 관계 추출은 커널의 입력으로 사용되는 스트링을 효과적으로 구성하는 것이 커널 계산 속도나 정확성 측면에서 중요한 요소임에도 불구하고 기존 연구에서는 입력 스트링을 효과적으로 구성하지 못했다. 본 논문에서는 개체 쌍 사이에 존재하는 술어-논항 구조의 어휘 패턴 문자열을 정규화해서 스트링 커널에 적용하는 방법을 제안한다. 술어-논항 구조 패턴은 문장을 구성하는 모든 단어에 대한 술어-논항 관계 그래프에서 중요하게 지정된 두 개체를 연결하는 최소집합의 술어-논항으로 구성된 순서 열로서, 문장 내에서 상호작용하는 두 개체 간의 연관관계를 표현해주는 중요한 단서 정보가 된다. 제안된 시스템의 평가를 위해서 과학기술문헌에 존재하는 핵심개체들 간의 연관관계 추출 성능을 평가하는 테스트컬렉션을 구축하여 실험을 진행하였다. 정확도 측정 결과, 스트링커널의 입력으로 문장 전체를 사용한 경우에는 55.07%, 개체 쌍 사이의 문자열을 사용한 경우에는 61.04%, 그리고 술어-논항 구조의 어휘 패턴 문자열을 사용한 경우에는 69.14%로, 술어-논항 구조의 어휘 패턴 문자열을 사용했을 때 성능이 가장 좋게 나타났다. 결론적으로 문장 내의 술어-논항 구조를 분석하여 정규화된 어휘 패턴을 생성하고 이렇게 생성된 문자열을 스트링 커널에 적용하는 방법이 관계 추출에 유용한 방법임을 알 수 있었다.

      더보기

      다국어 초록 (Multilingual Abstract)

      The relation extraction is one of the most essential parts in text mining in order to capture various detailed interactions between entities found in documents. The previous research has not shown good results on how to effectively construct the input...

      The relation extraction is one of the most essential parts in text mining in order to capture various detailed interactions between entities found in documents. The previous research has not shown good results on how to effectively construct the input string of the kernel. Actually, it is very important in terms of efficiency and effectiveness of kernel computation. Therefore, we propose a string-kernel method which normalizes the syntactic pattern strings consisting of predicate-argument structures (PAS) existing between a pair of entities in a sentence. The pattern string is the minimumlength sequence of PASs out of all kinds of possible sequences for any pair of words in a sentence, which is a very important clue revealing the interconnection between two entities in a sentence. The proposed method has been implemented and performed experiments to prove its usefulness upon our own test collection designed for verifying the relationship between the entities in documents. The experiments shows that the proposed methods performed the best since its accuracy reaches 69.14% whereas 55.07% and 61.04% are the results of the other two comparison settings: one uses entire strings as the input for the kernel, the other receives all strings between two target entities. Consequently, we proved that the better performance could be obtained from the proposed string-kernel based method, which extracts the normalized lexical pattern consisting of predicate-argument structure in a sentence and then applies it to the string kernel method.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • 1. 서론
      • 2. 관련 연구
      • 3. 술어-논항 구조의 어휘 패턴을 이용한 스트링커널 기반 관계 추출
      • 요약
      • Abstract
      • 1. 서론
      • 2. 관련 연구
      • 3. 술어-논항 구조의 어휘 패턴을 이용한 스트링커널 기반 관계 추출
      • 4. 실험 및 분석
      • 5. 결론
      • 참고문헌
      더보기

      참고문헌 (Reference)

      1 최성필, "혼합 커널을 활용한 과학기술분야 용어간 관계 추출" 한국정보과학회 15 (15): 988-992, 2009

      2 최윤수, "과학기술 핵심개체 인식기술 통합에 관한 연구" 한국정보관리학회 28 (28): 89-104, 2011

      3 H. Lodhi, "Text Classification using String Kernels" 2 : 419-444, 2002

      4 R. C. Bunescu, "Subsequence Kernels for Relation Extraction" 9-16, 2006

      5 O. Etzioni, "Open information extraction from the web" 51 (51): 68-74, 2008

      6 J. L. Fleiss, "Measuring nominal scale agreement among many raters" 76 (76): 378-382, 1971

      7 C.-C. Chang, "LIBSVM: A library for support vector machines" 2 (2): 2011

      8 D. Zelenco, "Kernel Methods for Relation Extraction" 3 : 1083-1106, 2003

      9 J. Cowie, "Information extraction" 39 (39): 80-91, 1996

      10 S. V. N. Vishwanathan, "Graph Kernels" 11 : 1201-1242, 2010

      1 최성필, "혼합 커널을 활용한 과학기술분야 용어간 관계 추출" 한국정보과학회 15 (15): 988-992, 2009

      2 최윤수, "과학기술 핵심개체 인식기술 통합에 관한 연구" 한국정보관리학회 28 (28): 89-104, 2011

      3 H. Lodhi, "Text Classification using String Kernels" 2 : 419-444, 2002

      4 R. C. Bunescu, "Subsequence Kernels for Relation Extraction" 9-16, 2006

      5 O. Etzioni, "Open information extraction from the web" 51 (51): 68-74, 2008

      6 J. L. Fleiss, "Measuring nominal scale agreement among many raters" 76 (76): 378-382, 1971

      7 C.-C. Chang, "LIBSVM: A library for support vector machines" 2 (2): 2011

      8 D. Zelenco, "Kernel Methods for Relation Extraction" 3 : 1083-1106, 2003

      9 J. Cowie, "Information extraction" 39 (39): 80-91, 1996

      10 S. V. N. Vishwanathan, "Graph Kernels" 11 : 1201-1242, 2010

      11 Y. Miyao, "Feature Forest Models for Probabilistic HPSG Parsing" 34 (34): 35-80, 2008

      12 G. Zhou, "Exploring various knowledge in relation extraction" 427-434, 2005

      13 M. Zhang, "Exploring syntactic structured features over parse trees for relation extraction using kernel methods" 44 (44): 687-701, 2008

      14 M. Zhang, "Exploring syntactic features for relation extraction using a convolution tree kernel" 288-295, 2006

      15 A. Culotta, "Dependency Tree Kernels for Relation Extraction" 2004

      16 N. Kambhatla, "Combining Lexical, Syntactic, and Semantic Features with Maximum Entropy Models for Extracting Relations" 2004

      17 A. Yakushiji, "Automatic Construction of Predicate-argument Structure Patterns for Biomedical Information Extraction" 284-292, 2006

      18 N. Cristianini, "An Introduction to Support Vector Machines and Other Kernel-based Learning Methods" Cambridge University Press 2000

      19 A. Airola, "All-paths graph kernel for protein-protein interaction extraction with evaluation of cross-corpus learning" 9 (9): S2-, 2008

      20 R. C. Bunescu, "A Shortest Path Dependency Kernel for Relation Extraction" 724-731, 2005

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2014-09-01 평가 학술지 통합(기타)
      2013-04-26 학술지명변경 한글명 : 정보과학회논문지 : 소프트웨어 및 응용</br>외국어명 : Journal of KIISE : Software and Applications KCI등재
      2011-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2008-10-17 학술지명변경 한글명 : 정보과학회논문지 : 소프트웨어 및 응용</br>외국어명 : Journal of KISS : Software and Applications KCI등재
      2007-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2005-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2002-01-01 평가 등재학술지 선정(등재후보2차) KCI등재
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼