RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      질의응답에서 위키피디아 인포박스에서의 답변추출을 위한 페이지 제목과 인포박스 속성 인식 = Recognizing Page Title and Infobox Attribute for Answer Extraction from Wikipedia Infobox

      한글로보기

      https://www.riss.kr/link?id=A99767377

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      본 논문에서는 위키피디아 인포박스 질의응답의 질문분석을 위한 페이지 제목 인식과 인포박스 속성제약 방법을 제안한다. 위키피디아는 반구조화된 지식정보로서, 페이지 제목, 본문, 인포박스 등의 정보가 포함되어 있다. 특히 인포박스는 페이지 제목과 관련된 중요정보를 테이블형식의 구조화된 방식으로 기술하고 있다. 따라서, 위키피디아 인포박스 질의응답을 위해 질문에 포함된 위키피디아 페이지 제목과 인포박스 속성정보를 인식하는 것이 매우 중요하다. 본 논문은 페이지 제목 인식과 인포박스 속성정보 인식을 위해 명사기준 가변길이 슬라이딩 윈도우 방법과 어휘-의미 패턴을 이용한 방법을 제안한다. 그리고, 페이지 제목 인식 향상을 위한 음절기준 가변길이 슬라이딩 윈도우 방법을 제안한다. 인포박스 속성제약을 위해 정답유형에 기반한 제약방법을 제안한다. 평가데이터로 위키피디아 인포박스를 대상으로 한 질문 398개를 수작업으로 구축하였다. 실험결과, 질문 내 페이지 제목과 인포박스 속성 쌍의 인식 정밀도가 60.05%였다. 이는 위키피디아 인포박스를 대상으로 한 질문의 약 60%는 페이지 또는 단락검색과 정답추출 없이도 정답추출이 가능함을 의미한다.
      번역하기

      본 논문에서는 위키피디아 인포박스 질의응답의 질문분석을 위한 페이지 제목 인식과 인포박스 속성제약 방법을 제안한다. 위키피디아는 반구조화된 지식정보로서, 페이지 제목, 본문, 인...

      본 논문에서는 위키피디아 인포박스 질의응답의 질문분석을 위한 페이지 제목 인식과 인포박스 속성제약 방법을 제안한다. 위키피디아는 반구조화된 지식정보로서, 페이지 제목, 본문, 인포박스 등의 정보가 포함되어 있다. 특히 인포박스는 페이지 제목과 관련된 중요정보를 테이블형식의 구조화된 방식으로 기술하고 있다. 따라서, 위키피디아 인포박스 질의응답을 위해 질문에 포함된 위키피디아 페이지 제목과 인포박스 속성정보를 인식하는 것이 매우 중요하다. 본 논문은 페이지 제목 인식과 인포박스 속성정보 인식을 위해 명사기준 가변길이 슬라이딩 윈도우 방법과 어휘-의미 패턴을 이용한 방법을 제안한다. 그리고, 페이지 제목 인식 향상을 위한 음절기준 가변길이 슬라이딩 윈도우 방법을 제안한다. 인포박스 속성제약을 위해 정답유형에 기반한 제약방법을 제안한다. 평가데이터로 위키피디아 인포박스를 대상으로 한 질문 398개를 수작업으로 구축하였다. 실험결과, 질문 내 페이지 제목과 인포박스 속성 쌍의 인식 정밀도가 60.05%였다. 이는 위키피디아 인포박스를 대상으로 한 질문의 약 60%는 페이지 또는 단락검색과 정답추출 없이도 정답추출이 가능함을 의미한다.

      더보기

      다국어 초록 (Multilingual Abstract)

      Concerning the question analysis for Wikipedia Infobox Q&A, this paper proposes a method for recognizing the title of a Wikipedia page, and restricting the Infobox attributes. Wikipedia is a semi-structured knowledge source which incorporates variety of information, such as titles, contents, and Infobox. Infobox is especially significant since it describes title-related information in a structured fashion using tables. Therefore, to successfully perform Wikipedia Infobox Q&A, it is essential to recognize titles and Infobox attributes included in the queries. This paper proposes noun-based variable-length sliding window method and lexico-semantic pattern method for the respective recognition tasks. To further increase the performance of title recognition, we additionally use syllable-based variable-length sliding window method. To restrict the space of Infobox attributes, we apply a method based on answer types. 398 Infobox-related questions were manually constructed for evaluation. Experiments showed that the precision for recognizing titles and Infobox attributes in the questions was 60.05%. This suggests that approximately 60% of the Infobox-related questions could be answered without having to search and extract answers from the contents.
      번역하기

      Concerning the question analysis for Wikipedia Infobox Q&A, this paper proposes a method for recognizing the title of a Wikipedia page, and restricting the Infobox attributes. Wikipedia is a semi-structured knowledge source which incorporates variety ...

      Concerning the question analysis for Wikipedia Infobox Q&A, this paper proposes a method for recognizing the title of a Wikipedia page, and restricting the Infobox attributes. Wikipedia is a semi-structured knowledge source which incorporates variety of information, such as titles, contents, and Infobox. Infobox is especially significant since it describes title-related information in a structured fashion using tables. Therefore, to successfully perform Wikipedia Infobox Q&A, it is essential to recognize titles and Infobox attributes included in the queries. This paper proposes noun-based variable-length sliding window method and lexico-semantic pattern method for the respective recognition tasks. To further increase the performance of title recognition, we additionally use syllable-based variable-length sliding window method. To restrict the space of Infobox attributes, we apply a method based on answer types. 398 Infobox-related questions were manually constructed for evaluation. Experiments showed that the precision for recognizing titles and Infobox attributes in the questions was 60.05%. This suggests that approximately 60% of the Infobox-related questions could be answered without having to search and extract answers from the contents.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • 1. 서론
      • 2. 관련연구
      • 3. 질의응답을 위한 위키피디아 구조분석
      • 요약
      • Abstract
      • 1. 서론
      • 2. 관련연구
      • 3. 질의응답을 위한 위키피디아 구조분석
      • 4. 위키피디아 인포박스 질의응답을 위한 질문분석
      • 5. 평가
      • 6. 결론
      • References
      더보기

      참고문헌 (Reference)

      1 허정, "오픈 도메인 질의응답을 위한 검색문서 제약 및 정답유형 분류기술" 한국정보과학회 39 (39): 118-132, 2012

      2 J. Chu-Carrol., "Textual resource acquisition and engineering" 56 (56): 2012

      3 J. M. Prager., "Special Questions and techniques" 56 (56): 2012

      4 A. Lally., "Question analysis : How Watson reads a clue" 56 (56): 2012

      5 Hoa Trang Dang., "Overview of the TREC 2007 Question Answering Track" 7 : 63-80, 2007

      6 Heng Ji., "Overview of the TAC2010 Knowledge Base Population Track" 2010

      7 Davide Buscaldi., "Mining Knowledge from Wikipedia for the Question Answering task" 727-730, 2006

      8 Jennifer Chu-Carroll., "Leveraging Wikipedia Characteristics for Search and Candidate Generation in Question Answering" 2011

      9 John Burger., "Issues, Tasks and Program Structures to Roadmap Research in Question & Answering(Q&A)" 2001

      10 D. A. Ferrucci, "Introduction to "This is Watson"" 56 (56): 2012

      1 허정, "오픈 도메인 질의응답을 위한 검색문서 제약 및 정답유형 분류기술" 한국정보과학회 39 (39): 118-132, 2012

      2 J. Chu-Carrol., "Textual resource acquisition and engineering" 56 (56): 2012

      3 J. M. Prager., "Special Questions and techniques" 56 (56): 2012

      4 A. Lally., "Question analysis : How Watson reads a clue" 56 (56): 2012

      5 Hoa Trang Dang., "Overview of the TREC 2007 Question Answering Track" 7 : 63-80, 2007

      6 Heng Ji., "Overview of the TAC2010 Knowledge Base Population Track" 2010

      7 Davide Buscaldi., "Mining Knowledge from Wikipedia for the Question Answering task" 727-730, 2006

      8 Jennifer Chu-Carroll., "Leveraging Wikipedia Characteristics for Search and Candidate Generation in Question Answering" 2011

      9 John Burger., "Issues, Tasks and Program Structures to Roadmap Research in Question & Answering(Q&A)" 2001

      10 D. A. Ferrucci, "Introduction to "This is Watson"" 56 (56): 2012

      11 Ulli Waltinger, "Interfacing Virtual Agents With Collaborative Knowledge : Open Domain Question Answering Using Wikipedia-Based Topic Models" 3 : 1896-1902, 2011

      12 A. Kalyanpur., "Fact-based question decomposition in DeepQA" 56 (56): 2012

      13 D. Roussinov., "Beyond Keywords : Automated Question Answering on the Web" 51 (51): 2008

      14 E. Ukkonen, "Approximate String Matching with q-Grams and Maximal Matches" 92 (92): 1992

      15 Davide Buscaldi., "A Bag-of-Words based Ranking method for the Wikipedia Question Answering task" 2007

      더보기

      동일학술지(권/호) 다른 논문

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2014-09-01 평가 학술지 통합(기타)
      2013-04-26 학술지명변경 한글명 : 정보과학회논문지 : 소프트웨어 및 응용</br>외국어명 : Journal of KIISE : Software and Applications KCI등재
      2011-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2008-10-17 학술지명변경 한글명 : 정보과학회논문지 : 소프트웨어 및 응용</br>외국어명 : Journal of KISS : Software and Applications KCI등재
      2007-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2005-01-01 평가 등재학술지 유지(등재유지) KCI등재
      2002-01-01 평가 등재학술지 선정(등재후보2차) KCI등재
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼