본 논문에서는 위키피디아 인포박스 질의응답의 질문분석을 위한 페이지 제목 인식과 인포박스 속성제약 방법을 제안한다. 위키피디아는 반구조화된 지식정보로서, 페이지 제목, 본문, 인...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A99767377
2013
Korean
KCI등재
학술저널
544-557(14쪽)
0
0
상세조회0
다운로드국문 초록 (Abstract)
본 논문에서는 위키피디아 인포박스 질의응답의 질문분석을 위한 페이지 제목 인식과 인포박스 속성제약 방법을 제안한다. 위키피디아는 반구조화된 지식정보로서, 페이지 제목, 본문, 인...
본 논문에서는 위키피디아 인포박스 질의응답의 질문분석을 위한 페이지 제목 인식과 인포박스 속성제약 방법을 제안한다. 위키피디아는 반구조화된 지식정보로서, 페이지 제목, 본문, 인포박스 등의 정보가 포함되어 있다. 특히 인포박스는 페이지 제목과 관련된 중요정보를 테이블형식의 구조화된 방식으로 기술하고 있다. 따라서, 위키피디아 인포박스 질의응답을 위해 질문에 포함된 위키피디아 페이지 제목과 인포박스 속성정보를 인식하는 것이 매우 중요하다. 본 논문은 페이지 제목 인식과 인포박스 속성정보 인식을 위해 명사기준 가변길이 슬라이딩 윈도우 방법과 어휘-의미 패턴을 이용한 방법을 제안한다. 그리고, 페이지 제목 인식 향상을 위한 음절기준 가변길이 슬라이딩 윈도우 방법을 제안한다. 인포박스 속성제약을 위해 정답유형에 기반한 제약방법을 제안한다. 평가데이터로 위키피디아 인포박스를 대상으로 한 질문 398개를 수작업으로 구축하였다. 실험결과, 질문 내 페이지 제목과 인포박스 속성 쌍의 인식 정밀도가 60.05%였다. 이는 위키피디아 인포박스를 대상으로 한 질문의 약 60%는 페이지 또는 단락검색과 정답추출 없이도 정답추출이 가능함을 의미한다.
다국어 초록 (Multilingual Abstract)
Concerning the question analysis for Wikipedia Infobox Q&A, this paper proposes a method for recognizing the title of a Wikipedia page, and restricting the Infobox attributes. Wikipedia is a semi-structured knowledge source which incorporates variety ...
Concerning the question analysis for Wikipedia Infobox Q&A, this paper proposes a method for recognizing the title of a Wikipedia page, and restricting the Infobox attributes. Wikipedia is a semi-structured knowledge source which incorporates variety of information, such as titles, contents, and Infobox. Infobox is especially significant since it describes title-related information in a structured fashion using tables. Therefore, to successfully perform Wikipedia Infobox Q&A, it is essential to recognize titles and Infobox attributes included in the queries. This paper proposes noun-based variable-length sliding window method and lexico-semantic pattern method for the respective recognition tasks. To further increase the performance of title recognition, we additionally use syllable-based variable-length sliding window method. To restrict the space of Infobox attributes, we apply a method based on answer types. 398 Infobox-related questions were manually constructed for evaluation. Experiments showed that the precision for recognizing titles and Infobox attributes in the questions was 60.05%. This suggests that approximately 60% of the Infobox-related questions could be answered without having to search and extract answers from the contents.
목차 (Table of Contents)
참고문헌 (Reference)
1 허정, "오픈 도메인 질의응답을 위한 검색문서 제약 및 정답유형 분류기술" 한국정보과학회 39 (39): 118-132, 2012
2 J. Chu-Carrol., "Textual resource acquisition and engineering" 56 (56): 2012
3 J. M. Prager., "Special Questions and techniques" 56 (56): 2012
4 A. Lally., "Question analysis : How Watson reads a clue" 56 (56): 2012
5 Hoa Trang Dang., "Overview of the TREC 2007 Question Answering Track" 7 : 63-80, 2007
6 Heng Ji., "Overview of the TAC2010 Knowledge Base Population Track" 2010
7 Davide Buscaldi., "Mining Knowledge from Wikipedia for the Question Answering task" 727-730, 2006
8 Jennifer Chu-Carroll., "Leveraging Wikipedia Characteristics for Search and Candidate Generation in Question Answering" 2011
9 John Burger., "Issues, Tasks and Program Structures to Roadmap Research in Question & Answering(Q&A)" 2001
10 D. A. Ferrucci, "Introduction to "This is Watson"" 56 (56): 2012
1 허정, "오픈 도메인 질의응답을 위한 검색문서 제약 및 정답유형 분류기술" 한국정보과학회 39 (39): 118-132, 2012
2 J. Chu-Carrol., "Textual resource acquisition and engineering" 56 (56): 2012
3 J. M. Prager., "Special Questions and techniques" 56 (56): 2012
4 A. Lally., "Question analysis : How Watson reads a clue" 56 (56): 2012
5 Hoa Trang Dang., "Overview of the TREC 2007 Question Answering Track" 7 : 63-80, 2007
6 Heng Ji., "Overview of the TAC2010 Knowledge Base Population Track" 2010
7 Davide Buscaldi., "Mining Knowledge from Wikipedia for the Question Answering task" 727-730, 2006
8 Jennifer Chu-Carroll., "Leveraging Wikipedia Characteristics for Search and Candidate Generation in Question Answering" 2011
9 John Burger., "Issues, Tasks and Program Structures to Roadmap Research in Question & Answering(Q&A)" 2001
10 D. A. Ferrucci, "Introduction to "This is Watson"" 56 (56): 2012
11 Ulli Waltinger, "Interfacing Virtual Agents With Collaborative Knowledge : Open Domain Question Answering Using Wikipedia-Based Topic Models" 3 : 1896-1902, 2011
12 A. Kalyanpur., "Fact-based question decomposition in DeepQA" 56 (56): 2012
13 D. Roussinov., "Beyond Keywords : Automated Question Answering on the Web" 51 (51): 2008
14 E. Ukkonen, "Approximate String Matching with q-Grams and Maximal Matches" 92 (92): 1992
15 Davide Buscaldi., "A Bag-of-Words based Ranking method for the Wikipedia Question Answering task" 2007
폭소노미 기반에서 분위기 태그와 음악 AV 태그를 이용한 음악검색 방법
단백질의 세포내 위치 예측을 위한 강화된 접미사 배열 기반의 고속 서열탐색
유즈케이스 시나리오에서 유즈케이스 패턴을 이용한 요구사항 대체 흐름 추천 기법
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2014-09-01 | 평가 | 학술지 통합(기타) | |
2013-04-26 | 학술지명변경 | 한글명 : 정보과학회논문지 : 소프트웨어 및 응용</br>외국어명 : Journal of KIISE : Software and Applications | ![]() |
2011-01-01 | 평가 | 등재학술지 유지(등재유지) | ![]() |
2009-01-01 | 평가 | 등재학술지 유지(등재유지) | ![]() |
2008-10-17 | 학술지명변경 | 한글명 : 정보과학회논문지 : 소프트웨어 및 응용</br>외국어명 : Journal of KISS : Software and Applications | ![]() |
2007-01-01 | 평가 | 등재학술지 유지(등재유지) | ![]() |
2005-01-01 | 평가 | 등재학술지 유지(등재유지) | ![]() |
2002-01-01 | 평가 | 등재학술지 선정(등재후보2차) | ![]() |