문장 기반 웹 문서 검색 시스템 = Web document retrieval system based on sentential information|RISS 상세보기

국문 초록 (Abstract)

매일 엄청난 수의 웹페이지가 새로 생겨나고 있는 정보의 바다에서 필요한 정보를 정확히 찾아 주는 것은 매우 중요한 문제이나 이를 달성하는 것은 쉽지않다. 이를 위해서 본 논문에서는 사용자가 입력하는 검색 질의문에 가장 적합한 문서 몇 개 만을 찾아주는 문제인 Named page finding 문제를 다루었다. 이 문제에 대한 현재의 정보검색 시스템은 질의문에 포함되어 있는 단어들이 검색 대상 문서에서도 포함되어 있는지에 대한 정보 만을 가지고 판단하기 때문에 그리 좋은 결과를 주지 못하고 있다.
본 논문에서는 위와 같은 문제점에 대해 대처하고자 질의문에 있는 단어들에 대해 문서 안에 포함되어 있는지의 여부뿐만 아니라 이러한 단어들이 같은 문장에 포함되어 있는지의 여부도 이용하는 문장기반 웹 문서 검색 기법을 제안하였다. 질의문에 속한 단어들이 모두 같은 문장에 포함되어 있으면 그렇지 않은 다른 문서보다 우선 순위가 높은 검색 결과로 출력되도록 하였다. 또한 본 연구에서는 웹 문서 안의 링크 및 그 링크가 걸린 앵커텍스트가 제공하는 정보도 이용되도록 하였다. 그 결과 정보 요구에 정확히 맞는 문서를 찾는 웹 문서 검색 시스템의 성능을 향상시킬 수 있음을 실험을 통하여 관찰하였다.

번역하기

매일 엄청난 수의 웹페이지가 새로 생겨나고 있는 정보의 바다에서 필요한 정보를 정확히 찾아 주는 것은 매우 중요한 문제이나 이를 달성하는 것은 쉽지않다. 이를 위해서 본 논문에서는 ...

다국어 초록 (Multilingual Abstract)

A huge number of Web documents are appearing everyday. It is important to be able to retrieve the right exact documents that are wanted by the user. However, it is not easy to achieve this capability. This thesis is concerned about the related problem called “named page finding” which is to retrieve the Web pages that contain the exact information requested by the user. The current information retrieval systems do not show good performance since they make decisions only based on the co-occurrence of words between the document and the query.
To improve performance this thesis suggests that co-occurrence of words between the sentences and the query should also be used. The main idea is that a sentence which has many common words with the query is one of the major sources of contribution to the relevance of the document. A document with many such sentences will receive higher relevance score than those without such sentences. This research also makes use of the links and the anchor texts in the Web pages. It has been observed in the experiments that the approach taken by this thesis can greatly improve the performance of the system.

번역하기

목차 (Table of Contents)

차례
그림 차례 = ⅱ
표 차례 = ⅳ
국문 요약 = ⅴ
제1장 서론 = 1

차례
그림 차례 = ⅱ
표 차례 = ⅳ
국문 요약 = ⅴ
제1장 서론 = 1
1.1 연구 배경 = 1
1.2 연구 목표 = 3
제2장 관련 연구 = 5
2.1 기존 색인 = 5
2.2 기존 검색 = 10
제3장 웹 문서 색인 기법 = 14
3.1 웹 문서 처리 방법 = 14
3.2 문장 기반 고속 색인 = 20
제4장 웹 문서 검색 기법 = 26
4.1 기본 검색 모델 : VS = 29
4.2 문장 기반 검색 모델 : VS_S = 31
4.3 링크를 이용한 검색 결과 확장 = 33
4.4 링크 정보를 이용한 유사도 재계산 = 42
제5장 실험 및 결과 = 47
5.1 파라미터 결정 = 47
5.2 검색 기법의 비교 = 53
5.3 계층화 사용유무의 비교 실험 = 57
5.4 Anchor Text 이용 방법의 실험 = 58
5.5 실험 결과 = 58
제6장 결론 = 60
참고문헌 = 61
ABSTRACT = 63

상세검색

RISS 보유자료

상세검색

해외전자자료

문장 기반 웹 문서 검색 시스템 = Web document retrieval system based on sentential information

부가정보

분석정보

연관 공개강의(KOCW)

이 자료와 함께 이용한 RISS 자료

나만을 위한 추천자료