매일 엄청난 수의 웹페이지가 새로 생겨나고 있는 정보의 바다에서 필요한 정보를 정확히 찾아 주는 것은 매우 중요한 문제이나 이를 달성하는 것은 쉽지않다. 이를 위해서 본 논문에서는 ...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=T8615649
서울 : 연세대학교 대학원, 2003
학위논문(석사) -- 연세대학교 대학원 , 컴퓨터과학과·산업시스템공학과 , 2003. 2
2003
한국어
566.874 판사항(4)
서울
v, 63p. : 삽도 ; 26 cm.
지도교수: 나동렬
0
상세조회0
다운로드매일 엄청난 수의 웹페이지가 새로 생겨나고 있는 정보의 바다에서 필요한 정보를 정확히 찾아 주는 것은 매우 중요한 문제이나 이를 달성하는 것은 쉽지않다. 이를 위해서 본 논문에서는 ...
매일 엄청난 수의 웹페이지가 새로 생겨나고 있는 정보의 바다에서 필요한 정보를 정확히 찾아 주는 것은 매우 중요한 문제이나 이를 달성하는 것은 쉽지않다. 이를 위해서 본 논문에서는 사용자가 입력하는 검색 질의문에 가장 적합한 문서 몇 개 만을 찾아주는 문제인 Named page finding 문제를 다루었다. 이 문제에 대한 현재의 정보검색 시스템은 질의문에 포함되어 있는 단어들이 검색 대상 문서에서도 포함되어 있는지에 대한 정보 만을 가지고 판단하기 때문에 그리 좋은 결과를 주지 못하고 있다.
본 논문에서는 위와 같은 문제점에 대해 대처하고자 질의문에 있는 단어들에 대해 문서 안에 포함되어 있는지의 여부뿐만 아니라 이러한 단어들이 같은 문장에 포함되어 있는지의 여부도 이용하는 문장기반 웹 문서 검색 기법을 제안하였다. 질의문에 속한 단어들이 모두 같은 문장에 포함되어 있으면 그렇지 않은 다른 문서보다 우선 순위가 높은 검색 결과로 출력되도록 하였다. 또한 본 연구에서는 웹 문서 안의 링크 및 그 링크가 걸린 앵커텍스트가 제공하는 정보도 이용되도록 하였다. 그 결과 정보 요구에 정확히 맞는 문서를 찾는 웹 문서 검색 시스템의 성능을 향상시킬 수 있음을 실험을 통하여 관찰하였다.
다국어 초록 (Multilingual Abstract)
A huge number of Web documents are appearing everyday. It is important to be able to retrieve the right exact documents that are wanted by the user. However, it is not easy to achieve this capability. This thesis is concerned about the related problem...
A huge number of Web documents are appearing everyday. It is important to be able to retrieve the right exact documents that are wanted by the user. However, it is not easy to achieve this capability. This thesis is concerned about the related problem called “named page finding” which is to retrieve the Web pages that contain the exact information requested by the user. The current information retrieval systems do not show good performance since they make decisions only based on the co-occurrence of words between the document and the query.
To improve performance this thesis suggests that co-occurrence of words between the sentences and the query should also be used. The main idea is that a sentence which has many common words with the query is one of the major sources of contribution to the relevance of the document. A document with many such sentences will receive higher relevance score than those without such sentences. This research also makes use of the links and the anchor texts in the Web pages. It has been observed in the experiments that the approach taken by this thesis can greatly improve the performance of the system.
목차 (Table of Contents)