RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      문장 기반 웹 문서 검색 시스템 = Web document retrieval system based on sentential information

      한글로보기

      https://www.riss.kr/link?id=T8615649

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      매일 엄청난 수의 웹페이지가 새로 생겨나고 있는 정보의 바다에서 필요한 정보를 정확히 찾아 주는 것은 매우 중요한 문제이나 이를 달성하는 것은 쉽지않다. 이를 위해서 본 논문에서는 사용자가 입력하는 검색 질의문에 가장 적합한 문서 몇 개 만을 찾아주는 문제인 Named page finding 문제를 다루었다. 이 문제에 대한 현재의 정보검색 시스템은 질의문에 포함되어 있는 단어들이 검색 대상 문서에서도 포함되어 있는지에 대한 정보 만을 가지고 판단하기 때문에 그리 좋은 결과를 주지 못하고 있다.
      본 논문에서는 위와 같은 문제점에 대해 대처하고자 질의문에 있는 단어들에 대해 문서 안에 포함되어 있는지의 여부뿐만 아니라 이러한 단어들이 같은 문장에 포함되어 있는지의 여부도 이용하는 문장기반 웹 문서 검색 기법을 제안하였다. 질의문에 속한 단어들이 모두 같은 문장에 포함되어 있으면 그렇지 않은 다른 문서보다 우선 순위가 높은 검색 결과로 출력되도록 하였다. 또한 본 연구에서는 웹 문서 안의 링크 및 그 링크가 걸린 앵커텍스트가 제공하는 정보도 이용되도록 하였다. 그 결과 정보 요구에 정확히 맞는 문서를 찾는 웹 문서 검색 시스템의 성능을 향상시킬 수 있음을 실험을 통하여 관찰하였다.
      번역하기

      매일 엄청난 수의 웹페이지가 새로 생겨나고 있는 정보의 바다에서 필요한 정보를 정확히 찾아 주는 것은 매우 중요한 문제이나 이를 달성하는 것은 쉽지않다. 이를 위해서 본 논문에서는 ...

      매일 엄청난 수의 웹페이지가 새로 생겨나고 있는 정보의 바다에서 필요한 정보를 정확히 찾아 주는 것은 매우 중요한 문제이나 이를 달성하는 것은 쉽지않다. 이를 위해서 본 논문에서는 사용자가 입력하는 검색 질의문에 가장 적합한 문서 몇 개 만을 찾아주는 문제인 Named page finding 문제를 다루었다. 이 문제에 대한 현재의 정보검색 시스템은 질의문에 포함되어 있는 단어들이 검색 대상 문서에서도 포함되어 있는지에 대한 정보 만을 가지고 판단하기 때문에 그리 좋은 결과를 주지 못하고 있다.
      본 논문에서는 위와 같은 문제점에 대해 대처하고자 질의문에 있는 단어들에 대해 문서 안에 포함되어 있는지의 여부뿐만 아니라 이러한 단어들이 같은 문장에 포함되어 있는지의 여부도 이용하는 문장기반 웹 문서 검색 기법을 제안하였다. 질의문에 속한 단어들이 모두 같은 문장에 포함되어 있으면 그렇지 않은 다른 문서보다 우선 순위가 높은 검색 결과로 출력되도록 하였다. 또한 본 연구에서는 웹 문서 안의 링크 및 그 링크가 걸린 앵커텍스트가 제공하는 정보도 이용되도록 하였다. 그 결과 정보 요구에 정확히 맞는 문서를 찾는 웹 문서 검색 시스템의 성능을 향상시킬 수 있음을 실험을 통하여 관찰하였다.

      더보기

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      A huge number of Web documents are appearing everyday. It is important to be able to retrieve the right exact documents that are wanted by the user. However, it is not easy to achieve this capability. This thesis is concerned about the related problem called “named page finding” which is to retrieve the Web pages that contain the exact information requested by the user. The current information retrieval systems do not show good performance since they make decisions only based on the co-occurrence of words between the document and the query.
      To improve performance this thesis suggests that co-occurrence of words between the sentences and the query should also be used. The main idea is that a sentence which has many common words with the query is one of the major sources of contribution to the relevance of the document. A document with many such sentences will receive higher relevance score than those without such sentences. This research also makes use of the links and the anchor texts in the Web pages. It has been observed in the experiments that the approach taken by this thesis can greatly improve the performance of the system.
      번역하기

      A huge number of Web documents are appearing everyday. It is important to be able to retrieve the right exact documents that are wanted by the user. However, it is not easy to achieve this capability. This thesis is concerned about the related problem...

      A huge number of Web documents are appearing everyday. It is important to be able to retrieve the right exact documents that are wanted by the user. However, it is not easy to achieve this capability. This thesis is concerned about the related problem called “named page finding” which is to retrieve the Web pages that contain the exact information requested by the user. The current information retrieval systems do not show good performance since they make decisions only based on the co-occurrence of words between the document and the query.
      To improve performance this thesis suggests that co-occurrence of words between the sentences and the query should also be used. The main idea is that a sentence which has many common words with the query is one of the major sources of contribution to the relevance of the document. A document with many such sentences will receive higher relevance score than those without such sentences. This research also makes use of the links and the anchor texts in the Web pages. It has been observed in the experiments that the approach taken by this thesis can greatly improve the performance of the system.

      더보기

      목차 (Table of Contents)

      • 차례
      • 그림 차례 = ⅱ
      • 표 차례 = ⅳ
      • 국문 요약 = ⅴ
      • 제1장 서론 = 1
      • 차례
      • 그림 차례 = ⅱ
      • 표 차례 = ⅳ
      • 국문 요약 = ⅴ
      • 제1장 서론 = 1
      • 1.1 연구 배경 = 1
      • 1.2 연구 목표 = 3
      • 제2장 관련 연구 = 5
      • 2.1 기존 색인 = 5
      • 2.2 기존 검색 = 10
      • 제3장 웹 문서 색인 기법 = 14
      • 3.1 웹 문서 처리 방법 = 14
      • 3.2 문장 기반 고속 색인 = 20
      • 제4장 웹 문서 검색 기법 = 26
      • 4.1 기본 검색 모델 : VS = 29
      • 4.2 문장 기반 검색 모델 : VS_S = 31
      • 4.3 링크를 이용한 검색 결과 확장 = 33
      • 4.4 링크 정보를 이용한 유사도 재계산 = 42
      • 제5장 실험 및 결과 = 47
      • 5.1 파라미터 결정 = 47
      • 5.2 검색 기법의 비교 = 53
      • 5.3 계층화 사용유무의 비교 실험 = 57
      • 5.4 Anchor Text 이용 방법의 실험 = 58
      • 5.5 실험 결과 = 58
      • 제6장 결론 = 60
      • 참고문헌 = 61
      • ABSTRACT = 63
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼