RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 전자상거래에서 정보추출 규칙과 Ontology생성을 위한 인터페이스 에이전트

        서희경(Heekyoung Seo),양재영(Jaeyoung Yang),구남숙(Namsuk Koo),최중민(Joongmin Choi) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.2Ⅱ

        인터넷의 증가로 온라인 상점들의 수는 매우 빠르게 증가하고 있다. 상점의 수가 늘어날 수록 사용자가 이러한 상점들에서 원하는 정보를 찾는 일은 쉽지 않다. 사용자의 어려움을 줄이고자 여러 쇼핑몰의 정보들을 통합해서 보여주는 전자상거래 통합 시스템들이 생겨나고 있지만, 새로운 쇼핑몰이 추가될 때마다 관리자가 추가되는 쇼핑몰의 정보를 추출하기 위한 규칙이나, Ontology등을 수동으로 만들거나 확장해야 하기 때문에 사람이 소비해야 하는 시간과 노력이 많고, 시스템을 관리하는 사람에 따라 정보추출의 정확도도 다르다. 따라서 사람이 소비하는 시간을 줄이고, 좀더 정확한 정보추출을 위해 쇼핑몰마다 만들어야 하는 규칙과 그러한 규칙 생성에 필요한 Ontology를 자동으로 생성하는 방법과 이 방법에서 요구되는 사용자의 입력을 최소한 줄인 인터페이스 에이전트를 제안한다.

      • XML 기반의 Wrapper 자동 생성 에이전트

        서희경(Heekyoung Seo),양재영(Jaeyoung Yang),정현섭(Hyunsup Jung),최중민(Joongmin Choi) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.2Ⅱ

        본 논문은 사용자를 대신해서 웹상의 여러 곳에 존재하는 정보를 추출하고 통합하여 사용자에게 제공하기 위한 에이전트 시스템을 설계하고자 한다. 정확한 정보 추출을 위해서는 추출하고자 하는 정보의 위치를 찾아내는 정보 추출 규칙이 요구된다. 이러한 규칙을 알아내기 위해서 본 논문에서 제안하는 시스템은 XML로 기술된 도메인 지식을 이용한다. 이 도메인 지식은 논리적 라인의 의미 분석에 사용되며, 논리적 라인의 의미를 기반으로 도메인 문서에서 추출해야 하는 정보의 패턴을 학습한다. 학습된 패턴에서 XML로 기술된 규칙을 생성하는데, 이 규칙은 Wrapper 이 된다. 이렇게 생성된 규칙을 이용해서 정보를 추출하게 되며, 추출된 정보를 통합해서 사용자에게 제공하게 된다.

      • KCI등재

        준구조화된 정보소스에 대한 지식기반의 Wrapper 학습 에이전트

        서희경(Heekyoung Seo),양재영(Jaeyoung Yang),최중민(Joongmin Choi) 한국정보과학회 2002 정보과학회논문지 : 소프트웨어 및 응용 Vol.29 No.1·2

        정보추출은 한 문서에서 그 문서의 중심적 의미를 나타내는 특정 구성요소를 인식하여 추출하는 작업이다. 기존의 정보추출 시스템은 대부분 정보추출 규칙인 wrapper를 수동으로 구성하여 적용하였기 때문에 추출의 정확성은 높지만 유연성, 확장성, 효율성의 측면에서 문제점이 발생하였다. Wrapper를 자동으로 생성하는 일부 연구에서도 도메인 지식의 획득과 표현의 어려움, 그리고 여러 정보소스 사이에 나타나는 문서형태의 구조적 이질성 때문에 정확한 정보추출이 이루어지지 못했다. 본 논문에서는 이러한 이질적이고 복잡한 형태의 실세계 정보소스로부터의 정확한 정보추출을 추구하는 정보추출 에이전트인 XTROS를 제안한다. XTROS는 도메인 지식을 이용하여 준구조화된 형태의 정보소스에서 제공하는 문서를 분석하고 학습하여 wrapper들을 자동으로 생성하고, 이 wrapper들을 이용하여 정보추출과 정보통합을 수행한다. 본 논문에서는 특별히 도메인 지식과 wrapper를 모두 XML 문서의 형태로 구성하는 새로운 표현기법을 제시함으로써 도메인 지식표현의 용이성과 wrapper 해석기 구현의 간결함, XML이 지닌 이식성 등을 최대한 활용하고자 하였다. Wrapper의 정보추출 규칙은 도메인 지식과 샘플 문서를 이용하여 자동으로 생성된다. 정보추출 규칙을 자동으로 생성하는 알고리즘의 핵심은 도메인 지식을 바탕으로 샘플 문서의 각 논리 라인에 의미를 부여하고 이 논리 라인 의미의 나열로부터 반복되는 패턴을 찾아내는 것이다. 이 패턴의 위치와 구조를 XML 문서로 표현한 것이 wrapper가 된다. XTROS 시스템을 부동산 매물정보를 제공하는 다수의 실제 웹 정보소스에 대해서 테스트한 결과 이질성과 복잡성을 가진 대부분의 정보소스로부터 정확한 wrapper 생성과 정보추출이 가능하였다. Information extraction(IE) is a process of recognizing and fetching particular information fragments from a document. In previous work, most IE systems generate the extraction rules called the wrappers manually, and although this manual wrapper generation may achieve more correct extraction, it reveals some problems in flexibility, extensibility, and efficiency. Some other researches that employ automatic ways of generating wrappers are also experiencing difficulties in acquiring and representing useful domain knowledge and in coping with the structural heterogeneity among different information sources, and as a result, the real-world information sources with complex document structures could not be correctly analyzed. In order to resolve these problems, this paper presents an agent-based information extraction system named XTROS that exploits the domain knowledge to learn from documents in a semi-structured information source. This system generates a wrapper for each information source automatically and performs information extraction and information integration by applying this wrapper to the corresponding source. In XTROS, both the domain knowledge and the wrapper are represented as XML-type documents. The wrapper generation algorithm first recognizes the meaning of each logical line of a sample document by using the domain knowledge, and then finds the most frequent pattern from the sequence of semantic representations of the logical lines. Eventually, the location and the structure of this pattern represented by an XML document becomes the wrapper. By testing XTROS on several real-estate information sites, we claim that it creates the correct wrappers for most Web sources and consequently facilitates effective information extraction and integration for heterogeneous and complex information sources.

      • 분산환경에서의 협력적 변화감시 에이전트

        양재영(Jaeyoung Yang),서희경(Heekyoung Seo),최중민(Joongmin Choi) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.2Ⅱ

        본 논문에서는 분산 협력 에이전트를 이용하여 정보 변화를 빠르게 감지할 수 있는 에이전트 시스템을 제안하고자 한다. 일반적인 정보 변화 에이전트는 중앙 집중적인 구조를 가지고 있으며 일정한 시간 간격마다 정보 변화 여부를 검사하게 된다. 본 논문에서는 중앙 집중적인 구조가 가지고 있는 서버의 과부하 및 블러킹 문제를 분산 환경의 협력 에이전트를 이용하여 해결하고자 한다. 같은 웹 페이지의 정보 변화를 감시하는 에이전트간 협력을 통해 새로운 정보의 갱신된 사실을 알게 되면 에이전트는 같은 그룹에 속한 다른 에이전트들에게 이 사실을 알림으로써 보다 빠르게 정보 변화를 감지할 수 있다. 또한 에이전트가 사용하는 네트웍 사용을 줄일 수 있게 된다.

      • 비교쇼핑을 위한 쇼핑몰 학습 에이전트

        구남숙(Namsuk Koo),양재영(Jaeyoung Yang),서희경(Heekyoung Seo),최중민(Joongmin Choi) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.2Ⅱ

        전자상거래는 서비스 제공자마다의 특정 인터페이스를 가진다. 그렇기 때문에 사용자는 원하는 결과를 얻고자 검색에 많은 시간과 노력을 투자해야 한다. 그래서 여러 쇼핑몰을 통합하여 사용자에게 결과를 제공하는 쇼핑 에이전트가 연재 여러 분야에서 연구되고 있다. 그러나 현재 개발된 쇼핑 에이전트들은 대부분 새로운 도메인이 추가되면 쇼핑몰에 대한 규칙을 수동작성 해야 한다는 문제점을 갖고 있다. 본 논문에서는 기존 쇼핑 에이전트의 이러한 한계를 극복하기 위한 쇼핑몰 학습을 위한 패턴생성 알고리즘을 제안하고, 이 알고리즘을 이용한 시스템을 구현하였다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼