        페이지 랭크지수와 질의 확장을 이용한 재랭킹 방법

        김태환,전호철,최중민,Kim, Tae-Hwan,Jeon, Ho-Chul,Choi, Joong-Min 한국정보처리학회 2011 정보처리학회논문지B Vol.18 No.4

        사람들은 월드 와이드 웹 상에서 사용자가 원하는 정보를 검색하는 여러 알고리즘들을 구현해 왔다. 이렇게 구현된 검색 알고리즘 중 가장 좋은 기술을 가지고 있는 곳은 페이지랭크(PageRank)방식의 구글이다. 하지만 외부에서 참조하는 링크가 많은 문서를 가지고 있는 문서 즉, 대중들이 관심을 가지는 문서를 상위에 보여주는 페이지랭크 방식으론 사용자가 원하는 문서를 찾아서 제공하지 못할 수 있다. 개인에게 가치가 있는 문서를 찾기보다 대중에게 가치가 있는 문서를 찾기 때문이다. 이러한 문제를 해결하기 위하여 본 논문에서는 어휘의 의미를 정확히 표현하고 있는 워드넷을 이용하여 사용자 질의 이력 정보를 분석하여 현재 질의를 확장한 개인적 가치와 페이지 랭크지수를 이용한 대중적 가치를 모두 고려한 방법을 제안한다. 실험결과 제안한 방법은 상위 30개의 검색결과 중 평균 약 60% 결과들에 대해 만족하는 것으로 나타났으며, 구글 검색 결과에 비해 평균 약 14% 향상된 만족도를 나타내었다. Many search algorithms have been implemented by many researchers on the world wide web. One of the best algorithms is Google using PageRank technology. PageRank approach computes the number of inlink of each documents then ranks documents in the order of inlink members. But it is difficult to find the results that user needs, because this method find documents not valueable for a person but valueable for the public. To solve this problem, We use the WordNet for analysis of the user's query history. This paper proposes a personalized search engine using the user's query history and PageRank Check. We compared the performance of the proposed approaches with google search results in the top 30. As a result, the average of the r-precision for the proposed approaches is about 60% and it is better as about 14%.

      • 준구조화된 정보소스에 대한 지식기반의 Wrapper 학습 에이전트

        서희경,양재영,최중민,Seo, Hee-Kyoung,Yang, Jae-Young,Choi, Joong-Min 한국정보과학회 2002 정보과학회논문지 : 소프트웨어 및 응용 Vol.29 No.1

        정보추출은 한 문서에서 그 문서의 중심적 의미를 나타내는 특정 구성요소를 인식하여 추출하는 작업이다. 기존의 정보추출 시스템은 대부분 정보추출 규칙인 wrapper를 수동으로 구성하여 적용하였기 때문에 추출의 정확성은 높지만 유연성, 확장성, 효율성의 측면에서 문제점이 발생하였다. Wrapper를 자동으로 생성하는 일부 연구에서도 도메인 지식의 획득과 표현의 어려움, 그리고 여러 정보소스 사이에 나타나는 문서형태의 구조적 이질성 때문에 정확한 정보추출이 이루어지지 못했다. 본 논문에서는 이러한 이질적이고 복잡한 형태의 실세계 정보소스로부터의 정확한 정보추출을 추구하는 정보추출 에이전트인 XTROS를 제안한다. XTROS는 도메인 지식을 이용하여 준구조화된 형태의 정보소스에서 제공하는 문서를 분석하고 학습하여 wrapper들을 자동으로 생성하고, 이 wrapper들을 모두 XML 문서의 형태로 구성하는 새로운 표현기법을 제시함으로써 도메인 지식표현의 용이성과 wrapper 해석기 구현의 간결함, XML이 지닌 이식성 등을 최대한 활용하고자 하였다. Wrapper의 정보추출 규칙은 도메인 지식과 샘플 문서를 이용하여 자동으로 생성된다. 정보추출 규칙을 자동으로 생성하는 알고리즘의 핵심은 도메인 지식을 바탕을 샘플 문서의 각 논리 라인에 의미를 부여하고 이 논리 라인 의미의 나열로부터 반복되는 패턴을 찾아내는 것이다. 이 패턴의 위치와 구조를 XML 문서로 표현한 것이 wrapper가 된다. XTROS 시스템을 부동산 매물정보를 제공하는 다수의 실제 웹 정보소스에 대해서 테스트한 결과 이질성과 복잡성을 가진 대부분의 정보소스로부터 정확한 wrapper 생성과 정보추출이 가능하였다. Information extraction(IE) is a process of recognizing and fetching particular information fragments from a document. In previous work, most IE systems generate the extraction rules called the wrappers manually, and although this manual wrapper generation may achieve more correct extraction, it reveals some problems in flexibility, extensibility, and efficiency. Some other researches that employ automatic ways of generating wrappers are also experiencing difficulties in acquiring and representing useful domain knowledge and in coping with the structural heterogeneity among different information sources, and as a result, the real-world information sources with complex document structures could not be correctly analyzed. In order to resolve these problems, this paper presents an agent-based information extraction system named XTROS that exploits the domain knowledge to learn from documents in a semi-structured information source. This system generates a wrapper for each information source automatically and performs information extraction and information integration by applying this wrapper to the corresponding source. In XTROS, both the domain knowledge and the wrapper are represented as XML-type documents. The wrapper generation algorithm first recognizes the meaning of each logical line of a sample document by using the domain knowledge, and then finds the most frequent pattern from the sequence of semantic representations of the logical lines. Eventually, the location and the structure of this pattern represented by an XML document becomes the wrapper. By testing XTROS on several real-estate information sites, we claim that it creates the correct wrappers for most Web sources and consequently facilitates effective information extraction and integration for heterogeneous and complex information sources.

      • 분산 멀티에이전트 시스템의 상호협력 제어

        백순철(Baeg Soon Cheol),최중민(Choi Joong Min),임영환(Lim Young Hwan),장명욱(Jang Myoeng Wuk),박상규(Park Sang Kyu),이광로(Lee Gowang Lo) 한국정보처리학회 1996 정보처리학회논문지 Vol.3 No.7

        In a distributed multiagent framework, the capabilities of each agent are known to other agents. Namely, each agent in a multiagent society is aware of what agents are available in the whole society, which is able to solve a query, and how to contact them. This characteristic leads to the simplicity in controlling both local and remote interactions among agents by using a fixed form for communication packets. This paper presents methods for controlling interactions among agents in this distributed multiagent framework. Agent interactions are described within the platform of MASCOT that is a tightly coupled multiagent system developed fir the role of a computer secretary. A frame-like form of a communication packet is defined, and protocols for message exchanges are presented. Also, a scenario is given to demonstrate how the communication mechanism controls agent interactions in MASCOT.

      • 인공지능 : 플러그 앤드 플래이 ( Plug-and-Play ) 개념을 이용한 이형 응용 프로그램의 통합 기법

        백순철(Baeg Soon Cheol),최중민(Choi Joong Min),장명욱(Jang Myoeng Wuk),박상규(Park Sang Kyu),민병의(Min Byung Eui),임영환(Lim Young Hwan) 한국정보처리학회 1995 정보처리학회논문지 Vol.2 No.6

        In this paper, we discuss an effort to develop a multi-agent architecture through which heterogeneous applications communicate and cooperate by means of plug-and-play mechanism. Three components are created in order to challenge the plug-and-play mechanism : meta-information, PnP agent module, and ICM. The meta-information is used to automatically set up a suitable configuration for a new plugged-in application, eliminating the need for direct addressing among heterogeneous applications. The PnP agent module is a homogeneous controller that operates on an application to ensure that its activities are coordinated with those of the others within the community, providing a uniform control mechanism. The ICM is a high level communication message that provides a homogeneous communication envelope for all heterogeneous applications. The combination of these three components is used to meet the desire for implementing the plug-and-play mechanism. In this distributed, open architecture, one should be able to simply plug in a new application and it should work.

      • KCI등재

        주변정보 분할을 이용한 주제 중심 웹 문서 수집기

        조창희,이남용,강진범,양재영,최중민,Cho, Chang-Hee,Lee, Nam-Yong,Kang, Jin-Bum,Yang, Jae-Young,Choi, Joong-Min 한국정보처리학회 2005 정보처리학회논문지B Vol.12 No.6

        주제 중심 웹 문서 수집기는 검색엔진에서 최신의 웹 문서 색인을 유지하는 대안방안으로 부상하고 있다. 그러나 주제 중심 웹 문서 수집기는 비 관심문서에서 연결된 관심문서들을 수집할 수 없는 문제점을 가지고 있다. 이러한 문제점은 문서의 구조적 특징을 고려하지 않아서 발생한다. 특히 문서분석 방법인 문서의 발생 횟수 및 역문헌 발생빈도는 이러한 문제를 야기하는 주요 원인이 된다 주제 중심 웹 문서 수집기의 성능을 향상하기 위해서 본 논문에서는 국소 정보기반의 문서 분할법을 제안한다. 본 논문에서는 문서를 하이퍼링크 주변의 문맥을 고려한 특징 정보들을 사용하여 여러 소각의 문서로 나눈다. 본 논문에서 제안하는 주제 중심 웹 문서 수집기는 나누어진 문서들을 이용하여 하이퍼링크가 관심문서를 가리키는 것인지를 판단하여 문서를 수집할 것인지를 판단한다. The focused crawler is a topic-driven document-collecting crawler that was suggested as a promising alternative of maintaining up-to-date web document Indices in search engines. A major problem inherent in previous focused crawlers is the liability of missing highly relevant documents that are linked from off-topic documents. This problem mainly originated from the lack of consideration of structural information in a document. Traditional weighting method such as TFIDF employed in document classification can lead to this problem. In order to improve the performance of focused crawlers, this paper proposes a scheme of locality-based document segmentation to determine the relevance of a document to a specific topic. We segment a document into a set of sub-documents using contextual features around the hyperlinks. This information is used to determine whether the crawler would fetch the documents that are linked from hyperlinks in an off-topic document.

      • KCI등재

        이형 분산 환경에서 에이전트들간의 이형성을 극복하기 위한 멀티에이전트 기반구조

        백순철(Sooncheol Baeg),최중민(Joong Min Choi),장명옥(Myeong Wuk Jang),박상규(Sang Kyu Park),임영환(Young Hwan Lim) 한국정보과학회 1996 정보과학회 컴퓨팅의 실제 논문지 Vol.2 No.1

        멀티에이전트 시스템은 여러 에이전트들간의 협동에 의해서 한 에이전트가 해결하기 어려운 복잡한 문제의 해결을 추구한다. 그러나 기존의 소프트웨어 시스템들이 서로 다른 환경 하에서 구축되어 발생하는 이형성으로 인해 정보 공유나 협동을 효과적으로 조정하는데 어려움이 있다. 이를 해결하기 위해 본 연구에서는 멀티에이전트 시스템을 구성하기 위한 체계적인 기반구조인 EMAF를 제시한다. EMAF에서는 에이전트들 간의 이형성 극복을 위해 메타지식, 에이전트 간 교류언어, 그리고 제어기라는 세 가지 구성요소를 제안한다. 메타지식은 각 에이전트가 지니는 지식이나 능력을 나타내며 에이전트 간의 협동을 위한 일 분담에 이용된다. 에이전트 간 교류언어는 에이전트들 간의 통신을 통해 다른 성격의 에이전트들이 정보를 공유하게 해준다. 제어기는 에이전트로서 최소한 요구되는 행동, 즉 도착하는 메시지를 읽고, 그에 따른 수행을 하며, 나가는 메시지를 작성하는 작업을 지원한다. 본 논문에서는 또한 이러한 구성요소의 효과적인 통합을 위한 시스템 구조와 동작 모델을 제안하고, 이 기반구조를 바탕으로 실제로 구현되어 동작하는 여러 이형의 에이전트를 이용한 멀티에이전트 시스템을 통해 EMAF의 효용성을 입증한다. In a multi-agent system, several autonomous agents interact or work together to perform some set of complex and multi-domain tasks that can hardly be solved by a single agent Generally, however, It is difficult to coordinate the cooperation and share information among agents mainly because (1) agents ale heterogeneous as they are built on different platforms and in different languages, and (2) agents are working in a distributed environment. This paper presents a systematic multi-agent framework named EMAF to address this problem. To cope with the problem of heterogeneity and to support distributed environments, EMAF proposes three components: meta knowledge, an inter-agent communication language (ICL), and a controller. The meta knowledge describes properties and capabilities of an agent, and is used to partition and distribute a complex task into a set of interactions among agents. ICL is concerned with knowledge sharing by exchanging messages among agents. The controller describes a control cycle to process a communication message, that is, interpreting incoming messages, acting on them and constructing outgoing messages for the result of execution. In this paper, the architecture and the operational model for EMAF is defined, and a construction of a prototype multi-agent system based on EMAF is described.

      • 애드혹 네트워크에서의 강건한 라우팅 알고리즘에 대한 기법 연구

        전호철 ( Ho-chul Jeon ),김태환 ( Tea-hwan Kim ),최중민 ( Joong-min Choi ) 한국정보처리학회 2008 한국정보처리학회 학술대회논문집 Vol.15 No.1

        이동 호스트의 이동에 따른 단절 또는 장애는 애드혹 네트워크에서 중요한 이슈중 하나이다. 응답 메시지를 전송하기 위해, DSR 이나 AODV 에서는 메시지 전송 요청을 위해 설정된 경로를 재사용 한다. 즉, 설정된 경로를 이용해서 역방향으로 응답 메시지를 전송 하는 방식이다. 이러한 경우, 설정된 경로상에 있는 이동 호스트의 이동에 따른 장애는 매우 치명적이다. 이동 호스트에 의한 장애는 예측 가능성에 따라 예측 가능한 장애와 예측 불가능한 장애로 구분할 수 있다. 예측 가능한 장애는 이동 호스트가 스스로 장애의 발생 여부를 파악 할 수 있는 경우를 의미한다. 예를 들면, 이동 호스트의 제한된 전원 또는 이동 호스트의 이동성에 의해 발생하는 장애가 대표적인 예이다. 반면에 예측 불가능한 장애는 이동 호스트가 스스로 장애를 예측 할 수 없는 경우를 의미하며, 이러한 장애의 대부분은 문제를 해결할 충분한 시간이 주어지지 않을 만큼 급작스럽게 발생한다. 본 논문에서는 예측 가능한 장애에 대해 능동적이고 지능적으로 대처할 수 있도록 하는 새로운 방법을 제안한다. 이는 회사 내에서 업무를 인수 인계하는 방식과 매우 유사하다. 또한 본 논문에서 제안하는 방법은 앞서 언급한 이동 호스트의 이동에 따른 장애 문제를 해결함에 있어서, DSR 또는 AODV 처럼 메시지 전송 요청 시 설정된 경로가 응답 메시지 전송을 위해 다시 사용되는 라우팅 알고 리즘에 비해 경로 재설정 시간과 전송 되는 메시지의 총량 측면에서 매우 효과적이고, 이동 호스트들이 스스로 장애를 예측하고 이에 대해 능동적이고 지능적으로 대처 할 수 있도록 한다.

      • 개인 기호정보 필터링을 사용한 모바일 시맨틱 검색

        전호철 ( Ho-chul Jeon ),김태환 ( Tae-hwan Kim ),최중민 ( Joong-min Choi ) 한국정보처리학회 2007 한국정보처리학회 학술대회논문집 Vol.14 No.2

        본 논문에서는 모바일폰을 통한 시맨틱 검색 및 개인 기호정보를 사용한 검색 결과의 필터링이 가능한 시스템을 제안 하고자 한다. 시스템에서는 모바일 컨텐츠와 웹 컨텐츠의 검색 연동, 사용자 기호정보의 유·무선 장치의 공유 및 유·무선 장치간 검색 결과의 공유를 지원한다. 모바일폰의 컴퓨팅 능력을 고려해 모바일폰에는 사용자 인터페이스만을 유지 하도록 한다. 모바일폰을 통한 시맨틱 검색을 지원하기 위해 시스템은 실험적으로 뉴스 도메인에 국한된 카테고리에 대한 분류 체계 온톨로지를 구축하며, 각 카테고리간 관계를 설정 한다. 또한, 개인 기호정보를 통한 검색 결과의 필터링을 위해 사용자 기호정보를 XML 형태의 벡터 모델로 유지하며, 이는 서버의 데이터베이스에 각 사용자 계정으로 저장하고 공유한다. 모바일폰의 여러 단점을 극복하고 장점을 극대화 하기 위해 검색 결과를 서버에 저장하고 이를 유·무선 장치간 상호 공유 할 수 있도록 한다. 본 논문에서는 시스템의 아키텍처와 구성 및 주요 기능에 대해서 기술하고자 한다.

      • 지능형 전자상거래를 위한 온토로지 서버 구축과 개인 적응형 상품검색

        정한혁(Han Hyuk Chung),이은석(Eun Suk Lee),최중민(Joong Min Choi),한정현(Jung Hyun Han),이준호(Jun Ho Yi) 한국정보처리학회 2000 정보처리학회논문지 Vol.7 No.5

        With the proliferation of electronic commerce (EC), the product items which are transacted and the user classes who utilize the EC are spread rapidly. Many users have to expend time and effort in searching of products and or the shopping malls which deal with the products. For this reason, the intelligent retrieval of both malls and products based on an intelligent software agent has been raised as a hot issue. In this paper we have constructed an ontology server that is an essential constituent for agent-based intelligent EC. And also we have designed and implemented a user adapted personalized product search function based on the ontology that are registered in the server.

