RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        동적 연결 그래프를 이용한 자동 문서 요약 시스템 (pp.62-69)

        송원문(WonMoon Song),김영진(YoungJin Kim),김은주(EunJu Kim),김명원(MyungWon Kim) 한국정보과학회 2009 정보과학회논문지 : 소프트웨어 및 응용 Vol.36 No.1

        문서 요약은 쉽고 빠르게 문서의 내용을 파악할 수 있도록 방대한 내용을 가지는 다양한 형태의 문서로부터 핵심 내용만을 추출하거나 생성하여 제공하는 것을 목적으로 한다. 본 논문에서는 효율적 문서 요약을 위해 주어진 문서의 평균 문장 길이(핵심어 개수)를 고려하여 문장 간의 핵심어 유사도를 나타내는 연결 그래프를 생성하고 분석하여 요약을 생성하는 기법을 제안한다. 또한 이러한 기법을 이용하여 응용 프로그램 문서로부터 자동으로 요약을 생성하는 자동 문서 요약 시스템을 개발한다. 제안한 방법의 객관적인 요약 성능 측정을 위해 정확한 요약문이 실린 20개의 테스트 문서를 이용하여 생성된 요약에 대해 precision(정확률)과 recall(재현율), F-measure를 측정하였으며, 실험 결과를 통해 기존 기법에 비해 우수한 요약 성능을 보임을 증명하였다. The purpose of document summarization is to provide easy and quick understanding of documents by extracting summarized information from the documents produced by various application programs. In this paper, we propose a document summarization method that creates and analyzes a connection graph representing the similarity of keyword lists of sentences in a document taking into account the mean length(the number of keywords) of sentences of the document. We implemented a system that automatically generate a summary from a document using the proposed method. To evaluate the performance of the method, we used a set of 20 documents associated with their correct summaries and measured the precision, the recall and the F-measure. The experiment results show that the proposed method is more efficient compared with the existing methods.

      • KCI등재

        텍스트 블록 주변의 문맥을 이용한 HTML 문서 본문 추출

        송원문(Wonmoon Song),김우승(Wooseung Kim),김명원(Myungwon Kim) 한국정보과학회 2013 정보과학회논문지 : 소프트웨어 및 응용 Vol.40 No.3

        다양한 웹 저작 도구 및 새로운 웹 표준의 출현과 웹에 대한 접근성이 보다 편리해지면서 매우 다양한 종류의 웹 콘텐츠들이 아주 빠르게 생산되고 있다. 이와 같은 환경에서, 사용자의 요구에 적합한 웹 서비스를 제공하기 위해서는 웹 문서로부터 광고와 같은 비 본문 영역 등을 제거하고 본문에 적합한 정보만을 정확하고 빠르게 추출하는 것이 중요하다. 이에 본 논문에서는 HTML 형태의 웹 문서로부터 본문 영역을 정확하게 추출하는 방법을 제안한다. 제안한 방법에서는 문서내의 각각의 텍스트 블록들이 본문 영역에 해당하는지 분류하기 위하여 의사결정트리를 생성하고 이용하였으며 분류를 위한 특징으로는 텍스트 블록의 단어 및 링크 밀도와 HTML 태그 분포 및 텍스트 블록간 거리 등을 포함하는 문맥 정보를 사용하였다. 공개된 데이터 및 본 연구팀에서 직접 수집한 데이터를 이용한 실험을 통해 기존의 방법에 비해 F-Measure가 약 19% 향상되었음을 보였다. Due to various Web authoring tools, the new web standards, and improved web accessibility, a wide variety of Web contents are being produced very quickly. In such an environment, in order to provide appropriate Web services to users" needs it is important to quickly and accurately extract relevant information from Web documents and remove irrelevant contents such as advertisements. In this paper, we propose a method that extracts main contents accurately from HTML Web documents. In the method, a decision tree is built and used to classify each block of text whether it is a part of the main contents. For classification we use contextual features around text blocks including word density, link density, HTML tag distribution, and distance between text blocks. We experimented with our method using a published data set and a data set that we collected. The experiment results show that our method performs 19% better in F-measure compared to the existing methods.

      • 단어 빈도수와 공기 정보를 이용한 효율적인 핵심어 추출 기법 개발

        송원문(WonMoon Song),김영진(YoungJin Kim),김은주(EunJu Kim),김명원(MyungWon Kim) 한국지능시스템학회 2008 한국지능시스템학회 학술발표 논문집 Vol.18 No.2

        본 논문에서는 효율적인 핵심어 추출을 위해 기존에 제안된 단어 빈도수에 의한 핵심어 추출 방법과 단어간 공기정보에 의한 핵심어 추출 방법을 융합하여 최종 핵심어를 구성하는 방법을 제안한다. 제안하는 방법에서는 단어 빈도수와 공기정보를 이용하여 각각 핵심어를 추출하고 중요도를 계산한 후 확신도 기법에 의하여 두 목록을 융합한다. 제안한 방법의 객관적인 핵심어 추출 성능 측정을 위해 정확한 핵심어를 포함한 20개의 테스트 문서를 이용하여 추출된 핵심어 목록에 대해 precision(정확률)과 recall(재현율), F-measure를 측정하였으며, 실험 결과를 통해 기존 기법에 비해 우수한 핵심어 추출 성능을 보임을 증명하였다.

      • 인터넷 중독의 진단과 처방을 위한 전문가 시스템

        송원문(Wonmoon Song),이상화(Sanghwa Lee),김은주(Eunju Kim),송성렬(Sungryul Song),송수민(Soomin Song),김명원(Myungwon Kim) 한국지능시스템학회 2010 한국지능시스템학회 학술발표 논문집 Vol.20 No.1

        본 논문에서는 사회적으로 중요한 문제로 대두되고 있는 인터넷 중독 문제를 해결하기 위해 자동으로 인터넷 중독을 진단하고 사용자의 중독 요인 및 특성에 적합한 처방을 제시할 수 있는 전문가 시스템을 제안한다, 제안하는 시스템에서는 K-척도의 진단 기준을 이용하여 중독 정도를 자동으로 진단하며, 관련 분야의 인간 전문가의 치료 지식을 사례에 따른 사용자 특성 및 증상별로 분류/구축하여 처방을 생성한다. 인간 전문가의 평가 결과 시스템이 생성한 처방의 정확도는 약 90%로 효율적인 처방이 생성됨을 입증하였다.

      • 사용자 발화 순차패턴을 이용한 음성인식 후처리

        송원문(WonMoon Song),김은주(EunJu Kim),김명원(MyungWon Kim) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.1

        최근 음성인식 분야 에서는 발화된 음성의 단순한 신호 처리위주의 인식 결과로부터 좀 더 신뢰할 수 있는 결과를 얻기 위하여 여러 가지 후처리 기법들이 연구 되고 있다. 본 논문에서는 개인 사용자를 위한 음성 명령어 인식 환경에서 사용자의 발화 정보를 후처리에 적용함으로써 사용자 정보를 고려한 음성인식 후처리 기법을 제안한다. 먼저 이전에 사용했던 음성 명령어들로부터 명령어 발화 순차 패턴 규칙을 추출한 후 사용자가 사전에 발화한 명령어를 바탕으로 구성된 순차 패턴을 비교 하여 순차 규칙상 얻어 질수있는 단어를 결정한다. 이렇게 얻어진 단어를 고려하여 음성인식기 인식단어 후보들의 확률값을 적절히 보정한 후 최종 인식 단어를 재결정한다. 이러한 과정에서 적절한 보정을 위하여 발화 순차 패턴의 신뢰도와 인식기의 결과단어를 고려한 보정 방법을 제안한다. 실험을 통하여 제안한 후처리를 이용한 음성인식이 HMM을 이용한 기본 음성인식에 비해 오류율을 15%이상낮추어 인식률에 상당한 기여를 하였음을 확인할 수 있다.

      • 잡음 환경에서의 강인한 음성인식을 위한 문맥 정보와 음성인식 결과의 융합

        송원문(WonMoon Song),김은주(EunJu Kim),김명원(MyungWon Kim) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.2

        최근 음성인식 분야 에서는 잡음 환경에서 좀 더 신뢰도 높은 음성 인식 결과를 얻기 위하여 인식 결과 도출 단계에서 여러 가지 정보를 융합 하는 방법이나 인식결과를 후처리 하여 새로운 결과를 얻어 내는 방법들이 연구 되고 있다. 본 논문에서는 개인 모바일 기기에서의 음성 인식 환경에서 사용자의 발화 패턴 정보를 가지는 문맥 정보를 활용함으로서 잡음 환경에서의 음성 정보 손실에 따른 인식률 하락을 보완하는 방법을 제안한다. 먼저 사용자의 기기 사용 로그나 발화 로그 정보로부터 특정 명령어들의 순차적 발화 패턴을 마이닝하여 문맥 정보를 구성한다. 이 후 음성 발화시에 인식기의 최종 인식 결과에 대한 신뢰도가 떨어진다고 판단될 때 앞서 얻어진 문맥 정보의 신뢰도를 인식기의 각 후보단어들의 인식률과 융합하여 새로운 인식 결과를 도출해 낸다. 이러한 과정에서 인식기 결과에 대한 신뢰성을 판단하는 기준을 실험을 통하여 결정 하였으며 신뢰성이 기준 이하일 경우의 융합 과정을 위하여 후보 단어 인식률과 문맥정보를 적절히 융합할 수 있는 방법을 제안한다.

      • KCI등재

        대용량 로그 데이터 환경에서의 점진적 연관규칙추출을 위한 FP-tree 갱신기법

        송성렬(SungYeol Song),송원문(WonMoon Song),김은주(EunJu Kim),김명원(MyungWon Kim) 한국정보과학회 2011 정보과학회 컴퓨팅의 실제 논문지 Vol.17 No.1

        최근 정보 산업 분야의 발달로 인하여 기록 데이터의 급격한 양적 팽창이 일어나고 있다. 본 논문에서는 대용량 기록 데이터를 효과적으로 처리하기 위하여 연관규칙 추출 기법 중 가장 효율적인 기법인 FP-tree를 기반으로 하는 점진적 연관규칙 추출기법을 제안한다. 특히 새로운 사용자(트랜잭션)의 증가보다는 기존 사용자에 새로운 항목이 추가되었을 때의 상황에 주목한다. 제안하는 기법은 각각의 사용자에 해당하는 트랜잭션 경로를 파악하고 새로운 항목을 포함한 경로로 수정한다. IPTV 사용자 기록 데이터를 이용하여 제안하는 기법을 실험하였다. 실험결과 제안하는 FP-tree 갱신 기법은 점진적으로 증가하는 기록 데이터 처리 시 FP-tree를 새로 생성하는 것에 비해 약 4배 가량 빠르며 효율성 추정을 통해 제안하는 기법이 타당성이 있음을 증명하였다. With the development of the IT industry, the amount of log data is soaring. In order to more effectively process mass user data, this paper suggests FP-tree based incremental association mining, the most efficient association mining technique. This study particularly focuses on a situation where new items are added to existing user data, rather than where new users or new transactions create extra data traffic. The proposed technique is designed to figure out each user's transaction path and revise the path by including new items. Experiments on the technique were devised with IPTV user log data. The experiments found that this proposed FP-tree updating technique can process incrementally increasing records/data about four times faster than new FP-tree creating cases, and efficiency estimation verified validity of the proposed technique.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼