RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        문단 단위 가중치 함수와 문단 타입을 이용한 문서 범주화

        주원균,김진숙,최기석,Joo, Won-Kyun,Kim, Jin-Suk,Choi, Ki-Seok 한국정보처리학회 2005 정보처리학회논문지B Vol.12 No.6

        문서 범주화 분야에 대한 연구들은 전체 문서 단위에 한정되어 왔으나, 오늘날 대부분의 전문들이 주요 주제를을 표현하기 위해서 조직화 된 특정 구조로 기술되고 있어, 텍스트 범주화에 대한 새로운 인식이 필요하게 되었다. 이러한 구조는 부주제(Sub-topic)의 텍스트 블록이나 문단(Passage) 단위의 나열로서 표현되는데, 이러한 구조 문서에 대한 부주제 구조를 반영하기 위해서 문단 단위(Passage-based) 문서 범주화 모델을 제안한다. 제안한 모델에서는 문서를 문단들로 분리하여 각각의 문단에 범주(Category)를 할당하고, 각 문단의 범주를 전체 문서의 범주로 병합하는 방법을 사용한다. 전형적인 문서 범주화와 비교할 때, 두 가지 부가적인 절차가 필요한데, 문단 분리와 문단 병합이 그것이다. 로이터(Reuter)의 4가지 하위 집합과 수십에서 수백 KB에 이르는 전문 테스트 컬렉션(KISTl-Theses)을 이용하여 실험하였는데, 다양한 문단 타입들의 효과와 범주 병합 과정에서의 문단 위치의 중요성에 초점을 맞추었다 실험한 결과 산술적(Window) 문단이 모든 테스트 컬렉션에 대해서 가장 좋은 성능을 보였다. 또한 문단은 문서 안의 위치에 따라 주요 주제에 기여하는 바가 다른 것으로 나타났다. Researches in text categorization have been confined to whole-document-level classification, probably due to lacks of full-text test collections. However, full-length documents availably today in large quantities pose renewed interests in text classification. A document is usually written in an organized structure to present its main topic(s). This structure can be expressed as a sequence of sub-topic text blocks, or passages. In order to reflect the sub-topic structure of a document, we propose a new passage-level or passage-based text categorization model, which segments a test document into several Passages, assigns categories to each passage, and merges passage categories to document categories. Compared with traditional document-level categorization, two additional steps, passage splitting and category merging, are required in this model. By using four subsets of Routers text categorization test collection and a full-text test collection of which documents are varying from tens of kilobytes to hundreds, we evaluated the proposed model, especially the effectiveness of various passage types and the importance of passage location in category merging. Our results show simple windows are best for all test collections tested in these experiments. We also found that passages have different degrees of contribution to main topic(s), depending on their location in the test document.

      • KCI등재

        문단 단위 가중치 함수와 문단 타입을 이용한 문서 범주화

        주원균,김진숙,최기석 한국정보처리학회 2005 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.12 No.6

        문서 범주화 분야에 대한 연구들은 전체 문서 단위에 한정되어 왔으나, 오늘날 대부분의 전문들이 주요 주제들을 표현하기 위해서 조직화 된 특정 구조로 기술되고 있어, 텍스트 범주화에 대한 새로운 인식이 필요하게 되었다. 이러한 구조는 부주제(Sub-topic)의 텍스트 블록이나 문단(Passage) 단위의 나열로서 표현되는데, 이러한 구조 문서에 대한 부주제 구조를 반영하기 위해서 문단 단위(Passage-based) 문서 범주화 모델을 제안한다. 제안한 모델에서는 문서를 문단들로 분리하여 각각의 문단에 범주(Category)를 할당하고, 각 문단의 범주를 전체 문서의 범주로 병합하는 방법을 사용한다. 전형적인 문서 범주화와 비교할 때, 두 가지 부가적인 절차가 필요한데, 문단 분리와 문단 병합이 그것이다. 로이터(Reuter)의 4가지 하위 집합과 수십에서 수백 KB에 이르는 전문 테스트 컬렉션(KISTI-Theses)을 이용하여 실험하였는데, 다양한 문단 타입들의 효과와 범주 병합 과정에서의 문단 위치의 중요성에 초점을 맞추었다. 실험한 결과 산술적(Window) 문단이 모든 테스트 컬렉션에 대해서 가장 좋은 성능을 보였다. 또한 문단은 문서 안의 위치에 따라 주요 주제에 기여하는 바가 다른 것으로 나타났다. Researches in text categorization have been confined to whole-document-level classification, probably due to lacks of full-text test collections. However, full-length documents available today in large quantities pose renewed interests in text classification. A document is usually written in an organized structure to present its main topic(s). This structure can be expressed as a sequence of sub-topic text blocks, or passages. In order to reflect the sub-topic structure of a document, we propose a new passage-level or passage-based text categorization model, which segments a test document into several passages, assigns categories to each passage, and merges passage categories to document categories. Compared with traditional document-level categorization, two additional steps, passage splitting and category merging, are required in this model. By using four subsets of Reuters text categorization test collection and a full-text test collection of which documents are varying from tens of kilobytes to hundreds, we evaluated the proposed model, especially the effectiveness of various passage types and the importance of passage location in category merging. Our results show simple windows are best for all test collections tested in these experiments. We also found that passages have different degrees of contribution to main topic(s), depending on their location in the test document.

      • 워드문서 콘텐츠의 사용자 XML 콘텐츠로의 변환 및 저장 시스템 개발

        주원균(Joo Won-Kyun),양명석(Yang Myung-Seok),김태현(Kim Tae-Hyun),이민호(Lee Min-Ho),최기석(Choi Ki-Seok) 한국콘텐츠학회 2006 한국콘텐츠학회 종합학술대회 논문집 Vol.4 No.2

        본 논문은 HWP, DOC와 같은 워드 문서를 대상으로 사용자가 작성한 구조적인 규칙과 XML 기반 워드 문서변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)워드문서의 원시 XML 문서로의 변환방법, 2)XML 기반 구조적인 규칙 작성과 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 워드문서의 변환을 위해서 독립적으로 동작하는OCX 기반의 워드문서 변환 데몬(daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 구조적인 문서로 생성하거나 DB에 저장할 수 있다. 개발한 시스템(PPE)은 워드 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 처리를 하거나 현황·통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리 시스템과 성과정보시스템에 시범 적용하였다. This paper will intend to contribute to extracting and storing various form of information on user interests by using structural rules user makes and XML-based word document converting techniques. The system named PPE consists of three essential element. One is converting element which converts word documents like HWP, DOC into XML documents, another is extracting element to prepare structural rules and extract concerned information from XML document by structural rules, and the other is storing element to make final XML document or store it into database system. For word document converting, we developed OCX based word converting daemon. Helping user to extracting information, we developed script language having native function/variable processing engine extended from XSLT. This system can be used in the area of constructing word document contents DB or providing various information service based on RAW word documents. We really applied it to project management system and project result management system.

      • 녹색기술문헌 자동 범주화를 위한 문서 분류기 개발

        주원균 ( Won-kyun Joo ),박민우 ( Min-woo Park ),최기석 ( Ki-seok Choi ) 한국정보처리학회 2012 한국정보처리학회 학술대회논문집 Vol.19 No.2

        최근에 이슈화되고 있는 녹색기술문헌의 중요성에 부합하여 녹색기술 문헌을 자동으로 분류해주는 문서 분류시스템 개발하였다. 분류체계로는 14개의 관심 녹색기술 분류 체계를 선택하였고, 다양한 문서 분류 기법 중 SVM(Support Vector Machine)에 기초를 둔 방법을 이용하였다. 문서 벡터를 생성할 때 제목과 본문에 동일한 가중치를 적용하는 방법을 벗어나서 제목의 키워드에 좀 더 높은 가중치를 부여하는 방식을 적용하여 성능평가를 수행하였다.

      • 연구성과 검증시스템 구축에 관한 연구

        주원균(Joo won-kyun),박근철(Park gun-chul),양명석(Yang myung-seok),최기석(Choi ki-seok),김영국(Kim young-kuk) 한국콘텐츠학회 2007 한국콘텐츠학회 종합학술대회 논문집 Vol.5 No.1

        국가차원의 연구성과에 대한 관리 및 활용의 중요성이 부각되면서, 연구성과를 이용한 현황통계ㆍ분석ㆍ평가ㆍ사업화 등에 대한 요구들이 날로 증가하고 있다. 현재 체제하에서 연구성과 자료의 제출 및 관리는 전적으로 연구자 혹은 기관내의 연구성과 담당자들의 윤리적인 판단에 따르고 있는 실정이어서, 정확한 현황 파악과 활용 부분에 있어서 그 한계를 드러내고 있다. 연구성과 검증시스템은 연구성과에 대한 유효성을 검증하여 향후 활용에 있어서 신뢰 기반을 제공하고자 한다. 본 논문에서 개발한 연구성과 검증시스템은 연구성과 검증 분야에 많은 기여를 할 것으로 보이는데, 이미 몇몇의 국가 연구관리전문기관에 보급하여 그 효과를 입증하였고, 향후 다수의 기관으로의 보급을 확대할 예정이다. With speed importance of the research result management and use, the demands on a condition statistics, an analysis, an evaluation and the commercialization for the research result are increasing. The right present condition grasp and the application are difficult because of the research results submitted and managed by only the researchers in the current research management environments. The research result verification system verifies the effectiveness against the research result in a view points of the research management and it provides a user for the accurate information. Currently it supplied to several project management agency and result in a good results. This paper will intend to contribute to the research result verification fields.

      • 전자문서의 XML 문서로의 변환 및 저장 시스템

        주원균(WonKyun Joo),양명석(MyungSeok Yang),김태현(TaeHyun Kim),이민호(MinHo Lee),최기석(KiSeok Choi) 한국정보과학회 2006 한국정보과학회 학술발표논문집 Vol.33 No.1

        본 논문은 HWP, DOC와 같은 전자 문서에서 사용자가 제공한 구조적인 규칙과 XML 기반 전자 문서변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)전자문서의 원시 XML 문서로의 변환 방법, 2)XML 기반 구조적인 규칙과 작성된 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 전자문서의 변환을 위해서 독립적으로 동작하는OCX 기반의 전자문서 변환 데몬(Daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 데이터 포멧으로 생성하거나 DB에 저장할 수 있다. 본 시스템은 전자 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 현황 통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리시스템과 성과정보시스템에 적용하여 그 성과를 입증하였다.

      • NTIS를 이용한 R&D정보 제공 시스템에 대한 설계 및 구현

        주원균 ( Won-kyun Joo ),최기석 ( Ki-seok Choi ),김재수 ( Jae-soo Kim ),박현철 ( Hyon-chol Park ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.1

        본 논문에서는 연구회 관점에서 출연(연) R&D정보에 대한 종합적인 입수관리 및 서비스에 대한 요구에 부응하기 위해서 연구회R&D정보서비스(KRCF-RND)를 설계하고 구현하였다. NTIS의 표준체계 및 관련도구를 적용함으로써 연구회 중심의 데이터 입수/관리의 체계를 견고히 하였다. 정보관리를 위해서 국가R&D정보표준에 근간하여 174개의 연구회 관리항목을 정의하였고, NTIS 표준코드를 이용하였다. 관리시스템에는 NTIS의 부가서비스인 기관이형명관리서비스와 연구성과검증서비스를 적용하였다. NTIS의 표준 정보연계 방식을 적용함으로서 기초기술연구회 소관 13개 출연(연)의 국가R&D정보에 대한 실시간적인 데이터 연계를 구현하였다. 입수된 데이터에 대해서 38개 경영 및 성과지표의 형태로 서비스를 제공하였다. 본 시스템의 구축은 연구회 차원의 객관적인 기관평가, 효율적인 정보의 공동활용, 성과활용의 극대화를 위한 기반마련에 의의를 둘 수 있다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼