http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
문단 단위 가중치 함수와 문단 타입을 이용한 문서 범주화
주원균,김진숙,최기석,Joo, Won-Kyun,Kim, Jin-Suk,Choi, Ki-Seok 한국정보처리학회 2005 정보처리학회논문지B Vol.12 No.6
문서 범주화 분야에 대한 연구들은 전체 문서 단위에 한정되어 왔으나, 오늘날 대부분의 전문들이 주요 주제를을 표현하기 위해서 조직화 된 특정 구조로 기술되고 있어, 텍스트 범주화에 대한 새로운 인식이 필요하게 되었다. 이러한 구조는 부주제(Sub-topic)의 텍스트 블록이나 문단(Passage) 단위의 나열로서 표현되는데, 이러한 구조 문서에 대한 부주제 구조를 반영하기 위해서 문단 단위(Passage-based) 문서 범주화 모델을 제안한다. 제안한 모델에서는 문서를 문단들로 분리하여 각각의 문단에 범주(Category)를 할당하고, 각 문단의 범주를 전체 문서의 범주로 병합하는 방법을 사용한다. 전형적인 문서 범주화와 비교할 때, 두 가지 부가적인 절차가 필요한데, 문단 분리와 문단 병합이 그것이다. 로이터(Reuter)의 4가지 하위 집합과 수십에서 수백 KB에 이르는 전문 테스트 컬렉션(KISTl-Theses)을 이용하여 실험하였는데, 다양한 문단 타입들의 효과와 범주 병합 과정에서의 문단 위치의 중요성에 초점을 맞추었다 실험한 결과 산술적(Window) 문단이 모든 테스트 컬렉션에 대해서 가장 좋은 성능을 보였다. 또한 문단은 문서 안의 위치에 따라 주요 주제에 기여하는 바가 다른 것으로 나타났다. Researches in text categorization have been confined to whole-document-level classification, probably due to lacks of full-text test collections. However, full-length documents availably today in large quantities pose renewed interests in text classification. A document is usually written in an organized structure to present its main topic(s). This structure can be expressed as a sequence of sub-topic text blocks, or passages. In order to reflect the sub-topic structure of a document, we propose a new passage-level or passage-based text categorization model, which segments a test document into several Passages, assigns categories to each passage, and merges passage categories to document categories. Compared with traditional document-level categorization, two additional steps, passage splitting and category merging, are required in this model. By using four subsets of Routers text categorization test collection and a full-text test collection of which documents are varying from tens of kilobytes to hundreds, we evaluated the proposed model, especially the effectiveness of various passage types and the importance of passage location in category merging. Our results show simple windows are best for all test collections tested in these experiments. We also found that passages have different degrees of contribution to main topic(s), depending on their location in the test document.
국가 R&D 연구성과물 정보의 공동활용을 위한 방안 연구
주원균 ( Won-kyun Joo ),박근철 ( Gun-cheol Park ),허태상 ( Tae-sang Huh ),박정훈 ( Jung-hun Park ),최기석 ( Ki-seok Choi ) 한국정보처리학회 2009 한국정보처리학회 학술대회논문집 Vol.16 No.2
사업결과물의 핵심인 연구성과물은 각 부처 혹은 사업수행기관에 분산되어 대다수가 활용되지 못한채 사장되었다. 이에 정부는 중요 연구성과물에 대한 성과관리전담기관을 지정·운영하여 연구성과물의 수집 및 관리에 대한 법적인 기초를 다지고, 국가과학기술종합정보서비스를 이용하여 연구성과물의 활용을 위한 정책을 수립하였다. 본 논문에서는 이러한 체계를 반영한 국가R&D 연구성과물의 효율적인 수집·연계·활용을 위한 구체적인 운영 및 실행체계를 제시한다. 이러한 체계를 통하여 국가R&D연구성과물에 대한 공동활용을 극대화할 수 있다.
주원균(Joo won-kyun),박근철(Park gun-chul),양명석(Yang myung-seok),최기석(Choi ki-seok),김영국(Kim young-kuk) 한국콘텐츠학회 2007 한국콘텐츠학회 종합학술대회 논문집 Vol.5 No.1
국가차원의 연구성과에 대한 관리 및 활용의 중요성이 부각되면서, 연구성과를 이용한 현황통계ㆍ분석ㆍ평가ㆍ사업화 등에 대한 요구들이 날로 증가하고 있다. 현재 체제하에서 연구성과 자료의 제출 및 관리는 전적으로 연구자 혹은 기관내의 연구성과 담당자들의 윤리적인 판단에 따르고 있는 실정이어서, 정확한 현황 파악과 활용 부분에 있어서 그 한계를 드러내고 있다. 연구성과 검증시스템은 연구성과에 대한 유효성을 검증하여 향후 활용에 있어서 신뢰 기반을 제공하고자 한다. 본 논문에서 개발한 연구성과 검증시스템은 연구성과 검증 분야에 많은 기여를 할 것으로 보이는데, 이미 몇몇의 국가 연구관리전문기관에 보급하여 그 효과를 입증하였고, 향후 다수의 기관으로의 보급을 확대할 예정이다. With speed importance of the research result management and use, the demands on a condition statistics, an analysis, an evaluation and the commercialization for the research result are increasing. The right present condition grasp and the application are difficult because of the research results submitted and managed by only the researchers in the current research management environments. The research result verification system verifies the effectiveness against the research result in a view points of the research management and it provides a user for the accurate information. Currently it supplied to several project management agency and result in a good results. This paper will intend to contribute to the research result verification fields.
국가연구개발 우수유망기술정보 이용 활성화를 위한 시스템 구축
주원균(Won-Kyun Joo),최기석(Ki-Seok Choi),김재수(Jae-Soo Kim) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.1C
국가연구개발사업의 성과제고가 과학기술계 주요 이슈로 부상되면서 사업의 경제적 성과창출에 초점을 둔 기술이전 및 사업화에 대한 요구가 높아지고 있다. 국가연구개발사업에 대한 종합적인 서비스를 제공하는 NTIS는 국가연구개발성과를 부가가치 창출로 연계시킬 수 있도록 지원하기 위해서 우수유망기술정보 서비스를 도입하였다. 우수유망기술정보는 국가연구개발과제에 대한 최종평가 결과가 우수한 과제의 연구성과(기술) 중 기술이전 · 사업화의 가능성이 있거나 후속연구를 통해 기술이전 · 사업화가 가능한 기술을 칭한다. NTIS에서는 2008년부터 우수유망기술정보 DB를 구축하였고 관련 서비스를 제공하고 있다. 본 논문에서는 우수유망기술정보서비스와 관련된 국내외 현황에 대해서 조사하였고 그에 따른 시사점을 제시하였다. 국가연구개발사업에 대한 대내외 환경변화 및 공익적인 사업성격을 고려하여 NTIS 우수유망기술정보서비스의 활용과 관련한 현황을 파악하였고, 개선점을 도출하였다. 더 나아가서 향후 효과적인 활용을 위한 방안을 도출하였다.
주원균 ( Won-kyun Joo ),박민우 ( Min-woo Park ),최기석 ( Ki-seok Choi ) 한국정보처리학회 2012 한국정보처리학회 학술대회논문집 Vol.19 No.2
최근에 이슈화되고 있는 녹색기술문헌의 중요성에 부합하여 녹색기술 문헌을 자동으로 분류해주는 문서 분류시스템 개발하였다. 분류체계로는 14개의 관심 녹색기술 분류 체계를 선택하였고, 다양한 문서 분류 기법 중 SVM(Support Vector Machine)에 기초를 둔 방법을 이용하였다. 문서 벡터를 생성할 때 제목과 본문에 동일한 가중치를 적용하는 방법을 벗어나서 제목의 키워드에 좀 더 높은 가중치를 부여하는 방식을 적용하여 성능평가를 수행하였다.
NTIS를 이용한 R&D정보 제공 시스템에 대한 설계 및 구현
주원균 ( Won-kyun Joo ),최기석 ( Ki-seok Choi ),김재수 ( Jae-soo Kim ),박현철 ( Hyon-chol Park ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.1
본 논문에서는 연구회 관점에서 출연(연) R&D정보에 대한 종합적인 입수관리 및 서비스에 대한 요구에 부응하기 위해서 연구회R&D정보서비스(KRCF-RND)를 설계하고 구현하였다. NTIS의 표준체계 및 관련도구를 적용함으로써 연구회 중심의 데이터 입수/관리의 체계를 견고히 하였다. 정보관리를 위해서 국가R&D정보표준에 근간하여 174개의 연구회 관리항목을 정의하였고, NTIS 표준코드를 이용하였다. 관리시스템에는 NTIS의 부가서비스인 기관이형명관리서비스와 연구성과검증서비스를 적용하였다. NTIS의 표준 정보연계 방식을 적용함으로서 기초기술연구회 소관 13개 출연(연)의 국가R&D정보에 대한 실시간적인 데이터 연계를 구현하였다. 입수된 데이터에 대해서 38개 경영 및 성과지표의 형태로 서비스를 제공하였다. 본 시스템의 구축은 연구회 차원의 객관적인 기관평가, 효율적인 정보의 공동활용, 성과활용의 극대화를 위한 기반마련에 의의를 둘 수 있다.