http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
문서의 주제어별 가중치 부여와 단어 군집을 이용한 한국어 문서 자동 분류 시스템
허준희,최준혁,이정현,김중배,임기욱,Hur, Jun-Hui,Choi, Jun-Hyeog,Lee, Jung-Hyun,Kim, Joong-Bae,Rim, Kee-Wook 한국정보처리학회 2001 정보처리학회논문지B Vol.8 No.5
새로운 문서를 기존에 존재하는 클래스들에 할당하는 방법을 문서의 자동 분류라고 한다. 문서의 자동 분류는 뉴스 그룹의 기사분류, 웹 문서의 범주화, 전자 메일의 순서화, 사용자의 관심을 학습하여 보다 정확한 정보 검색을 제시하는데 사용될수 있다. 본 논문에서는 한국어 문서분류의 정확도를 높이기 위하여 문서내의 모든 단어들에 대한 확률값을 사용하여, 문서를 분류하는 기존의 방법과 달리 문서의 주제어를 선정하여 주제어로 선정된 단어들에 가중치를 부여하고 그렇지 않은 단어들에 대해서는 제거하너가 낮은 가중치를 부여하는 베이지안 분류자를 사용한다. 문서에는 특징으로 추출된 단어가 적어 문서를 분류하기 위한 만족할 만한 정보를 제공하지 못할 경우에 부족한 문서의 특징을 보충하기 위하여 말뭉치로부터 자동 단어 군집화를 통해 형성된 연관 단어 군집을 사용한다. 이러한 방법을 한국어 문서에 적용한 결과 기존의 베이지안 확률을 사용한 분류법보다 향상된 분류 정확도를 얻을 수 있었다. The automatic document classification is a method that assigns unlabeled documents to the existing classes. The automatic document classification can be applied to a classification of news group articles, a classification of web documents, showing more precise results of Information Retrieval using a learning of users. In this paper, we use the weighted Bayesian classifier that weights with keywords of a document to improve the classification accuracy. If the system cant classify a document properly because of the lack of the number of words as the feature of a document, it uses relevance word cluster to supplement the feature of a document. The clusters are made by the automatic word clustering from the corpus. As the result, the proposed system outperformed existing classification system in the classification accuracy on Korean documents.
허준희(Joone Hur),김형일(Miso Kim),권문영(Moonyoung Kim),이영석(Brian Lee),박수연(SooYeon Park) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1C
이동형 장치로 기존 인터넷에 존재하는 정보를 접근하는데는 많은 어려움이 존재한다. 이러한 어려움을 해결하려면 기존 정보를 각 이동형 장치에 맞게 새로 작성하거나 변환해야 한다. 본 논문에서는 기존 정보를 어떻게 이동형 장치에 맞게 변환하여 제공할 수 있는 방법과 구현 내용을 소개하고 한다.
문서의 주제어별 가중치와 말뭉치를 이용한 한국어 문서의 자동 분류 : 베이지안 분류자
허준희(Jun-Hui Her),고수정(Soo-Jeong Ko),김태용(Tae-Yong Kim),최준혁(Jun-Hyeog Choi),이정현(Jung-Hyun Lee) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.2Ⅱ
문서 분류는 미리 정의된 두 개 또는 그 이상의 클래스에 새로 생성되는 객체들을 할당하는 방법이다. 문서의 자동 분류에 대한 연구는 오래 전부터 연구되어 왔지만 한국어에 대한 적용 및 연구는 다른 분야에 비해 아직까지 활발히 이루어지지 않고 있다. 본 논문에서는 문서를 자동으로 분류하기 위해 문서의 주제어에 가중치를 부여하고, 부족한 문서의 특징을 보충하기 위하여 말뭉치로부터 주제어들과의 상호정보에 의해 추출된 단어를 사용하여 문서를 표현한 후, 가중치를 부여한 문서의 주제어에 베이지안 분류자를 사용하여 문서분류를 수행한다. 실험은 한국어 정보검색 실험용 데이터 집합인 KTset95 문서 4,414개 중 1,300개의 문서를 학습 집합으로, 1,000개의 문서를 분류에 대한 검증 집합으로 사용하였다. 실험 결과, 순수 베이지안 확률을 사용한 기존의 방법보다 실험 집합과 검증 집합에서 각각 1.92%, 4.3% 향상된 분류 정확도를 얻었다.
허준희 ( Heo Jun Hui ),이광찬 ( Lee Kwang Chan ),오재화 ( Oh Jae Hwa ),이문수 ( Lee Moon Soo ) 한국농공학회 1998 한국농공학회 학술대회초록집 Vol.1998 No.-
This study was carried out to analyze permeability of steel slag. Three molds with the same grading of raw steel slag were used to measure the coefficient of permeability. Darcy's law could be applied to the steel slag below 0.5 of critical hydraulic gradient because the water flow changed from laminar flow to turbulent flow above the critical hydraulic gradient. Also, the velocity of flow changed according to hydraulic gradient. The coefficient of permeability of the specimen was α×10<sup>-3</sup> cm/ sec.
허준희(Heu Jun-Hee),현대영(Hyun Dye-Young),이상욱(Lee Sang-Uk) 한국방송·미디어공학회 2008 한국방송공학회 학술발표대회 논문집 Vol.2008 No.-
채색화는 흑백 영상에 색 정보를 추가하거나 영상의 색을 변환하는 영상 개선 기법이다. 본 연구는 최소한의 사용자 개입을 통해 흑백 영상을 자연스러운 칼라 (color) 영상으로 전환하는 채색화 기법을 제안한다. 우리는 우선 자연스러운 채색 결과를 위한 채색화 함수를 정의한다. 제안하는 채색화 함수는 유사한 밝기 정보를 가지는 이웃 픽셀들은 비슷한 색 정보를 가질 확률이 높다는 간단한 가정 하에 MRF (Markov Random Field)에 기반하여 모델링한다. 채색화 함수에 의해 색이 전체적으로 자연스럽게 분포될 수 있도록, 확산 신뢰도를 정의한 후 신뢰도에 따라 채색 순서를 결정한다. 이후, 채색 순서에 따라 각 픽셀에 채색화 함수를 적용하여 자연스러운 채색 결과를 도출한다. 실험 결과에서 보듯이, 제안 기법은 적은 색상 정보의 입력을 통해 효과적으로 채색화 하며, 기존 기법에 비해 자연스러운 결과를 제시한다.