http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
임채균(Chae Gyun Lim),정용규(Yong-Gyu Jung) 大韓電子工學會 2012 電子工學會論文誌-CI (Computer and Information) Vol.49 No.2
최근 의료분야에서는 방대한 양의 정보를 효과적으로 처리하기 위하여 의사결정트리, 신경망, 베이지안망 등을 비롯한 각종 데이터마이닝 기법의 적용 방안을 연구하고 있다. 또한 환자의 기본적인 신상정보나 과거력, 가족력과 같은 정보 이외에도 MRI, HRCT 등의 영상정보를 추가적으로 수집하고 진단에 활용함으로써 질병진단의 정확도 향상을 도모하는 것이 일반적인 현황이다. 하지만 실제 상황에서는 결과에 영향을 미치는 다량의 변수가 존재하므로 특정 데이터마이닝 기법을 통하여 얻을 수 있는 정보가 상당히 제한적이라고 볼 수 있다. 그뿐만 아니라 촬영된 의료영상도 부수적으로 진단에 긍정적인 영향을 줄 수는 있지만, 주관적인 판단 비중이 높아 자동화된 시스템으로 처리하기가 난해한 문제이다. 이에 따라 현실의 복잡한 상황에서 상대적으로 대처가 유리하고 다변량 확률적인 모델을 기반으로 하는 베이지안망에서 K2나 TAN 등으로 탐색 알고리즘을 개선한 확장 모델이 제안되었다. 이 때, 적용되는 탐색 알고리즘의 종류에 따라 그 성능이 크게 좌우되는 확장 베이지안망의 특성상, 각 기법에 대한 성능과 적합성의 사실적인 평가가 요구된다. 따라서 본 논문에서는 확장 베이지안망에서 질병 진단에 대한 동일한 데이터를 이용하여 실험을 수행하였으며, K2, TAN과 같은 탐색 알고리즘에 변화를 주며 분류 정확도를 측정하였다. 실험에서는 10-fold 교차검증을 수행한 결과분석을 기반으로 성능을 비교평가하고, 발병 위험성이 높은 환자에 대한 HRCT 영상을 분류하여 고위험성의 데이터를 식별 가능하도록 하였다. Recently the medical field to efficiently process the vast amounts of information to decision trees, neural networks, Bayesian Networks, including the application method of various data mining techniques are investigated. In addition, the basic personal information or patient history, family history, in addition to information such as MRI, HRCT images and additional information to collect and leverage in the diagnosis of disease, improved diagnostic accuracy is to promote a common status. But in real world situations that affect the results much because of the variable exists for a particular data mining techniques to obtain information through the enemy can be seen fairly limited. Medical images were taken as well as a minor can not give a positive impact on the diagnosis, but the proportion increased subjective judgments by the automated system is to deal with difficult issues. As a result of a complex reality, the situation is more advantageous to deal with the relative probability of the multivariate model based on Bayesian network, or TAN in the K2 search algorithm improves due to expansion model has been proposed. At this point, depending on the type of search algorithm applied significantly influenced the performance characteristics of the extended Bayesian network, the performance and suitability of each technique for evaluation of the facts is required. In this paper, we extend the Bayesian network for diagnosis of diseases using the same data were carried out, K2, TAN and changes in search algorithms such as classification accuracy was measured. In the 10-fold cross-validation experiment was performed to compare the performance evaluation based on the analysis and the onset of high-risk classification for patients with HRCT images could be possible to identify high-risk data.
임채균(Chae-Gyun Lim),에이케이엠 토히둘 이슬람(A.K.M. Tauhidul Islam),정병수(Byeong-Soo Jeong) 한국정보과학회 2014 정보과학회논문지 : 데이타베이스 Vol.41 No.3
마이크로어레이(microarray) 데이터 분석은 특정 세포에서 발현(expression)되는 수천 가지 유전자로부터 중요한 생물학적 정보를 추출하기 위해 널리 사용되고 있다. 그러나 발현된 유전자들 중 대부분은 실제 임상 진단 및 질병 분류와 무관하거나 중요하지 않은 경우가 많기 때문에 소수의 중요한 유전자들을 선별하는 방법이 요구되고 있다. 본 논문에서는 맵리듀스(MapReduce) 프로그래밍 모델을 이용하여 확장 가능한(scalable) 병렬 유전자 선택 기법을 제안한다. 제안하는 기법은 맵리듀스 기반으로 유전자 선별 작업을 병렬적으로 수행하고, 분류의 정확도를 평가하기 위해 kNN 분류 알고리즘을 활용한다. 또한 실험 결과를 통하여 제안 기법이 데이터 크기의 증가와 노드 개수의 차이에 따라 좋은 확장성(scalability)을 제공하고 있고, 선별한 유전자들을 사용한 분류 결과가 전체 유전자 집합을 사용한 분류보다 더 높은 분류 정확도를 가지고 있음을 보인다. Microarray data analysis has been widely used for extracting relevant biological information from thousands of genes simultaneously expressed in a specific cell. Although thousands of genes are expressed in a sample tissue, most of them are irrelevant or insignificant to clinical diagnosis or disease classification because of missing values and some noise. Thus, finding a closely related small set of genes for accurately classifying disease cells is an important research problem. In this paper, we propose a scalable parallel gene selection method using the MapReduce programming model. The proposed method utilizes kNN classifier algorithm for evaluating classification accuracy and uses four real datasets and three synthetic datasets for experimentation. Experimental results show that the proposed method can give good scalability along with the increase of a data size and different numbers of nodes and it can also provide higher classification accuracy than using the whole gene set for classification.
ExoTime: Temporal Information Extraction from Korean Texts Using Knowledge Base
Young-Seob Jeong(정영섭),Chae-Gyun Lim(임채균),Ho-Jin Choi(최호진) 한국컴퓨터정보학회 2017 韓國컴퓨터情報學會論文誌 Vol.22 No.12
Extracting temporal information from documents is becoming more important, because it can be used to various applications such as Question-Answering (QA) systems, Recommendation systems, or Information Retrieval (IR) systems. Most previous studies only focus on English documents, and they are not applicable to the other languages due to the inherent characteristics of languages. In this paper, we propose a new system, named ExoTime, designed to extract temporal information from Korean documents. The ExoTime adopts an external Knowledge Base (KB) in order to achieve better prediction performance, and it also applies a bagging method to the temporal relation prediction. We show that the effectiveness of the proposed approaches by empirical results using Korean TimeBank. The ExoTime system works as a part of ExoBrain that is an artificial intelligent QA system.
대화 속 질문 유사성 분석을 위한 문장 임베딩 자질의 자동 추출 방법
오교중(Kyo-Joong Oh),이동건(Dongkun Lee),임채균(Chae-Gyun Lim),최호진(Ho-Jin Choi) Korean Institute of Information Scientists and Eng 2019 정보과학회논문지 Vol.46 No.9
This paper describes a method for the automatic extraction of feature vectors that can be used to analyze the similarity among natural language sentences. Similarity analysis among sentences is a necessary aspect of measuring semantic or structural similarity in natural language understanding. The analysis results can be used to find answers in Question and Answer (Q&A) systems and dialogue systems. The similarity analysis uses sentence vectors extracted by two deep learning models: the Recurrent Neural Network (RNN) to reflect sequential information of expressions such as syllables and semantic morphemes, and the Convolutional Neural Network (CNN) for characterizing the appearance patterns of similar expressions such as words or phrases. In this paper, we examine the accuracy and quality of the method using sentence vectors that are automatically extracted by the models from dialogues related to banking service. This method can find more similar questions and answers in FAQs than existing methods. The automatic feature extraction method can be used to analyze the similarity of Korean sentences across various application domains and systems.