http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
A robust peak detection method for RNA structure inference by high-throughput contact mapping.
Kim, Jinkyu,Yu, Seunghak,Shim, Byonghyo,Kim, Hanjoo,Min, Hyeyoung,Chung, Eui-Young,Das, Rhiju,Yoon, Sungroh Oxford University Press 2009 Bioinformatics Vol.25 No.9
<P>MOTIVATION: For high-throughput prediction of the helical arrangements of large RNA molecules, an innovative method termed multiplexed hydroxyl radical (*OH) cleavage analysis (MOHCA) has been proposed. A key step in this promising technique is to detect peaks accurately from noisy radioactivity profiles. Since manual peak finding is laborious and prone to error, an automated peak detection method to improve the accuracy and throughput of MOHCA is required. Existing methods were not applicable to MOHCA due to their high false positive rates. RESULTS: We developed a two-step computational method that can detect peaks from MOHCA profiles in a robust manner. The first step exploits an ensemble of linear and non-linear signal processing techniques to find true peak candidates. In the second step, a binary classifier trained with the characteristics of true and false peaks is used to eliminate false peaks out of the peak candidates. We tested the proposed approach with 2002 MOHCA cleavage profiles and obtained the median recall, precision and F-measure values of 0.917, 0.750 and 0.830, respectively. Compared with the alternatives considered, the proposed method was able to handle false peaks substantially better, thus resulting in 51.0-71.8% higher median values of precision and F-measure. AVAILABILITY: The software and supplementary data are available at http://dna.korea.ac.kr/pub/mohca.</P>
vHoT: a database for predicting interspecies interactions between viral microRNA and host genomes.
Kim, Hanjoo,Park, Seunghyun,Min, Hyeyoung,Yoon, Sungroh Springer-Verlag 2012 Archives of virology Vol.157 No.3
<P>Some viruses have been reported to transcribe microRNAs, implying complex relationships between the host and the pathogen at the post-transcriptional level through microRNAs in virus-infected cells. Although many computational algorithms have been developed for microRNA target prediction, few have been designed exclusively to find cellular or viral mRNA targets of viral microRNAs in a user-friendly manner. To address this, we introduce the viral microRNA host target (vHoT) database for predicting interspecies interactions between viral microRNA and host genomes. vHoT supports target prediction of 271 viral microRNAs from human, mouse, rat, rhesus monkey, cow, and virus genomes. vHoT is freely available at http://dna.korea.ac.kr/vhot.</P>
Kim, Jinkyu,Kim, Hanjoo,Min, Hyeyoung,Yoon, Sungroh IEEE 2011 IEEE Transactions on Biomedical Engineering Vol.58 No.5
<P>For rapid ribonucleic acid (RNA) tertiary structure prediction, innovative methods have been proposed that exploit hydroxyl radical cleavage agents in a high-throughput manner. In such techniques, it is critical to determine accurately which residue a specific cleavage agent interacts with, since this information directly reveals the residue-residue interaction points needed for structure inference. Due to lack of effective automated methods, the process of locating contact points has been mostly done manually, becoming a bottleneck of the whole procedure. To address this problem, we propose a novel computational method to determine residue-residue interaction points from 2-D electrophoresis profiles. This method combines the deconvolution method for signal detection and statistical learning techniques for filtering noise, thus boosting specificity and sensitivity in harmony. According to our experiments with over 2000 actual gel profiles, the proposed technique exhibited 56.44%-90.50% higher performance than traditional methods in terms of the accuracy of reproducing manual contact maps measured by the F-measure, a widely used evaluation metric. We expect that adopting the proposed technique will significantly accelerate RNA tertiary structure inference, allowing researchers to explore more structures in given time.</P>
신호처리 기법과 기계학습을 이용한 지능형 피크 검출 알고리즘
김한주(Hanjoo Kim),윤성로(Sungroh Yoon) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.2C
최근 실험이나 자료의 축적으로 가용한 데이터의 양이 급격히 증가함에 따라 이를 자동으로 처리해야 할 필요성이 점점 늘고 있다. 그러나 많은 경우에 이 작업은 수작업으로 이루어지거나 전통적인 신호처리 알고리즘을 이용하여 진행된다. 이러한 전통적인 방법은 많은 경우에 처리량에서 한계를 보이거나 만족할 만한 정확도를 보장하지 못한다. 이 연구에서는 전통적인 신호처리 기법에 기계학습 알고리즘을 접목하여 좀 더 정확하면서도 고속의 피크 검출 방법을 제안하고자 한다. 본 연구에서 제안하는 알고리즘은 전체 과정은 2 단계로 진행 된다. 첫 번째 단계에서는 median smoothing이나 신호 증폭과 같은 전통적인 선형/비선형 신호처리 기법들을 이용하여 잠정적으로 피크가 될 수 있는 후보군을 최대한 확보한다. 두 번째 단계에서는 얻어진 후보군을 기존에 실 피크라고 알려진 피크들의 정보로 훈련된 이진 분류기를 사용하여 실 피크가 아니라고 판정되는 피크들을 제거하여 실 피크를 분류해낸다. 기존의 Low-pass filtering 방식에 비해 F-척도 값에서 167% 정도의 성능 향상이 있었다.
김한주(Hanjoo Kim),이성민(Sungmin Lee),박승현(Seunghyun Park),윤성로(Sungroh Yoon) 한국정보과학회 2012 한국정보과학회 학술발표논문집 Vol.39 No.1B
생물 검정(Bioassay)이란 생체 조직이나 분자의 구조 분석이나 기능 해석, 화합물이나 약에 의한 영향성을 실험하기 위해 실험체 조직과 약물의 상호작용에 의한 생성물의 양적 세기를 측정하는 과학적 실험 방법의 총칭이다. 바이오 어세이 실험 방법은 Gas Chromatography, 시험관 전기영동(Capillary Electrophoresis), 핵자기공명(NMR) 등의 다양한 실험 데이터를 포함한다. 결과로 생성된 실험 데이터를 정량적으로 분석하기 위해서는 일관성을 위해 얻어진 데이터를 정렬하는(alignment) 과정을 거쳐야 한다. 본 연구에서는 알려진 정렬 알고리즘들을 비교하기 위해, 알고리즘의 유형별로 분류하고 그 결과물을 분석하여 성능을 비교함과 동시에 특성을 파악하고자 한다.
텍스트 기반 감정 추정을 위한 특징 추출 및 선택기법에 따른 성능 연구
김한주 ( Hanjoo Kim ),하헌석 ( Heonseok Ha ),박승현 ( Seunghyun Park ),윤성로 ( Sungroh Yoon ) 한국정보처리학회 2014 한국정보처리학회 학술대회논문집 Vol.21 No.2
인터넷 사용량이 급증하고 사용자들이 생성하는 데이터의 양이 증가함에 따라 사용자 데이터 분석은 객관적인 정보 탐색과 분석을 넘어 주관적인 감정을 분석하는 데까지 시도되고 있다. 이러한 감정 분석은 사업,행정,외교 둥의 다양한 분야에 걸쳐 응용 될 수 있다. 본 연구에서는 텍스트 데이터를 주요 분석 대상으로 하여 문장 구성의 다양한 요소를 특징화하고,특징화된 문장에 대해 다양한 서포트벡터머신을 통한 학습을 시도함으로써 텍스트가 내포한 감정을 추측한다. 다양한 특징화 방법을 적용하되,낮은 밀도가 될 것으로 추측되는 데이터 매트릭스의 차원 감쇄를 위해 정보엔트로피 기반의 특징 선택기법을 적용한다.
건축물 에너지 수요 예측을 위한 이종 공공 데이터 통합 방안 연구
김철호(Chulho Kim),김한주(Hanjoo Kim),변지욱(Jiwook Byun),고재현(Jaehyun Go),허연숙(Yeonsook Heo) 대한설비공학회 2022 대한설비공학회 학술발표대회논문집 Vol.2022 No.6
This study investigated a method of integrating building energy-consumption public data such as MOLIT EAIS and KEPCO AMI to develop the probabilistic models to predict the electricity demand of non-residential buildings. The data set was created by integrating electricity data composed by consideration of time (24 hours) of 9 business types into 5 building types (i.e., education, office, hotel, culture, retail). Individual building energy data source alone provides partial information, and different data sources are at different temporal resolution. Therefore, there is a strong need to develop a framework to integrate various types of public data sets, and this data-integration framework will be essential to develop building energy forecasting models at high resolution levels.
교육 시설의 전력 수요 예측을 위한 클러스터링 기반 확률적 통계 모델 개발
김철호(Chulho Kim),김한주(Hanjoo Kim),변지욱(Jiwook Byun),고재현(Jaehyun Go),허연숙(Yeonsook Heo) 대한설비공학회 2022 대한설비공학회 학술발표대회논문집 Vol.2022 No.6
This study developed the probabilistic models of the internal electricity load for educational buildings on the basis of the structured probabilistisic model framework developed in the previous study for residential buildings. In this process, heterogeneous public data sosurces (MOLIT EAIS and KEPCO AMI) were used, and differences in internal electricity load within education buildings were invetigated with using the clustering method. The cluster analysis revealed two distinctive load profiles, which may be due to different types of educational purposes: schools and private educational institutes. Within each cluster of buildings, individual-building variations of internal electricity load, as well as temporal variations of internal electricity load were quantified by the structured probabilistic models Statistical models 1 and 3 can represent individual variations in internal electricity load for each building, and statistical models 2 and 4 can reflect temporal variations in hourly internal electricity load patterns that change daily.
건축물 에너지 수요 예측을 위한 이종 공공 데이터 통합 방안 연구
김철호(Chulho Kim),김한주(Hanjoo Kim),변지욱(Jiwook Byun),고재현(Jaehyun Go),허연숙(Yeonsook Heo) 대한설비공학회 2022 대한설비공학회 학술발표대회논문집 Vol.2022 No.6
This study investigated a method of integrating building energy-consumption public data such as MOLIT EAIS and KEPCO AMI to develop the probabilistic models to predict the electricity demand of non-residential buildings. The data set was created by integrating electricity data composed by consideration of time (24 hours) of 9 business types into 5 building types (i.e., education, office, hotel, culture, retail). Individual building energy data source alone provides partial information, and different data sources are at different temporal resolution. Therefore, there is a strong need to develop a framework to integrate various types of public data sets, and this data-integration framework will be essential to develop building energy forecasting models at high resolution levels.