http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Random forest 를 이용한 RNA 에서의 단백질 결합 영역 예측
최대식 ( Daesik Choi ),박병규 ( Byungkyu Park ),채한주 ( Hanju Chae ),이욱 ( Wook Lee ),항경숙 ( Kyungsook Han ) 한국정보처리학회 2016 한국정보처리학회 학술대회논문집 Vol.23 No.2
단백질과 RNA 의 상호작용 데이터가 대량으로 늘어남에 따라, 단백질과 RNA 의 결합부위를 예측하는 계산학적인 방법들이 많이 개발되고 있다. 하지만, 많은 계산학적인 방법들은 단백질에서 단백질과 RNA 결합부위를 예측한다는 한계점이 있었다. 본 논문에서는 RNA 와 단백질의 서열정보를 모두 사용하여, 단백질과 결합하는 RNA 결합부위를 예측하는 기법과 그 결과를 논한다. WEKA random forest(http://www.cs.waikato.ac.nz/ml/weka/)를 이용하여 예죽 모델을 개발하였고, RNA 서열의 서열 프로파일, 서열 composition, 결합 상대방의 단백질의 특성 등을 특징으로 표현하였다. Random forest 기법을 사용한 cross validation 의 결과로서 1:1 모델에서 제일 높은 성능인 92.4% sensitivity, 92.0% specificity, 92.2% accuracy 를 보였고, independent test 에서는 72.5% sensitivity, 90.0% specificity, 92.1% accuracy 를 보였다.