http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
유승학 ( Seunghak Yu ),최민석,윤성로 ( Sungroh Yoon ) 한국정보처리학회 2014 한국정보처리학회 학술대회논문집 Vol.21 No.2
High Throughput Sequencing (HTS) 기술의 발달로 인해 시퀀싱 비용이 감소함에 따라 다양한 분야에서 이를 활용한 융합 연구가 활발하게 진행되고 있다. HTS 기술에서 가장 중요한 부분은 수백만개의 shot read 들을 표준유전체 (reference genome)에 정렬시키는 것인데 RNA 시퀀싱 (RNA-Seq)의 경우 RNA splicing 으로 인해 일반적인 aligner 로 처리가 불가능하다[1]. 복잡한 RNA-Seq 정렬 문제를 해결하기 위해 그동안 다양한 알고리즘들이 제안되어 왔다. 본 논문에서는 RNA-seq 정렬분야에서 잘 알려진 알고리즘들과 최신 알고리즘들을 살펴봄으로써 RNA-seq 정렬 알고리즘의 동향을 살펴보고자 한다.
샘플링 기반 Canopy Clustering 파라미터 설정 기법
최성운(Sungwoon Choi),유승학(Seunghak Yu),윤성로(Sungroh Yoon) 한국정보과학회 2012 한국정보과학회 학술발표논문집 Vol.39 No.1B
대용량 데이터를 효율적으로 군집화하기위해 개발된 Canopy Clustering은 2개의 파라미터 (T1, T2)에 기반하여 Canopy 형성이 결정되며, 결과적으로 이들 파라미터에 의해 군집화 결과가 크게 달라질 수 있다. 이에 따라 데이터의 특성을 잘 반영하는 파라미터 값을 적절히 선택하는 것이 매우 중요하지만, 자동화된 파라미터 설정 기법의 부재로 인하여, 기존 연구에서는 사용자의 경험에 의하여 Canopy Clustering의 파라미터 값을 설정하는 것이 일반적이었다. 본 논문에서는 통계적 샘플링을 이용하여 T1, T2의 값을 효과적으로 설정하는 방법을 제안한다.