http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Hitting Set 문제를 이용한 Next Generation Sequencing Read의 효율적인 처리
박태원(TaeWon Park),김소라(Sora Kim),최석문(SeokMoon Choi),조환규(Hwan-Gue Cho),이도훈(DoHoon Lee) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.1B
최근에 등장한 Next Generation Sequencing(NGS)은 전통적인 방법에 비해 빠르고 저비용으로 대용량의 시퀀스 데이터를 이용한 차세대 시퀀싱 기술을 말한다. 이렇게 얻은 NGS 데이터를 분석하는 단계 중에서 alignment 단계는 시퀀서에서 얻은 대량의 read를 참조 염기서열에 맵핑하는 단계로 NGS 데이터 분석의 가장 기본이면서 핵심인 단계이다 도구는 긴 참조 염기서열을 색인화해서 짧은 read를 . alignment빠르게 맵핑하는 용도로 사용된다 현재 많이 사용되고 있는 일반적인 도구들은 입력데이터에 . alignment 대한 별도의 전처리 과정이 없으며 나열된 를 순차적으로 맵핑하는 단순한 구조를 가지고 있다 본 read . 논문은 데이터의 특징 중에 특히 간의 중복성이 존재하고 이를 이용한 의 효율적 공통부분 NGS read read 서열을 찾는다 중복이 가능한 의 공통부분서열과 의 관계를 그래프 이론의 문제로 . read read Hitting Set 모델링하고 여러 가 포함하는 공통 부분서열을 사용해서 단계의 효율을 높일 수 방법을 제 read alignment 안한다.
Hitting Set 문제를 이용한 차세대 염기서열 분석 리드의 처리속도 개선 방법
박태원(TaeWon Park),김소라(Sora Kim),최석문(SeokMoon Choi),조환규(Hwan-Gue Cho),이도훈(DoHoon Lee) 한국정보과학회 2011 정보과학회논문지 : 시스템 및 이론 Vol.38 No.6
최근에 등장한 Next Generation Sequencing(NGS)은 전통적인 방법에 비해 빠르고 저비용으로 대용량의 단편 서열 데이터를 얻을 수 있는 차세대 염기서열 분석 기술을 말한다. 이렇게 얻어진 NGS 데이터를 분석하는 단계 중에서 얼라인먼트(alignment) 단계는 시퀀서에서 얻은 대량의 리드(read)를 참조 염기서열에 맵핑하는 단계로 NGS 데이터 분석의 가장 기본이면서 핵심인 단계이다. 얼라인먼트 도구는 긴 참조 염기서열을 색인화해서 짧은 리드를 빠르게 맵핑하는 용도로 사용된다. 현재 많이 사용되고 있는 일반적인 얼라인먼트 도구들은 입력데이터에 대한 별도의 전처리 과정이 없으며 나열된 리드를 순차적으로 맵핑하는 단순한 구조를 가지고 있다. 본 논문은 NGS 데이터의 특징 중에 특히 리드간의 중복성을 이용한 리드의 효율적 공통 부분서열을 찾는 방법을 보여준다. 중복된 공통 부분서열과 그것이 포함된 리드의 관계를 그래프 이론의 Hitting Set 문제로 모델링하고 여러 리드가 포함하는 공통 부분서열을 사용해서 얼라인먼트 단계의 효율을 높일 수 방법을 제안한다. Next Generation Sequencing(NGS) is a faster and lower cost new sequencing technique getting huge-large scale fragment, called reads, sequence data than traditional sequencing. The next step to analyze the large-scale reads is to align to the reference genome sequence which is a fundamental and most important stage. Alignment tools in NGS are used for mapping short reads quickly using a indexed reference sequence. Most general alignment tools process listed reads sequentially without analyzing redundancy of inter-read of NGS data. In this paper, we explore efficient common subsequences using redundancy of inter-read in characteristics of NGS data. Relation between redundant common subsequences and reads containing them is modeled as hitting set problem in graph theory. Also we suggest a way to improve performance of alignment stage.
Splice Junction 탐색에 특화된 기존 도구들의 분석
김소라 ( Sora Kim ),박태원 ( Taewon Park ),최석문 ( Seokmoon Choi ),박기정,이도훈 ( Dohoon Lee ),조환규 ( Hwan-gue Cho ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.2
오늘날에는 HGP(Human Genome Project)로 인해 인간과 같은 고등생물은 높은 비율로, 단백질을 만들어낼 때 유전자 개수를 늘려 나가는 것이 아니라 유전자의 활용도를 높임으로써 다양한 단백질을 만들어낸다 새로운 사실이 밝혀졌다. 이로 인해 alternative splicing에 대한 관심이 높아지고 있다. Alternative splicing의 비중이 높아지며 이에 따라 이를 찾아내기 위한 다양한 방법들이 생겨나고, 이러한 방법 중 하나가 splice junction을 찾아내는 것이다. 본 논문에서는 splice junction 탐색을 위한 도구를 개발하기에 앞서 이미 기존에 존재하는 도구들을 조사하여 해당 도구들이 어떠한 사양과 알고리즘을 사용하는지를 분석 및 비교하였다.