http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
윤경오(Kyong Oh Yoon),조성배(Sung-Bae Cho) 한국정보과학회 2012 한국정보과학회 학술발표논문집 Vol.39 No.1B
초 고성능 바이오 서열 분석 장비 기술의 발달로 대량의 바이오 정보가 쏟아져 나오고 있으며, 바이오산업의 발달로 개인별 유전체 정보에 의한 맞춤의학의 시대가 도래되고 있다. 수많은 서열에 대한 분석에는 많은 저장장치 및 주기억장치가 필요하므로 슈퍼컴퓨터 급의 서버와 대량의 데이터를 빠르게 처리할 수 있는 프로그램이 필요하다. 이러한 분석에는 염기서열 일치 검색과 이를 기반으로 하는 Alignment와 Assembly 분석이 있으며, 이를 수행하는 기존의 알고리즘 및 대부분의 프로그램들은 염기서열을 문자열로 취급하고, 해쉬 인덱스 테이블, Brujin 그래프의 사용, 버러우즈 휠러 변환(BWT) 등의 기법을 활용하여 효율적인 분석을 도모하였다. 본 논문에서는 염기서열을 문자열이 아닌 k-mer 묶음의 정수형 하나로 변환하여 검색함으로써 저장 공간의 크기를 약 28% 이상으로 줄이고 형 변환 상태에서의 검색을 수행할 수 있는 알고리즘을 제안한다. Assembly 분석 프로그램인 CalcGen 프로그램을 개발하여 본 알고리즘의 효용성 및 효율성을 실험을 통해 검증하였다. 이 연구의 결과는 향후 대량의 유전체 염기서열의 효율적 분석과 저장 및 처리에 또 하나의 새로운 접근 방법을 제안하는데에 그 의미를 둘 수 있다.
시공간 효율적 DNA 서열 검색 알고리즘을 이용한 유전체 서열 어셈블러
윤경오(Kyong Oh Yoon),조성배(Sung-Bae Cho) 한국정보과학회 2012 정보과학회 컴퓨팅의 실제 논문지 Vol.18 No.11
초 고성능 바이오 서열 분석 장비(NGS) 기술의 발달로 대량의 바이오 정보가 쏟아져 나오고 있으며, 바이오 산업의 발달로 개인별 유전체 정보에 의한 맞춤의학의 시대가 다가오고 있다. 수많은 서열에 대한 분석에는 많은 저장공간이 필요하므로 슈퍼컴퓨터 급의 서버와 대량의 데이터를 빠르게 처리할 수 있는 프로그램이 필요하다. 이러한 분석에는 염기서열 일치 검색과 이를 기반으로 하는 Alignment와 Assembly 분석이 있으며, 이를 수행하는 기존의 알고리즘은 염기서열을 문자열로 취급하고, 해쉬 인덱스 테이블, Brujin 그래프의 사용, 버러우즈 휠러 변환(BWT) 등의 기법 등을 사용한다. 본 논문에서는 시간과 공간적으로 효율적인 DNA 검색을 위해 염기서열을 문자열이 아닌 k-mer 묶음의 정수형 배열로 변환한 후 단위 및 비단위 연산자로 검색함으로써 저장 공간의 크기를 약 28% 이상 줄여서 검색할 수 있는 알고리즘을 제안한다. 이에 기반한 Assembly 분석 프로그램인 CalcGen 프로그램을 개발하여 본 알고리즘의 유용성을 실험을 통해 검증하였다. The advent of ultra-high-throughput sequencing technology makes pour bulky bio-sequence information and the advance of bio-industry pull the era of personalized medicine using individual genome information. However, the analysis of massive bio-sequence requires large storages, so that analysis sometimes needs supercomputer and novel software that can handle bulky sequence information. In that type of analysis, there are sequence match algorithms based on alignment and assemble. These alignment and assemble are fundamental for analyzing bio-sequence. Those algorithms regard nucleotide sequences as strings and compare one by one character during analysis of sequences. They use hash index tables, de Bruijn graph, Burrows-Wheeler transform method, and so on. In this paper, for time and space efficient DNA searching, we propose an algorithm that transforms base sequence into k-mer integer array and analyzes the integer array transformed by unit search operator and non-unit search operator, resulting in the storage space reduced about 0.28 fold. Furthermore, based on the algorithm we have developed CalcGen assembler that is fundamental sequence analysis program, and show the usefulness of the program with experiments.
Particle Swarm Optimization 알고리즘을 이용한 바이오칩 데이터의 군집화 및 분류화 기법
이윤경(Yoon-Kyung Lee),윤혜정(Hyejung Yoon),이민수(Minsoo Lee),윤경오(Kyong Oh Yoon),최혜연(Hye Yeon Choi),김대현(Dae Hyun Kim),이근일(Keun il Lee),김대영(Dae Young Kim) 한국정보과학회 2007 한국정보과학회 학술발표논문집 Vol.34 No.2C
바이오 칩 분석 시스템은 다양한 종류의 바이오칩에서 자료를 추출하고 유용한 정보를 얻기 위해 데이터를 분석하는 시스템이다. 데이터를 분석하는 다양한 기법 중 대표적인 것이 클러스터링과 분류화(classification)이다. 클러스터링은 비슷한 개체들을 한 집단으로 묶는 방법이고, 분류화는 미리 정해진 클래스에 데이터를 해당하는 클래스로 분류하는 기법이다. 다양한 알고리즘을 통해서 데이터를 클러스터링 및 분류화를 할 수 있는데 바이오칩과 같이 데이터의 양이 방대한 경우는 생태계를 모방한 알고리즘을 적용하는 것이 효율적이다. 본 논문에서는 생태계 모방 알고리즘 중 하나인 PSO 집단 알고리즘을 사용하여 바이오칩 데이터로부터 클러스터의 중심을 찾아 클러스터링을 하고, 분류 규칙을 발견하여 이를 바이오데이터에 적용, 분류해 주는 시스템을 기술하고 있다.
유전체 염기서열의 base - composition에 대한 연구
정철희(Chol-Hee Jung),윤경오(Kyong-Oh Yoon),최진영(Jin-Young Choi),박현석(Hyun-Seok Park) 한국정보과학회 2001 한국정보과학회 학술발표논문집 Vol.28 No.1A
생물체가 생명을 영위하기 위해 수행하는 모든 기능들에 대한 정보는 각 개체가 가지고 있는 유전체에 들어있다. 그런데 각 생물체마다, 심지어는 한 생물체의 서로 다른 염색체마다 그 전체 염기서열에서의 base-composition 은 같지 않고, 또한 이 구성비에는 일정한 특징이 있다. 따라서 이 논문에서는 각 생물체들의 전체 염기서열을 구성하는 염기의 구성비에 대해 조사하고 비교해 보고자 한다.
유전자 알고리즘과 신경망을 이용한 DNA Chip 유전자 선택 방법 연구
이호일(Ho Il Lee),최요한(Yo Han Choi),윤경오(Kyong Oh Yoon),김명선(Myoung Sun Kim),강연수(Youn Soo Kang),박현석(Hyun Seok Park) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.2
최근 유전자 칩의 발전으로 다양하고 방대한 양의 유전자 정보를 이용한 정확하고 신뢰성 높은 분류, 군집 및 질병을 예측하는 분석 기법이 증가하고 있다. 하지만 특징적인 유전자를 선택하는 Gene Selection 기법의 종류는 많지가 않으며 주로 통계적인 방법에 의존하여 유전자를 선택하는 기법을 많이 사용하고 있다. 본 논문에서는 유전자 알고리즘과 신경망의 결합을 통한 데이터마이닝을 기반으로 신뢰성 높은 특징적인 유전자를 선택하는 Gene Selection 기법에 대하여 연구을 진행하였다.
바이오칩 데이터의 군집화를 위한 Particle Swarm Optimization Clustering 알고리즘
맹보연(Boyeon Meang),최옥주(Ok-ju Choi),이윤경(Yoonkyung Lee),이민수(Minsoo Lee),윤경오(Kyong Oh Yoon),최혜연(Hye Yeon Choi),김대현(Dae Hyun Kim),이근일(Keun il Lee) 한국정보과학회 2008 한국정보과학회 학술발표논문집 Vol.35 No.1
바이오칩을 이용하여 유전자를 분석하는데 이때 바이오 칩 분석 시스템을 이용한다. 바이오 칩은 유전자와 실험의 두 축으로 이루어져 있으며 바이오 칩 분석 시스템을 사용하여 바이오 칩에서 자료를 추출하고 필요한 정보를 얻기 위해 데이터를 분석하는 시스템이다. 데이터를 분석하는 기법 중 클러스터링을 사용하는데 유사한 유전자들을 찾아 내어 정해놓은 클러스터로 정의한다. 같은 클러스터 안에 있는 유전자들은 서로 비슷한 성질을 가지고 있기 때문에 사용자들은 이 바이오 칩 으로부터 나온 정보를 효율적이게 사용할 수 있다. 더욱 효율적으로 사용하기 위해 본 논문에서는 방대한 양의 데이터의 최적화에 효율적인 생태계 모방 알고리즘 Particle Swarm Optimization을 이용하여 데이터들을 클러스터링을 하여 분류하는 시스템을 기술하고 있다.
PSO(Particle Swarm Optimization) Algorithm의 DNA Chip 데이터 Classification
최옥주(Ok-ju Choi),맹보연(Boyeon Meang),이윤경(Yoonkyung Lee),이민수(Minsoo Lee),윤경오(Kyong Oh Yoon),최혜연(Hye Yeon Choi),김대현(Dae Hyun Kim),이근일(Keun il Lee) 한국정보과학회 2008 한국정보과학회 학술발표논문집 Vol.35 No.1
DNA Chip을 이용한 실험은 그 결과에 대하여 대용량의 정보를 쏟아내고 있다. 이러한 데이터를 분석하는 다양한 기법 중, 미리 정해진 클래스에 데이터를 해당하는 클래스로 분류하는 기법인 분류화를 수행하여 의도한 목표를 위한 규칙을 찾아내고자 한다. 본 논문에서는 이를 위해 DNA Chip과 같은 방대한 양의 정보 분석에 대하여 적합한 생태계 모방 알고리즘인 PSO Algorithm을 사용하여 분류 규칙을 발견하여 이를 데이터에 적용, 분류하는 연구를 기술하고 있다.