RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        mRNA 리드 시퀀스 데이터를 이용한 선택 스플라이싱 유형 분석

        공진화(JinHwa Kong),윤지희(JeeHee Yoon),이은주(UnJoo Lee),이종근(JongKeun Lee),원정임(JungIm Won) 한국정보과학회 2011 정보과학회논문지 : 데이타베이스 Vol.38 No.6

        선택 스플라이싱은 단백질 생성 과정의 핵심 메카니즘으로서, DNA 조각들이 mRNA(messenger RNA)로 전사될 때 유전자의 엑손 영역들이 여러 가지 유형으로 다시 연결되는 과정을 말한다. 선택 스플 라이싱의 유형은 현재 7가지가 알려져 있으며, 이들 유형은 인간의 질병과 매우 밀접한 관련을 가지고 있다. 본 연구에서는 차세대 시퀀싱 기술로 생성된 mRNA 리드 시퀀스 데이터로부터 각 유전자 영역에 대한 선택 스플라이싱 유형을 분류/추출하는 새로운 알고리즘을 제안한다. 제안된 알고리즘에서는 mRNA 리드 시퀀스 데이터를 DNA 시퀀스와 mRNA 트랜스크립트 시퀀스에 동시 매핑하고, 각 엑손 영역에 정렬된 mRNA 리드 시퀀스 데이터의 커버리지 정보 및 엑손의 접합 정보를 이용하여 발현된 트랜스크립트의 종류와 양을 측정한다. 알고리즘의 유효성을 입증하기 위하여 시뮬레이션 데이터를 이용한 실험을 수행 하였으며, 실험 결과에 의하여 제안된 방식이 발현된 선택 스플라이싱 유형과 양을 매우 효율적으로 추출함을 보인다. Alternative splicing is a main source of generating a highly dynamic human proteome. It enables exons of genes to recombine in different ways when a segment of DNA is transcribed into messenger RNAs (mRNAs). There are seven patterns of alternative splicing which are known as typical ways in human genes. Alternative splicing has been found to be associated with many human diseases. This work proposes a novel method to identify alternative splicing patterns and analyze the distribution variations in a given gene expression process from mRNA read sequence data generated by next-generation sequencing (NGS) technology. The proposed method is based on parallel mapping of mRNA read sequence data to both genomic and transcriptomic reference sequences, and analyzes the mRNA read sequence data coverage and junctions spanning two exons. The preliminary results conducted with simulated data showed the prominent efficiency in identifying and quantifying events of alternative splicing.

      • KCI등재

        CNVDAT : 차세대 시퀀싱 데이터를 위한 유전체 단위 반복 변이 검출 및 분석 도구

        강인호(Inho Kang),공진화(Jinhwa Kong),신재문(JaeMoon Shin),이은주(UnJoo Lee),윤지희(Jeehee Yoon) 한국정보과학회 2014 정보과학회논문지 : 데이타베이스 Vol.41 No.4

        유전체 단위 반복 변이(CNV)는 유전적 구조변이의 하나로서, 암을 포함하는 인간의 질병과 밀접한 연관성이 있는 것으로 알려져 있다. 암 유전자를 규명하기 위하여, 연구자는 특정 암 환자의 대규모 유전체 데이터를 분석하여 CNV를 찾아내야하며, 동시에 대규모 유전/임상 데이터를 연계 분석하여야 한다. 본 연구는 NGS 데이터로부터 CNV를 추출하고, 추출된 CNV와 관련된 유전/임상 정보를 체계적으로 연계 분석하는 기능을 제공하는 새로운 분석 툴 CNVDAT를 제안한다. CNV 추출 모듈은 스케일 스페이스 필터링 기법을 이용하여 CNV를 추출하며, 리드 데이터에 잡음이 포함된 경우에도 CNV의 타입/위치를 정확히 추출해낸다. 또한 시퀀스 분석 모듈은 변이 영역의 브라우징 및 상호 비교를 지원하는 사용자 친화적 프로그램으로서, 암/정상 샘플의 변이 영역의 동시 분석 기능과 refGene, OMIM DB를 기반으로 하는 CNV-유전자-표현형 매핑의 연관성 분석 기능을 제공한다. 본 프로그램의 소스 코드와 샘플 프로그램은 http://dblab.hallym.ac.kr/CNVDAT/에서 다운 받을 수 있다. Copy number variations(CNVs) are a recently recognized class of human structural variations and are associated with a variety of human diseases, including cancer. To find important cancer genes, researchers identify novel CNVs in patients with a particular cancer and analyze large amounts of genomic and clinical data. We present a tool called CNVDAT which is able to detect CNVs from NGS data and systematically analyze the genomic and clinical data associated with variations. CNVDAT consists of two modules, CNV Detection Engine and Sequence Analyser. CNV Detection Engine extracts CNVs by using the multi-resolution system of scale-space filtering, enabling the detection of the types and the exact locations of CNVs of all sizes even when the coverage level of read data is low. Sequence Analyser is a user-friendly program to view and compare variation regions between tumor and matched normal samples. It also provides a complete analysis function of refGene and OMIM data and makes it possible to discover CNV-gene-phenotype relationships. CNVDAT source code is freely available from http://dblab.hallym.ac.kr/CNVDAT/.

      • KCI등재

        개 회충 게놈 응용 사례에서 공개용 분석 툴을 사용한 드래프트 게놈 어셈블리 생성

        원정임(JungIm Won),공진화(JinHwa Kong),허선(Sun Huh),윤지희(JeeHee Yoon) 한국정보과학회 2014 정보과학회 컴퓨팅의 실제 논문지 Vol.20 No.9

        NGS 기술의 발달로 시퀀싱 비용이 급격히 하락됨에 따라 대규모 크기의 유전체 염기 서열 해독을 소규모의 실험실에서 수행할 수 있게 되었다. 디노버 어셈블리는 표준 유전체가 없는 새로운 종을 시퀀싱하는 경우 리드들의 염기 서열 정보를 이용하여 재구성함으로써 원래의 전체 시퀀스를 복원하는 것이다. 최근 이와 관련된 많은 연구 결과가 보고되고 있으나, 충분한 분석 노하우와 명확한 가이드라인 등이 공개되어 있지 않기 때문에 이들 연구에서 제시하는 동일한 어셈블리 수행 과정 및 분석 툴들을 사용하더라도 만족할만한 수준의 어셈블리 결과를 얻지 못하는 경우가 발생한다. 본 연구에서는 이러한 문제점을 해결하기 위하여 NGS 기술과 디노버 어셈블리 기술을 이용하여 아직 밝혀지지 않은 생물체의 전체 DNA의 염기 서열을 밝히기 위한 일련의 과정들을 단계별로 소개하고, 각 단계에서 필요로 하는 공개용 분석 툴의 장단점을 분석하여 제시한다. 이러한 과정별 단계를 구체적으로 설명하기 위하여 본 연구에서는 350Mbp 크기의 개 회충 게놈을 응용 사례로 사용한다. 또한 디노버 어셈블리 과정을 통해 새롭게 어셈블리된 시퀀스와 다른 유사 종과의 상동성 분석을 수행하여 어셈블리된 시퀀스에서의 유전자 영역 추출과 추출된 유전자의 기능을 예측한다. It has become possible for small scale laboratories to interpret large scale genomic DNA, thanks to the reduction of the sequencing cost by the development of next generation sequencing (NGS). De novo assembly is a method which creates a putative original sequence by reconstructing reads without using a reference sequence. There have been various study results on de novo assembly, however, it is still difficult to get the desired results even by using the same assembly procedures and the analysis tools which were suggested in the studies reported. This is mainly because there are no specific guidelines for the assembly procedures or know-hows for the use of such analysis tools. In this study, to resolve these problems, we introduce steps to finding whole genome of an unknown DNA via NGS technology and de novo assembly, while providing the pros and cons of the various analysis tools used in each step. We used 350Mbp of Toxocara canis DNA as an application case for the detailed explanations of each stated step. We also extend our works for prediction of protein-coding genes and their functions from the draft genome sequence by comparing its homology with reference sequences of other nematodes.

      • KCI등재

        NGS 데이터를 이용한 대용량 게놈의 디노버 어셈블리

        원정임(JungIm Won),홍상균(Sangkyoon Hong),공진화(JinHwa Kong),허선(Sun Huh),윤지희(JeeHee Yoon) 한국정보과학회 2013 정보과학회논문지 : 데이타베이스 Vol.40 No.1

        디노버 어셈블리는 레퍼런스 시퀀스 없이 리드의 염기 서열 정보를 이용하여 원래의 전체 시퀀스(original sequence)로 추정되는 시퀀스로 리드들을 재구성하는 방식이다. 최근의 NGS(Next Generation Sequencing) 기술은 대용량 리드를 훨씬 쉽게 저비용으로 생성할 수 있다는 장점이 있어, 이를 이용한 많은 연구가 이루어지고 있다. 그러나 NGS 리드 데이터를 이용한 디노버 어셈블리에 관한 연구는 국내외적으로 매우 미흡한 실정이다. 그 이유는 NGS 리드 데이터를 이용하여 디노버 어셈블리를 수행하는 경우 대용량 데이터, 복잡한 데이터 구조 및 처리 과정 등으로 인하여 매우 많은 시간과 공간이 소요될 뿐만 아니라 아직까지 다양한 분석 툴과 분석 노하우 등이 충분히 개발되어 있지 않기 때문이다. 본 연구에서는 NGS 리드 데이터를 이용한 대용량 게놈의 디노버 어셈블리를 위한 분석 방법론에 대하여 논하고, 다양한 실험과 분석을 통하여 디노버 어셈블리의 실효성과 정확성을 검증한다. 또한 디노버 어셈블리의 처리 시간 및 공간 오버헤드를 해결하기 위하여 유사 종과의 리드 정렬 결과를 활용하는 방안과 어셈블리 결과의 정확성과 효율성을 향상시키기 위하여 두 개의 서로 다른 디노버 어셈블리 알고리즘을 접목하는 하이브리드 디노버 어셈블리 기법을 제안한다. De novo assembly is a method which creates a putative original sequence by reconstructing reads without using reference sequence. Advanced studies in many areas use NGS data owing to the ultra high throughput and low cost. However, researches on de novo assembly using NGS data are not sufficient yet because de novo assembly requires a lot of execution time and memory space to process for large and complex structured NGS data. Furthermore analysis tools and know-hows to handle massive amount short reads such as NGS data have not been fully developed. This paper discusses a noble analysis method of de novo assembly in the use of large volume of NGS data and verify the effectiveness and the accuracy of the proposed method via various experiments. Then, we propose a method which aligns read data to sequences of similar species in order to overcome the resource overhead of de novo assembly. We also propose a hybrid method which combines two algorithms in order to increase the effectiveness and accuracy of de novo assembly.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼