RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재
      • KCI등재후보

        짧은 리드의 서열정럴에 의한 CNV 영역 추출

        홍상균,홍동완,윤지희,김종일 한국정보과학회 2008 데이타베이스 연구 Vol.24 No.3

        Recently it was found that various genetic structural variations such as CNV(copy number variation) exist in the human genome, and these variations are closely related with disease susceptibility, reaction to treatment, and genetic characteristics. In this paper we propose a new method that effectively detects CNV regions by aligning millions of short DNA sequences (reads) produced by giga-sequencing technology to the reference sequence. Our method consists of two steps: it first maps the reads to the reference sequence efficiently by using the suffix tree index structure. Next, it detects the candidate CNV regions by analyzing the occurrence frequency of each read in the reference sequence. The result of simulation experiments (using a reference sequence, build 35 of NCBI) revealed that our approach not only successfully finds the CNV regions but also significantly outperforms the sequential scan method. 최근,인간의 유전제에는 CNV(copy num mr γari ati on)를포함하는다양한 유전적 구조 변이가 존재하며,이는 기능적으로질병에 대한 감수성 치료에 대한 반응 유전적 특성 등과 밀접한 관련이 있음이 밝혀졌다.본논문에서는 기가시퀀싱 결과 산출되는 수많은 짧은 DNA 서열 조각인 리드(read)를 레퍼런스 서열과 정렬시켜 CNV 영역을 검색하는 새로운 방식을 제안한다. 제안하는 기법에서는 접미어 트리 인덱성 기법을 사용하여 레퍼런스 서열 상에 각 리드의 정렬 위치를 검색한 후 그위치를 기반으로 리드의 출현 빈도를 계산하여 CNV의 추정영역을 찾아낸다. 또한 NCRT(National Center for Biotechnology Information) 의 레퍼런스 서열(build 35.)을 사용한 시뮬레이션 실험을 행하여 제안된 방법이 CNV 영역을 적절히 추출함을 이고,또한 대규모 데이터를 시간 효율적으로 처리할 있음을 보인다.

      • KCI등재

        보강재를 사용한 철근콘크리트 보의 휨·전단내력에 관한 실험적연구

        홍상균,은희창,박기철,정헌수,Hong, Sang-Kyun,Eun, Hee-Chang,Park, Ki-Choul,Chung, Heon-Soo 한국구조물진단유지관리공학회 1997 한국구조물진단유지관리공학회 논문집 Vol.1 No.1

        In this paper, It is the effect of using fiber sheet (Carbon Fiber Sheet & Aramid Fiber Sheet) and Steel Plate for reinforced concrete beam. 25 specimens are tested, 16 specimens are for bending capacity and the other are for shear capacity. In the case of bending testing, the kind and quantity of the reinforcement materials, the bondage and the existence of crack were selected as experimental variables. In the case of shear testing, It is testified the effect of reinforcement with the variables of the method of reinforcement (side type and U type). As a result, Using the reinforcing materials can increase the capacity of bending and shear stress.

      • KCI등재

        정렬된 리드의 통계적 분석을 기반으로 하는 CNV 검색 알고리즘

        홍상균,홍동완,윤지희,김백섭,박상현,Hong, Sang-Kyoon,Hong, Dong-Wan,Yoon, Jee-Hee,Kim, Baek-Sop,Park, Sang-Hyun 한국정보처리학회 2009 정보처리학회논문지D Vol.16 No.5

        인간의 유전체 서열에는 유전체 단위반복변위(copy number variation, CNV)를 포함하는 다양한 유전적 구조 변이(genetic structural variation)가 존재하며, 이는 기능적으로 질병에 대한 감수성, 치료에 대한 반응, 유전적 특성 등과 밀접한 관련이 있다. 본 논문에서는 기가 시퀀싱(giga sequencing)의 결과 산출되는 대량의 짧은 길이의 DNA 서열 데이터를 이용한 새로운 CNV 검색 방식을 제안한다. 제안하는 알고리즘에서는 레퍼런스 시퀀스에 DNA 서열 데이터를 서열 정렬시켜 각 레퍼런스 시퀀스의 위치에 대한 서열 데이터의 출현 빈도 정보를 얻은 후, 출현 빈도 정보의 패턴을 분석하여 통계적 유의성을 갖는 1kbp 이상의 연속 영역을 CNV 후보 영역으로 추출한다. 또한 제안된 알고리즘을 효율적으로 지원하기 위한 서열 정렬 방식에 대한 비교 및 분석을 수행한다. 제안된 기법의 유용성을 규명하기 위하여 다양한 실험을 수행하였다. 실험 결과에 의하면, 제안된 기법은 비교적 낮은 커버리지의 기가 시퀀싱 데이터를 이용하여 반복되거나 결실되는 다양한 형태의 CNV 영역을 효율적으로 검출하며, 또한 작은 사이즈의 CNV 영역에서부터 큰 사이즈의 CNV 영역까지 다양한 크기의 CNV 영역을 효율적으로 검출 할 수 있는 것으로 나타났다. Recently it was found that various genetic structural variations such as CNV(copy number variation) exist in the human genome, and these variations are closely related with disease susceptibility, reaction to treatment, and genetic characteristics. In this paper we propose a new CNV detection algorithm using millions of short DNA sequences generated by giga-sequencing technology. Our method maps the DNA sequences onto the reference sequence, and obtains the occurrence frequency of each read in the reference sequence. And then it detects the statistically significant regions which are longer than 1Kbp as the candidate CNV regions by analyzing the distribution of the occurrence frequency. To select a proper read alignment method, several methods are employed in our algorithm, and the performances are compared. To verify the superiority of our approach, we performed extensive experiments. The result of simulation experiments (using a reference sequence, build 35 of NCBI) revealed that our approach successfully finds all the CNV regions that have various shapes and arbitrary length (small, intermediate, or large size).

      • 클라우드 컴퓨팅 기반의 병렬 CNV 검출 알고리즘

        홍상균 ( Sang-kyoon Hong ),윤지희 ( Jee-hee Lee ),이은주 ( Un-joo Lee ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.1

        시퀀싱 기술의 발달로 최근에는 비교적 저렴한 비용으로 개인의 유전체 시퀀싱 데이터를 산출할 수 있게 되었다. 하지만 이를 기반으로 하는 기존의 분석 방법은 매우 고가의 컴퓨팅 환경을 요구하기 때문에 분석을 위한 비용이 매우 높은 문제가 있다. 본 논문에서 클라우드 컴퓨팅 환경의 병렬 CNV 검출알고리즘을 제안한다. 제안하는 방법은 모양 기반의 CNV 검출 알고리즘인 CNV_shape을 MapReduce기법으로 개발한 것으로 시퀀싱 데이터를 레퍼런스 서열에 매핑한 결과로부터 리드 커버리지 (read coverage)를 계산하여 커버리지가 감소하거나 증가하는 일정 길이 이상의 영역을 검출하는 방법이다. 클라우드 컴퓨팅 환경에 적용하고 노드의 밸런싱 유지를 위한 방법으로 파티셔닝 기법을 사용하였다. 또한 실 데이터를 이용한 실험을 통해 제안하는 방법의 효율적 데이터 처리를 보인다.

      • CNV 영역 검색 알고리즘

        홍상균 ( Sang-kyoon Hong ),홍동완 ( Dong-wan Hong ),윤지희 ( Jee-hee Yoon ) 한국정보처리학회 2008 한국정보처리학회 학술대회논문집 Vol.15 No.2

        최근 생물정보학 분야에서 인간 유전체에 존재하는 CNV(copy number variation)에 관한 연구가 주목 받고 있다. CNV 영역은 lkbp~3Mbp 사이의 서열이 반복되거나 결실되는 변이 영역으로 정의된다. 우리는 선행 연구에서 기가 시퀀싱(giga sequencing)의 결과 산줄되는 DNA 서열 조각인 리드(read)를 레퍼런스 시퀀스에 서열 정렬하여 CNV 영역을 찾아내는 새로운 CNV 검색 방식을 제안하였다. 후속 연구로서 본 논문에서는 DNA 서열에 존재하는 repeat 영역 문제를 해결하기 위한 새로운 방안을 제안하고, 리드의 출현 빈도 정보를 분석하여 CNV 영역을 찾아내는 CNV 영역 검색 알고리즘을 보인다. 제안된 알고리즘은 Gaussian 분포를 갖는 출현 빈도 정보로부터 통계적 유의성을 갖는 영역을 추출하여 CNV 영역 후보로 하고, 다음 정제 과정을 거쳐 최종의 CNV 영역을 추출한다. 성능 평가를 위하여 프로토타입 시스템을 개발하였으며, 시뮬레이션 실험을 수행하였다. 실험 결과에 의하여 제안된 방식은 반복되거나 결실되는 형태의 CNV 영역을 효율적으로 검출하며, 또한 다양한 크기의 CNV 영역을 효율적으로 검출할 수 있음을 입증한다.

      • GSDAT : 기가 시퀀싱 데이터 분석을 위한 도구

        홍상균(Sang-Kyoon Hong),이상진(Sang-Jin Lee),김덕근(Deok-Keun Kim),공진화(Jin-Hwa Kong),윤지희(Jee-Hee Yoon) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.2C

        최근, 기가시퀀싱(giga-sequencing) 기술의 발달로 비교적 저렴한 비용으로 개인의 유전체 시퀀싱이 가능해지고 있다. 하지만 기가시퀀싱 기술의 빠른 발전 속도에 비해 이들 데이터 처리를 위한 분석 도구의 개발은 매우 미비한 상황이다. 본 논문에서는 기가 시퀀싱 결과로 산출되는 수많은 짧은 DNA 서열조각인 리드를 레퍼런스 서열에 매핑한 결과를 관리, 분석하는 도구, GSDAT를 제안한다. GSDAT는 다양한 매핑결과 포맷을 통합하는 스키마와 이를 데이터베이스화하여 저장, 관리하는 시스템을 제공한다. 또한 매핑결과의 커버리지 분석을 위한 고해상도의 뷰어 기능을 제공하며, 사용자의 요구에 따라 다양한 유전체 데이터베이스와 연동되어 유전자 정보, 리피트 영역, 변이 영역 등과 같은 생물학 정보를 실시간으로 제공한다.

      • DNA 시퀀스 검색을 위한 효율적인 인덱스 기법

        홍상균(Sang-Kyoon Hong),원정임(JungIm Won),윤지희(JeeHee Yoon) 한국정보과학회 2006 한국정보과학회 학술발표논문집 Vol.33 No.2C

        DNA 시퀀스 데이터베이스 규모의 급격한 증가 추세를 고려할 때, DNA 시퀀스 검색 연산을 보다 효과적으로 지원할 수 있는 인덱싱 및 질의 처리 기술이 요구 된다. 접미어 트리는 DNA 시퀀스 검색을 위한 좋은 인덱스 구조로 알려져 왔다. 그러나 접미어 트리는 그 구조적 특성으로 인하여 저장공간, 검색 성능, DBMS와의 통합 등의 문제점을 갖는다. 본 논문에서는 이와 같은 접미어 트리의 문제점들을 해결하는 DNA 시퀀스 검색을 위한 새로운 인덱스 구조를 제안하고, 이를 기반으로 하는 효율적인 질의 처리 방식을 제안한다. 제안된 인덱스 기법은 이진 트라이를 기본 구조로 채택하며 DNA 시퀀스의 윈도우 서브 시퀀스를 인덱싱 대상으로 한다. 유사 서브 시퀀스 검색을 위한 질의 처리 알고리즘은 기본적으로 다이나믹 프로그래밍 기법에 근거하여 이진 트라이를 루트로부터 너비 우선(breadth-first) 방식으로 운행하며, 경로 상에 존재하는 모든 유사 서브 시퀀스를 검색해 낸다. 제안된 기법의 우수성을 검증하기 위하여, 기존의 접미어 트리와의 비교 실험을 통한 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 인덱스 기법은 접미어 트리에 비하여 약 30%의 작은 저장 공간을 가지고도 수배에서 수십배의 검색 성능의 개선 효과를 나타낸다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼