http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
RNA-Seq 데이터를 이용한 선택 스플라이싱 유형 분석
공진화(Jin-Hwa Kong),이종근(Jong-Keun Lee),이은주(Un-Joo Lee),윤지희(Jee-Hee Yoon) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.1A
선택 스플라이싱 (alternative splicing)은 mRNA (messenger RNA)의 전구체인 pre-mRNA가 mRNA로 전사될 때 pre-mRNA의 엑손 영역들 (exons)이 여러 가지 유형 (pattern)으로 다시 연결되는 과정을 말한다. 선택 스플라이싱에 의해 하나의 유전자로부터 서로 다른 mRNA가 만들어 지고 서로 다른 이소형의 단백질 (protein isoforms)이 생성된다. 현재까지 알려진 선택 스플라이싱의 유형은 약 7가지 종류가 있으며, 유전자의 돌연변이 및 질병과 밀접한 연관성을 가지고 있는 것으로 알려져 있다. 본 연구에서는 차세대 시퀀싱 (Next Generation Sequencing : NGS) 기술로 생성된 RNA-Seq 데이터로부터 각 유전자 영역에 대한 선택 스플라이싱 유형을 분류/추출하는 새로운 알고리즘을 제안한다. 제안된 알고리즘에서는 RNA-Seq 데이터를 DNA 시퀀스와 mRNA 트랜스크립트 시퀀스에 동시 매핑하고, 각 엑손 영역에 정렬된 RNA-Seq 데이터의 커버리지 정보 및 엑손의 접합 (junction) 정보를 이용하여 발현된 트랜스크립트 (transcript)의 종류와 양을 측정한다. 알고리즘의 유효성을 보이기 위하여 시뮬레이션 데이터를 이용한 인간 유전자 영역에서의 선택 스플라이싱 유형 추출 실험을 수행하였으며, 검증된 선택 스플라이싱 DB와 비교, 검증하였다.
공업화학(전기화학, 분석화학 포함),촉매/반응공학,약물전달기술,기능성 코팅기술 Ni 담지 CexZr1-xO2 촉매상에서 프로판의 자열개질반응
김영철 ( Young Chul Kim ),공진화 ( Jin Hwa Kong ),박남국 ( Nam Cook Park ) 한국화학공학회 2013 Korean Chemical Engineering Research(HWAHAK KONGHA Vol.51 No.1
In this study, the catalytic performance and characterization of Ni/Ce_xZr_1-xO2 were investigated using an autothermal reforming (ATR) process for hydrogen production. The Ni/CexZr_1-xO_2 catalysts were prepared using the following methods: the water method (CZ-W), urea water method (CZ-UW) and urea, water and ethanol method (CZUWA). The performance of Ni/Ce_xZr_1-xO_2 catalysts in autothermal reforming of propane for hydrogen production was studied in a fixed-bed flow reactor. Reaction tests were conducted by using a feed of H_2O/C_3H_8/O_2=3/1/0.37 and 300~700℃. The CZ-UW and CZ-UWA catalysts showed higher propane conversion and hydrogen yield than the CZ-W catalyst. The activity test confirmed that the improvement in the water-ethanol catalyst was due to the low level of carbon deposition. SEM showed that the surface carbon consisted of clusters on the used CZ-UW catalyst, which is incontrast to the nano-fiber morphology observed on the used CZ-UWA catalyst. It was found that the amount of carbon deposition depends on the preparation method. Especially the Ni/Ce_0.75Zr_0.25O_2 was showed higher propane conversion and hydrogen yield than the other catalysts. Also TGA showed that the resistance of carbon deposition increase to Co addition.
홍상균(Sang-Kyoon Hong),이상진(Sang-Jin Lee),김덕근(Deok-Keun Kim),공진화(Jin-Hwa Kong),윤지희(Jee-Hee Yoon) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.2C
최근, 기가시퀀싱(giga-sequencing) 기술의 발달로 비교적 저렴한 비용으로 개인의 유전체 시퀀싱이 가능해지고 있다. 하지만 기가시퀀싱 기술의 빠른 발전 속도에 비해 이들 데이터 처리를 위한 분석 도구의 개발은 매우 미비한 상황이다. 본 논문에서는 기가 시퀀싱 결과로 산출되는 수많은 짧은 DNA 서열조각인 리드를 레퍼런스 서열에 매핑한 결과를 관리, 분석하는 도구, GSDAT를 제안한다. GSDAT는 다양한 매핑결과 포맷을 통합하는 스키마와 이를 데이터베이스화하여 저장, 관리하는 시스템을 제공한다. 또한 매핑결과의 커버리지 분석을 위한 고해상도의 뷰어 기능을 제공하며, 사용자의 요구에 따라 다양한 유전체 데이터베이스와 연동되어 유전자 정보, 리피트 영역, 변이 영역 등과 같은 생물학 정보를 실시간으로 제공한다.
신재문(Jae-Moon Shin),홍상균(Sang-Kyoon Hong),공진화(Jin-Hwa Kong),이은주(Un-Joo Lee),윤지희(Jee-Hee Yoon) 한국정보과학회 2013 정보과학회논문지 : 데이타베이스 Vol.40 No.5
모든 암 세포는 체세포 변이를 동반한다. 암 유전체 변이 분석에 의하여 암을 발생시키는 유전자 및 진단/치료법을 찾아낼 수 있다. 본 연구에서는 차세대 시퀀싱 데이터를 이용하여 암 특이적 단위 반복 변이(copy number variation, CNV) 영역을 찾아내는 새로운 데이터 마이닝 알고리즘을 제안한다. 제안하는 방식에서는 암 환자의 암 유전체와 동일인의 정상 유전체에 존재하는 CNV 후보 영역을 각각 추출한 후, 이 들 결과를 상호 비교 분석하여 암 특이적 CNV 영역만을 선별해낸다. 본 연구에서 개발한 병렬 알고리즘은 암과 정상 유전체 데이터를 동시에 분석하여 암 특이적 CNV 영역을 추출/보고하며, 하둡(Hadoop) 환경의 맵리듀스(Map/Reduce) 함수에 의하여 이들 데이터를 분산, 병행 처리한다. 성능 평가를 위하여 악성 흑색종과 유방암 환자의 암/정상 유전체 데이터를 이용한 실험을 수행하였으며, 그 결과를 통해 제안된 방식이 대규모의 유전체 데이터로부터 암 특이적 CNV 영역의 타입 및 위치를 효율적으로 추출하고 있음을 보인다. The genomes of all cancer cells carry somatic mutations. Therefore, analyses of cancer genomes provide insight for understanding cancer-causing genes, diagnosis and therapy. In this work, we propose a data mining algorithm to detect cancer-specific copy number variation (CNV) regions by using next generation sequencing (NGS) data. The proposed method detects the candidate CNV regions from a cancer genome and the matched normal genome from the same individual, respectively, and identifies the cancer-specific CNVs by comparing the candidate CNV regions of a cancer genome with those of the matched normal genome. In this study, we also propose a novel parallel algorithm which simultaneously analyzes data from the cancer and patient-matched normal samples to identify cancer-specific CNV regions. This method is able to simultaneously perform tasks with large numbers of computing nodes using map and reduce functions in Hadoop project. The preliminary results conducted with the malignant melanoma and breast cancer data showed the prominent efficiency in identifying the types (gains or losses) and the exact locations of the cancer-specific CNVs.
홍상균 ( Sang-kyoon Hong ),이덕해 ( Deok-hae Lee ),공진화 ( Jin-hwa Kong ),김덕근 ( Deok-keun Kim ),홍동완 ( Dong-wan Hong ),윤지희 ( Jee-hee Yoon ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.2
최근 차세대 시퀀싱 기술의 급속한 발전에 따라 서열 정보의 해독이 비교적 쉬워지면서 개인별 맞춤 의학의 실현에 대한 기대와 관심이 높아지고 있다. 각 개인의 서열 정보 사이에는 SNP (single nucleotide polymorphism), Indel, CNV (copy number variation) 등의 다양한 유전적 구조 변이가 존재하며, 이러한 서열 정보의 부분적 차이는 각 개인의 유전적 특성 및 질병 감수성 등과 밀접한 관련을 갖는다. 본 연구에서는 차세대 시퀀싱 결과로 산출되는 수많은 짧은 DNA 서열 조각인 리드 데이터를 이용한 SNP 추출 알고리즘을 제안한다. 제안된 알고리즘에서는 레퍼런스 시퀀스의 각 위치에 대한 리드 시퀀스의 매핑 정보를 기반으로 SNP 후보 영역을 추출하며, 품질 정보 등을 활용하여 에러 발생률을 최소화한다. 또한 대규모 시퀀싱 데이터와 SNP 구조 변이 데이터의 효율적인 저장/검색을 지원하는 시각적 분석 도구를 구현하여 제안된 방식의 유용성을 검증한다.