http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
휴리스틱 알고리즘을 이용한 SNP 유전형 자료의 결측치 대치법
정현환(Hyun-hwan Jeong),위규범(Kyubum Wee) 한국정보과학회 2008 한국정보과학회 학술발표논문집 Vol.35 No.2
유전형(genotype) 데이터 상에서 발생하는 결측치(missing value)를 어떤 방식으로 다룰 것인지는 중요한 문제이며, 이 경우 결측치가 발생한 곳에 적당한 값을 채우는 대치법(imputation method)은 결측치를 다루는데 있어서 효율적인 방법이다. 기존에 사용하고 있는 결측치 대치법의 경우 좋은 성능을 보장하는 것으로 알려져 있으나, 많은 정보를 필요로 하거나, 혹은 느린 수행시간을 보여주는 경우가 많다. 본 논문에서는 유전형 데이터와 결측치가 주어졌을 때 상호 정보량(mutual information)과 하디 와인버그 평형(The Hardy-Weinberg Equilibrium)을 데이터의 특성을 나타내는 인자로 사용하고, 휴리스틱 알고리즘의 일종인 시뮬레이티드 어닐링 알고리즘을 통해 결측치를 대치하는 방법을 제시한다. 본 논문 에서는 주형질 대치법과 동일 데이터에 대하며 실험을 실시하였고, 여러 가지 기준을 통하며 성능을 비교 및 분석하였다.
상호정보량과 MDR을 이용한 대용량 단일염기다형성 연관성 분석
정현환 ( Hyun-hwan Jeong ),위규범 ( Kyubum Wee ) 한국정보처리학회 2010 한국정보처리학회 학술대회논문집 Vol.17 No.2
단일염기다형성 유전형 자료에 대한 유전자형을 얻어내는 기술(genotyping)이 발달함에 따라 분석해야 하는 SNP의 개수가 수십만 개로 증가하였다. 따라서 기존의 연관성 분석(association study)연구 방법을 그대로 적용시키기는 어렵다. 본 논문에서는 상호정보량(mutual information)과 Multifactor dimensionality reduction을 이용하여 대용량의 SNP 유전형자료를 분석하는 방법을 제안하였고, 이 방법을 toluene diisocyanate-induced asthma에 대해 실험해본 결과 높은 판별력을 보이는 모델을 찾을 수 있었다.