http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
분산 시스템에서의 바이오 데이터의 통합 및 클러스터링을 위한 K-means 활용
남세종(Sejong Nam),신동규(Dongkyoo Shin),신동일(Dongil Shin) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.1
Microarray 데이터를 분석하고 검색하여 생물학자들이 정확한 일을 수행하는 것이 Bioinformatics의 목표 중 하나이다. 인터넷의 보급으로 데이터 베이스에 접근 가능한 수단이 제공되었으나 분산 환경에서 유의한 유전자의 검색과 전송시의 시간 지연 문제를 나타낸다. Microarray 데이터 분석에는 유전자수가 너무 많은 반면에 실질적인 클래스 분류에 직접 연관된 기능을 갖는 유전자 수가 매우 한정적이다. 마이닝 기법인 k-means는 데이터 검색시 이러한 문제점을 해결하기 위해 이용될 수 있는 방법이지만 단순 적용시 데이터 양의 비례하는 실행시간의 문제가 생긴다. 본 논문은 위의 두가지 문제점을 해결하기 위해 Microarray 데이터를 효율적으로 분석하기 위해 Z-score를 이용하여 정규화하고 데이터 분석을 위한 개선된 분산 클러스터링의 시나리오와 이를 위해 수정된 K-means 알고리즘을 제시한다.
Greedy Emsemble Selection을 이용한 심장병 데이터 분석
남세종(Sejong Nam),신동규(Dongkyoo Shin),신동일(Dongil Shin) 한국정보과학회 2010 한국정보과학회 학술발표논문집 Vol.37 No.1C
심장질환은 암 다음으로 높은 사망 원인으로 초기 진단은 치료에 매우 중요한 문제로 대두 되고 있다. 심장병을 분석하기 위해서는 임상 데이터에 대해 자세히 알고 분석 하는 것이 중요하다. 본 논문에서는 심장 질환 데이터를 효율적으로 분석하기 위해 배깅 알고리즘을 사용하여 중요 검사 항목을 추출해내고 분석하는 방법을 제안한다. 데이터를 분석하는 과정에 있어서 분류자들을 생성하고 앙상블 하는 과정에 효과적인 결과를 얻기 위해서 다양한 알고리즘들을 결합해야 구성해야한다. 앙상블을 이용하여 가장 좋은 의 분류 효과를 얻기 위해서는 수천가지의 분류자들을 훈련시켜 성능이 좋은 앙상블을 구성한다.
남세종(Sejong Nam),신동규(Dongkyoo Shin),신동일(Dongil Shin) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.2C
본 논문은 한방의료에서 인체 전신의 상태를 파악하는데 중요한 요소인 맥파 데이터를 한의사의 수지와 지능에 의한 방법 대신에 환자의 팔목에 장착되는 생체 센서로 측정하고 데이터 마이닝 알고리즘을 사용하여 데이터를 분석하고자 클러스터링을 이용한 맥파 분석 하는 시스템을 구상하였다. 맥파를 분석하기 위해서는 보다 정확한 맥파에 대한 확실하고 객관적인 기준이 필요하다. 클러스터링은 데이터 마이닝 기법으로 데이터를 분할하여 분석하는데 좋은 기법이다. 클러스터링 분석 단계에서는 정규화한 맥파 데이터를 k-means와 fuzzy c-means를 적용시켰을 경우의 성능을 비교하였다.