RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        신경망에 의한 유전자 발현 자료의 결측값 추정

        오미라,김경숙,손영숙 한국자료분석학회 2010 Journal of the Korean Data Analysis Society Vol.12 No.1

        In a microarray data analysis, it is required the preprocessing procedure that missing values are replaced with their estimates. In this paper, we used the multilayer perceptron (MLP) neural network(NN) model to estimate missing values for microarray gene expression data. The NN moel is estimated by training the back propagation algorithm, after constituting the NN model with samples of complete genes corresponding to missing values of a target gene as output nodes and samples of complete genes corresponding to observed values of a target gene as input nodes. Finally, in a test data, missing values are estimated by substituting that of a target gene for an input vector of an estimated NN model. It is thought that the NN method, nonlinear prediction method, is useful for cyclical time course data that seems to be nonlinear between missing values and an input vector in the view of normalized root mean square error through a simulation study for three yeast time course data set, breast tumor, and prostate tumor data sets. 마이크로어레이 자료분석에서 결측값들을 추정치로 대체하는 결측값 추정의 전처리 과정이 필요하다. 본 논문에서는 마이크로어레이 유전자 발현 자료에 대한 결측값 추정을 위하여 다층 인식자(mutilayer perceptron: MLP) 신경망(neural network: NN)모형을 사용하였다. 먼저 목표유전자의 결측값들에 상응하는 완전유전자의 표본을 출력노드로 하고, 목표유전자의 관측값들에 상응하는 완전유전자의 표본들을 입력노드로 하는 NN모형을 구성한 후에 역전파(back propagation) 알고리즘을 훈련하여 NN모형을 추정한다. 다음으로 검증용 자료에서 목표유전자의 입력벡터 값을 훈련용 자료로 부터 추정된 NN모형에 대입하여 결측값을 추정한다. 세 가지의 이스트(yeast) 시간경로 자료들과 유방암과 전립선암 자료들에 대한 모의실험을 통해서 얻어지는 정규화된 제곱근 평균제곱오차의 관점에서 결측치와 입력벡터 간에 비선형관계의 가능성이 있다고 보여지는 주기성 시간경로 자료에 대하여 비선형 예측방법인 신경망방법이 유용하다고 판단된다.

      • KCI등재

        마이크로어레이 자료를 이용한 유전자 선택 및 분류 방법 비교

        박미주,이재원 한국자료분석학회 2015 Journal of the Korean Data Analysis Society Vol.17 No.1

        For classification analysis using gene expression microarray data, gene selection is necessary to discover genomic biomarkers for diagnosis and prognosis. It is important to select smaller classifier, but it is difficult to explain by biologically when the larger class size is, the larger selected genes increase. In this study, we introduced the classification methods which are nearest shrunken centroids (NSC), random forest (RF), Bayesian model averaging (BMA), eigengene-based linear discriminant analysis (ELDA), and compared these method using the real data in various situation. The evaluation of the quality was performed using number of selected genes, incorrectly grouped points and Brier score. 마이크로어레이 자료에서의 분류 분석의 목적은 중요한 소수의 유전자를 선별하여 새로운 표본에서의 선별된 유전자 정보로부터 반응범주를 정확하게 분류하고 예측하는데 있다. 생물학적 현상을 입증하기 위해서는 분류 분석에 좋은 성능을 보이는 소수의 유전자를 선별하는 것이 중요하지만 분류 집단 수가 증가할수록 선택된 유전자 수가 증가하여 생물학적 현상을 증명하기에 어려움이 있다. 본 논문에서는 최근에 많이 사용되고 있는 마이크로어레이 자료의 분류 분석 방법인 Nearest Shrunken Centroids(NSC), Random Forest(RF), Bayesian Model Averaging(BMA), Eigengene-based Linear Discriminant Analysis(ELDA)를 소개하고, 다양한 집단 수를 가진 실제 마이크로어레이 자료를 이용하여 그 방법들의 분류 성능을 비교하였다. 분류 방법의 질적 평가는 선택 유전자 수, 오분류율, Brier score를 이용하여 수행하였다.

      • KCI등재

        극소수 샘플에서 유의발현 유전자 탐색에 사용되는 순열에 근거한 검정법

        이주형,송혜향,Lee, Ju-Hyoung,Song, Hae-Hiang 한국통계학회 2009 응용통계연구 Vol.22 No.5

        마이크로어레이 극소수 샘플(array) 자료의 분석에서는 유의한 발현수치를 나타내는 유전자를 검정통계량에 의해 결정하는 것이 주요과제이다. 이 때 수 천 또는 수 만개인 유전자의 발현수치로부터 귀무분포(null distribution)의 생성이 필수적이며, 극소수 샘플 자료의 경우에는 순열방법(permutation methods)에 의해 귀무분포를 생성하는 것이 가장 바람직하다. 본 논문에서는 귀무분포 생성에 사용될 수 있는 매우 단순한 검정통계량을 제시하면서 더불어 귀무분포 생성에 적절한 순열방법도 제안한다. 모의실험으로 기존의 검정통계량으로 생성된 귀무분포와 본 논문에서 제안하는 검정통계량의 귀무분포를 비교하며, 실제 자료에 적용하여 유의 유전자를 탐색한다. In the analysis of microarray data with a small number of arrays, the most important task is the detection of differentially expressed genes by a significance test. For this purpose, one needs to construct a null distribution based on a large number of genes and one of the best way for constructing the null distribution for a small number of arrays is by means of permutation methods. In this paper we propose simple test statistics and permutation methods that are appropriate in constructing the null distribution. In a simulation study, we compare the null distributions generated by the proposed test statistics and permutation methods with the previous ones. With an example microarray data, differentially expressed genes are determined by applying these methods.

      • KCI등재

        순차적 부분최소제곱 회귀적합에 의한 시간경로 유전자 발현 자료의 결측치 추정

        김경숙,오미라,백장선,손영숙,Kim, Kyung-Sook,Oh, Mi-Ra,Baek, Jang-Sun,Son, Young-Sook 한국통계학회 2008 응용통계연구 Vol.21 No.2

        마이크로어레이 유전자 발현 자료는 대용량이며 또한 관측 과정이 복잡하여 결측치가 빈번하게 발생된다. 본 논문에서는 관측 시점 간에 상관성을 갖는 시간경로 유전자 발현 자료에 대한 결측치 추정을 위하여 순차적 부분최소제곱(sequential partial least squares: SPLS) 회귀적합 방법을 제안한다. 이는 순차적 기법과 부분최소제곱(partial least squares: PLS) 회귀적합 방법을 결합시킨 것이다. 세 가지의 이스트(yeast) 시간경로 자료들에 대한 몇 가지 모의실험을 통하여 제안된 결측치 추정방법의 유용성을 평가한다. The size of microarray gene expression data is very big and its observation process is also very complex. Thus missing values are frequently occurred. In this paper we propose the sequential partial least squares(SPLS) regression fitting method to estimate missing values for time course gene expression data that has correlations among observations over time points. The SPLS method is to combine the sequential technique with the partial least squares(PLS) regression fitting method. The usefulness of method proposed is evaluated through some simulation study for three yeast time course data.

      • KCI등재

        시간경로 유전자 발현자료의 군집분석에서 이질적인 시계열의 탐지를 위한 패턴일치지수

        손영숙,백장선,Son, Young-Sook,Baek, Jang-Sun 한국통계학회 2005 응용통계연구 Vol.18 No.2

        본 논문에서는 피어슨 상관계수를 이용한 시간경로 유전자 발현자료의 군집분석에서 군집의 대표적인 패턴에서 벗어나는 이질적인 패턴을 보이는 시계열을 탐지하기 위한 패턴일치지수를 제안하고, 이를 마이크로어레이 실험으로부터 얻어진 혈청 시간경로 유전자 발현자료에 적용하여 유용성을 검토해 본다. In this paper, we propose a pattern consistency index for detecting heterogeneous time series that deviate from the representative pattern of each cluster in clustering time course gene expression data using the Pearson correlation coefficient. We examine its usefulness by applying this index to serum time course gene expression data from microarrays.

      • KCI등재

        유전자 정보를 이용한 생존시간 예측법

        최지민 한국자료분석학회 2009 Journal of the Korean Data Analysis Society Vol.11 No.4

        It will be very useful if we can predict survival time of cancer patients. So far, the principal component analysis and the partial least squares were successfully used in estimating survival function for a group of patients with same type of tumors. In this paper, we propose a simple method of predicting survival time of individual patient with cancer using gene expression profiles. In fact, we propose an improved version of partial least squares by using Kaplan-Meier estimator of survival function. We compare the numerical performance of the proposed method with that of the principal component analysis and the partial least squares based on bootstrap samples. Results are illustrated with Multiple Myeloma cancer data. 암 연구에서 암 환자의 생존시간 예측은 중요한 관심사 중 하나이다. 관측된 환자수보다 훨씬 더 많은 수의 유전자들의 발현 강도로 이루어져 있는 마이크로어레이 자료를 이용해 암 환자의 생존시간을 예측하려면, 기존의 통계적 기법을 그대로 적용하는 데에 어려움이 따른다. 이러한 문제점을 해결하기 위해 지금까지 주성분분석이나 부분최소제곱이 다차원의 자료를 차원 축소하는 데에 성공적으로 사용되어 왔으나, 생존 자료가 가지는 중요한 특성인 중도절단에 대한 고려가 미흡하였다. 따라서 이 논문에서는 암 환자의 유전자 정보를 이용해 개개인의 생존시간을 예측하는 간단한 방법을 제안하였다. 다발성 골수종 환자 자료를 사용하여 붓스트랩 기법을 통해 제안된 방법과 기존의 방법들을 비교하였다. 그 결과, 제안된 방법을 사용하면 유전자 자료를 이용해 개별 생존시간을 예측할 때 정도(precision)가 개선됨을 확인하였다.

      • KCI우수등재

        시간경로 마이크로어레이 자료에서 k-최근접 이웃과 패턴일치지수를 이용한 결측치 대체방법

        이선영(Sunyoung Lee),김동재(Dongjae Kim) 한국데이터정보과학회 2018 한국데이터정보과학회지 Vol.29 No.5

        시간경로 마이크로어레이 자료에서 결측치 대체 방법으로 k-최근접 이웃 방법이 널리 사용된다. 이 방법은 결측이 발생한 유전자와 가장 가까운 거리에 있는 k개의 유전자들을 활용하여 결측값을 대체하는 방법이지만 관측 시점 간의 상관성을 무시하는 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위해 k-최근접 이웃 방법에 Son과 Baek이 제안한 패턴일치지수를 적용하여 새로운 결측치 대체법을 제안하였다. 또한 각각의 특징을 가지고 있는 세 가지의 실제 자료를 이용한 모의실험을 통하여 기존의 방법과 비교하였다. The KNN imputation method is widely used as a missing-value imputation method in time course gene expression data. This method imputation the missing value by using k genes that are closest to the gene in which the missing value occurred. However, it has the inherent disadvantage that there may be neglecting the correlation between observation points. In this paper, we proposed a new missing value imputation method by applying the pattern consistency index proposed by Son and Baek to the KNN method. We also compared the performance between the established method and the suggested method through simulations of three yeast time course data.

      • KCI등재

        시간경로 유전자 발현자료에서 패턴일치지수와 적응 최근접 이웃을 활용한 결측값 대치법

        신혜서,김동재 한국통계학회 2020 응용통계연구 Vol.33 No.3

        Time course gene expression data is a large amount of data observed over time in microarray experiments. This data can also simultaneously identify the level of gene expression. However, the experiment process is complex, resulting in frequent missing values due to various causes. In this paper, we propose a pattern consistency index adaptive nearest neighbors as a method of missing value imputation. This method combines the adaptive nearest neighbors (ANN) method that reflects local characteristics and the pattern consistency index that considers consistent degree for gene expression between observations over time points. We conducted a Monte Carlo simulation study to evaluate the usefulness of proposed the pattern consistency index adaptive nearest neighbors (PANN) method for two yeast time course data. 시간경로 유전자 발현 자료는 마이크로어레이 실험을 시간에 따라 관측한 대용량의 자료로 유전자 발현 수준을 동시에 파악할 수 있다. 하지만 실험 과정이 복잡하여 다양한 원인들에 의해 결측값이 자주 발생한다. 본 논문에서는 시간경로 유전자 발현 자료에 대한 결측값을 추정하는 방법으로 패턴 적응 최근접 이웃(pattern consistency index adaptive nearest neighbors; PANN) 방법을 제안하였다. 이 방법은 국소적 특징을 반영하는 적응 최근접 이웃(adaptive nearest neighbors; ANN) 방법과 관측 시점간 유전자 발현의 일치 정도를 고려하는 패턴일치지수를 결합시킨 것이다. 제안한 PANN 방법의 효능을 평가하기 위하여 두 가지의 실제 시간경로 자료들을 사용하여 몬테카를로 모의실험(Monte Carlo simulation study)을 시행하였다.

      • KCI등재

        특이발현과 특이공발현을 고려한 유의한 유전자 집단 탐색

        이선호,Lee, Sunho 한국통계학회 2016 응용통계연구 Vol.29 No.3

        서로 상관있는 유전자들의 발현조절이 질병이나 종양의 발생에 영향을 미치기 때문에 단일유전자 분석 대신 공통의 생물학적 요소를 지닌 유전자 집단 분석이 각광을 받게 되었고 생물학적으로 좀더 설명하기 쉬운 결과를 얻게 되었다. 표현형에 따라 유의한 차이를 보이는 유전자 집단을 찾는 여러 방법들이 있지만, 대부분의 방법들이 집단에 속한 유전자들의 표현형에 따른 발현의 차이를 탐색하거나 유전자들 사이의 공발현 구조가 다른지 탐색하는 것이다. 본 연구에서는 특이발현과 특이공발현의 차이를 모두 고려하는 탐색방법을 제시하였고 p53이란 유전자 자료와 모의자료를 이용하여 제시한 방법의 성능을 알아 보았다. Gene set analysis utilizing biologic information is expected to produce more interpretable results because the occurrence of tumors (or diseases) is believed to be associated with the regulation of related genes. Many methods have been developed to identify statistically significant gene sets across different phenotypes; however, most focus exclusively on either the differential gene expression or the differential correlation structure in the gene set. This research provides a new method that simultaneously considers the differential expression of genes and differential coexpression with multiple genes in the gene set. Application of this NEW method is illustrated with real microarray data example, p53; subsequently, a simulation study compares its type I error rate and power with GSEA, SAMGS, GSCA and GSNCA.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼