RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        MFCC를 이용한 GMM 기반의 음성/혼합 신호 분류

        김지은(Ji-Eun Kim),이인성(In-Sung Lee) 대한전자공학회 2013 전자공학회논문지 Vol.50 No.2

        본 논문에서는 MFCC를 이용한 GMM 기반의 음성과 혼합 신호 분류 알고리즘을 MPEG의 표준 코덱인 USAC에 적용하였다. 효과적인 패턴 인식을 위해 GMM을 이용하였고, EM알고리즘을 사용하여 최적의 GMM 파라미터를 추출하였다. 제안하는 분류 알고리즘은 두 가지 중요한 부분으로 나뉜다. 첫째는 GMM을 통해 최적의 파라미터를 추출하는 것 이고, 두 번째는 MFCC 값을 이용한 패턴인식을 통해 음성/혼합 신호를 분류하였다. 제안된 알고리즘의 성능을 평가한 결과 MFCC를 이용한 GMM 기반의 제안된 방법이 기존 USAC의 방법보다 우수한 음성/혼합 신호 분류 성능을 보였다 In this paper, proposed to improve the performance of speech and mixed content signal classification using MFCC based on GMM probability model used for the MPEG USAC(Unified Speech and Audio Coding) standard. For effective pattern recognition, the Gaussian mixture model (GMM) probability model is used. For the optimal GMM parameter extraction, we use the expectation maximization (EM) algorithm. The proposed classification algorithm is divided into two significant parts. The first one extracts the optimal parameters for the GMM. The second distinguishes between speech and mixed content signals using MFCC feature parameters. The performance of the proposed classification algorithm shows better results compared to the conventionally implemented USAC scheme.

      • 고빈도 KOSPI200 선물지수 수익률의 변동성에 관한 연구

        이현석(Hyon Sok Lee),정미화(Mi Hwa Chung) 성신여자대학교 경영연구소 2012 경영관리연구 Vol.5 No.1

        본 연구는 2009년 10월 9일부터 2011년 5월 16일까지 KOSPI200 선물 지수의 분당 자료를 바탕으로 선물 지수 로그-수익률의 변동성을 GMM과 E-GARCH 모형으로 추정하였다. 추정 모수는 로그-변동성의 상수 항과 조정 속도, 표준편차이다. 분당 자료는 분석 기간 중의 각 선물 만기일을 기준으로 여섯 기간으로 구분하였다. 기초통계량의 분석 결과는 선물 만기 한 시간 전부터 선물 만기 시점까지를 제외하고 모두 로그-수익률이 정규분포라는 귀무가설을 기각하고 있다. 분석 결과, 전체 기간의 분석에서 GMM과 EGARCH 모두 유의한 모수 추정치를 보여주고 있으며, GMM이 EGARCH 모형보다 실제 자료를 잘 설명하고 있음을 확인하였다. 각 만기시점이나 하위기간에 대해서는, GMM의 경우 평균-회귀 모수는 강력한 유의수준을 보여주고 있으나 다른 모수는 일정한 설명력을 갖지 못했다. EGARCH 모형도 GARCH효과와 ARCH 효과에서 설명력은 높았으나, 다른 모수 추정치는 강한 설명력을 갖지 못했다. 이를 통해 우리나라 선물 시장에서 수익률의 변동성을 설명할 수 있는 보다 일관된 모형이 필요한 것으로 해석된다. This study estimates the volatility of highly frequent log-returns by GMM and EGARCH. Data are one-minute KOSPI200 futures index from the 9th October 2009 to the 16th May 2011. Models have 3 parameters including the constant, adjustment speed and standard deviation. Data were divided into six sub-periods based onfuture’s expiration days. Analysis for the basic statistics rejects the null hypothesis that log-returns are normal distribution. However, the sub-period between the maturity time point and one hour ago is an exception. The estimated results are as follows. GMM and EGARCH show a significant parameter estimates during the total period. And we find that the GMM model explains the actual data better than the EGARCH. During each sub-period, GMM shows the significant mean-reverting effects, but other parameters are not significant. The results of EGARCH estimations show that GARCH and ARCH effects have high explanatory power. We can conclude that the more consistent models have to be developed for explaining the volatility of returns very well in the Korea’s futures market.

      • KCI등재

        A Modified Adaptive GMM Approach Based GMM Supervector and I-vector Using NMF Decomposition for Robust Speaker Verification

        Tan Dat Trinh,Min Kyung Park(박민경),Jin Young Kim(김진영),Kyong Rok Lee(이경록),Seung Ho Choi(최승호),Keeseong Cho(조기성) 한국정보기술학회 2015 한국정보기술학회논문지 Vol.13 No.7

        We propose a new method to enhance performance of speaker verification by investigating a novel modification of adaptive Gaussian Mixture Model (GMM) training. This model is trained using a modified Expectation Maximization (EM) algorithm, combined with a modified Maximum A Posteriori (MAP) estimation based weight factor of observation probabilities, called the observation confidence. The observation confidence is calculated based on the SNR estimation. Based on this modified adaptive GMM training algorithm, we propose to construct GMM supervectors and i-vectors, which are considered as input feature vectors for SVM. Besides, the discriminant features for speaker verification are also exploited by using non-negative matrix factorization (NMF) in the GMM-supervector and i-vector space. Experiment results on utterances from Korean drama (“You came from the stars”) show that our proposed methods significantly outperform the baseline GMM-UBM, GMM-supervector and i-vector based SVM under various noisy conditions.

      • KCI등재

        GMM을 이용한 응급 단어와 비응급 단어의 검출 및 인식 기법

        조영임(Young Im Cho),이대종(Dae Jong Lee) 한국지능시스템학회 2011 한국지능시스템학회논문지 Vol.21 No.2

        일반적으로 어떤 순간에 발생할지 모르는 응급 상황을 CCTV의 영상 정보만으로 상황을 항상 모니터링하기에는 인력과 비용의문제점이 발생되고 있다. 본 논문에서는 응급상황을 동적으로 보여주는 CCTV환경에서 감지하기 위해 GMM을 이용한 응급단어와 비응급단어의 검출 및 인식기법을제안하고자 한다. 제안된 방법은 Global GMM 모델에 의해 응급단어와 일반단어를 검출하고 이 모델에 의해 응급단어라 판정된 경우에는 Local GMM 모델에 응급단어 인식을 수행하게 된다. 제안된 방법은 다양한 환경하에서 취득한 응급단어와 일반단어에 대해 적용하여 타당성을 검증하였다. For the emergency detecting in general CCTV environment of our daily life, the monitoring by only images through CCTV information occurs some problems especially in cost as well as man power. Therefore, in this paper, for detecting emergency state dynamically through CCTV as well as resolving some problems, we propose a detection and recognition method for emergency and non-emergency speech by GMM. The proposed method determine whether input speech is emergency or non-emergency speech by global GMM. If emergeny speech, local GMM is performed to classify the type of emergency speech. The proposed method is tested and verified by emergency and non-emergency speeches in various environmental conditions.

      • KCI등재

        Minimum Classification Error 방법 도입을 통한 Gaussian Mixture Model 환경음 인식성능 향상

        한다정(Da-Jeong Han),박아론(Aaron Park),박준규(Jun-Qyu Park),백성준(Sung-June Baek) 한국콘텐츠학회 2011 한국콘텐츠학회논문지 Vol.11 No.12

        본 연구에서는 환경음 인식 성능의 향상을 위하여 GMM의 훈련 방식에 MCE 도입을 제안하였다. 이는 환경음 데이터 모델링에 사용할 분류오류함수를 정의할 때 해당 클래스의 로그우도 뿐 아니라 다른 클래스의 로그우도도 같이 고려함으로써 변별력 있는 분류가 이뤄질 수 있게 한다. 모델의 파라미터는 전체 클래스를 고려한 손실함수를 정의하고, GPD(generalized probabilistic descent)알고리즘을 이용하여 추정하였다. 제안된 방법의 인식 성능 비교를 위해 모두 9가지 환경음을 전처리 과정과 MFCC(mel-frequency cepstral coefficients)를 이용하여 12차 특징을 추출하고, 이를 혼합 성분의 수에 따라 GMM 분류 실험을 행하였다. 실험 결과에 따르면 혼합 성분을 19개 사용한 경우에서 MCE 훈련 방식이 평균 87.06%의 인식률로 가장 좋은 성능을 보였다. 이 결과로 제안한 MCE 훈련 방식이 환경음 인식에서 GMM의 훈련 방식으로 효과적으로 사용될 수 있음을 확인하였다. In this paper, we proposed the MCE as a GMM training method to improve the performance of environmental sounds recognition. We model the environmental sounds data with newly defined misclassification function using the log likelihood of the corresponding class and the log likelihood of the rest classes for discriminative training. The model parameters are estimated with the loss function using GPD(generalized probabilistic descent). For recognition performance comparison, we extracted the 12 degrees features using preprocessing and MFCC(mel-frequency cepstral coefficients) of the 9 kinds of environmental sounds and carry out GMM classification experiments. According to the experimental results, MCE training method showed the best performance by an average of 87.06% with 19 mixtures. This result confirmed us that MCE training method could be effectively used as a GMM training method in environmental sounds recognition.

      • KCI등재

        GMM 음소 단위 파라미터와 어휘 클러스터링을 융합한 음성 인식 성능 향상

        오상엽 중소기업융합학회 2020 융합정보논문지 Vol.10 No.8

        DNN error is small compared to the conventional speech recognition system, DNN is difficult to parallel training, often the amount of calculations, and requires a large amount of data obtained. In this paper, we generate a phoneme unit to estimate the GMM parameters with each phoneme model parameters from the GMM to solve the problem efficiently. And it suggests ways to improve performance through clustering for a specific vocabulary to effectively apply them. To this end, using three types of word speech database was to have a DB build vocabulary model, the noise processing to extract feature with Warner filters were used in the speech recognition experiments. Results using the proposed method showed a 97.9% recognition rate in speech recognition. In this paper, additional studies are needed to improve the problems of improved over fitting. DNN은 기존의 음성 인식 시스템에 비해 에러가 적으나 병렬 훈련이 어렵고, 계산의 양이 많으며, 많은 양의 데이터 확보를 필요로 한다. 본 논문에서는 이러한 문제를 효율적으로 해결하기 위해 GMM에서 모델 파라메터를 가지고 음소별 GMM 파라메터를 추정하여 음소 단위를 생성한다. 그리고 이를 효율적으로 적용하기 위해 특정 어휘에 대한 클러스터링을 통해 성능을 향상시키기 위한 방법을 제안한다. 이를 위해 3가지 종류의 단어 음성 데이터베이스를 이용하여 DB를 가지고 어휘 모델을 구축하였고, 잡음 처리는 워너필터를 사용한 특징을 추출하여 음성 인식실험에 사용하였다. 본 논문에서 제안한 방법을 사용한 결과 음성 인식률에서 97.9%의 인식률을 나타내었다. 본 연구에서 개선된 오버피팅의 문제점을 향상시킬 수 있는 추가적인 연구를 필요로 한다.

      • 화자 식별을 위한 GMM의 혼합 성분의 개수 추정

        이윤정,이기용 한국음성과학회 2004 음성과학 Vol.11 No.2

        In general, Gaussian mixture model(GMM) is used to estimate the speaker model for speaker identification. The parameter estimates of the GMM are obtained by using the expectation maximization(EM) algorithm for the maximum likelihood(ML) estimation. However, if the number of mixtures isn't defined well in the GMM, those parameters are obtained inappropriately. The problem to find the number of components is significant to estimate the optimal parameter in mixture model. In this paper, to estimate the optimal number of mixtures, we propose the method that starts from the sufficient mixtures, after, the number is reduced by investigating the mutual information between mixtures for GMM. In result, we can estimate the optimal number of mixtures. The effectiveness of the proposed method is shown by the experiment using artificial data. Also, we performed the speaker identification applying the proposed method comparing with other approaches.

      • KCI등재후보

        화자 인식을 통한 등장인물 기반의 비디오 요약

        이순탁,김종성,강찬미,백중환,Lee Soon-Tak,Kim Jong-Sung,Kang Chan-Mi,Baek Joong-Hwan 한국융합신호처리학회 2005 융합신호처리학회 논문지 (JISPS) Vol.6 No.4

        본 논문에서는 인물 기반의 비디오 요약 방법으로써 비디오 내 음성정보를 이용하여 화자 인식 기법을 통한 등장인물 중심의 요약 기법을 제안한다. 먼저, 얼굴 영역을 포함하는 장면을 중심으로 비디오로부터 배우의 대사에 해당하는 음성 정보를 분리하고, 화자 인식 기법을 수행하여 등장인물 별로 분류하였다. 화자인식 기법은 각 화자별로 MFCC(Mel Frequency Cepstrum Coefficient) 값을 추출하고 GMM(Gaussian Mixture Model)을 이용하여 분류한다. 본 논문에서는 4명의 등장인물에 대해 GMM을 학습시키고 4명 중 1명을 검출하는 실험을 통해 학습된 GMM 분류기가 실험 비디오에 대해 0.138 정도의 오분류율을 보임을 확인하였다. In this paper, we propose a character-based summarization algorithm using speaker identification method from the dialog in video. First, we extract the dialog of shots containing characters' face and then, classify the scene according to actor/actress by performing speaker identification. The classifier is based on the GMM(Gaussian Mixture Model) using the 24 values of MFCC(Mel Frequency Cepstrum Coefficient). GMM is trained to recognize one actor/actress among four who are all trained by GMM. Our experiment result shows that GMM classifier obtains the error rate of 0.138 from our video data.

      • NLL과 GMM을 중심으로 한 확산모형 추정법 비교

        김대균,이윤동 서강대학교 경영연구소 2011 서강경영논총 Vol.22 No.1

        Black and Scholes (1973)의 연구 이후로 확산과정을 이용한 모형화 방법은 금융공학에서 중요 한 역할을 수행해 왔다. 현대 금융이론에서 다양한 형태의 확산모형이 제안되었고 실제 적용되어 +왔다. 확산모형을 이용하여 금융자료를 분석하기 위하여는 확산모형의 모수에 대한 추정이 필 수적이다. 이를 위하여 많은 연구자들이 다양한 추정방법을 제안하고 그 성질을 연구해 왔다. 본 연구에서는 제안된 추정방법 중 가장 현실에서 많이 사용되는 오일러 근사법, 일반화 적률법 (GMM) 그리고 신국소선형화 방법 (NLL)을 중심으로 그 추정방법들에 대한 통계적 성질을 살펴 보게 된다. 모의실험 연구를 통하여 살펴본 바에 의하면 NLL과 오일러 방법이, 그 적용방법의 단순성 때문에 확산모형의 추정방법으로 매우 자주 사용되어 오는 GNIM에 비하여 훨씬 좋은 성 질을 가지고 있음을 알 수 있었다. 본 연구에서 비교해 본 바에 의하면 특히 확산계수에 대한 모 수의 추정이 필요한 모형에서 GNIM의 성능은 급격히 저하되는 현상을 살펴볼 수 있었다. Since the famous research of Black and Scholes (1973), modeling methods using diffusion processes have performed principal roles in financial engineering. In modern financial theories, various types of diffusion processes were suggested and applied in real situations. To analyze financial data by using diffusion process models, estimation of model parameters is an indispensible step. Many estimation methods were suggested and their properties were investigated by many researchers. This paper reviews the statistical properties of the three estimation methods, Euler approximation method, New Local Linearization (NLL) method, and Generalized Methods of Moment (GMM), which are known as the most practical methods. From the simulation study, we found the NLL and Euler methods performed much better than GMM, GMM is know as the most popular method in estimating the parameters of diffusion model, because of its simplicity. However this paper shows the performance of 0MM is poorer than the simple Euler approximation method or the NLL method, and even the performance is extremely poor especially when the parameters in diffusion coefficient are to be estimated.

      • 국부 퍼지 클러스터링 PCA를 갖는 GMM을 이용한 화자 식별

        이기용 한국음성과학회 2003 음성과학 Vol.10 No.4

        To reduce the high dimensionality required for training of feature vectors in speaker identification, we propose an efficient GMM based on local PCA with Fuzzy clustering. The proposed method firstly partitions the data space into several disjoint clusters by fuzzy clustering, and then performs PCA using the fuzzy covariance matrix in each cluster. Finally, the GMM for speaker is obtained from the transformed feature vectors with reduced dimension in each cluster. Compared to the conventional GMM with diagonal covariance matrix, the proposed method needs less storage and shows faster result, under the same performance.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼