RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        잡음환경에서 음성인식 성능향상을 위한 바이너리 마스크를 이용한 스펙트럼 향상 방법

        최갑근,김순협,Choi, Gab-Keun,Kim, Soon-Hyob 한국음향학회 2010 韓國音響學會誌 Vol.29 No.7

        음성인식의 실용화에 가장 저해되는 요소는 배경잡음과 채널잡음에 의한 왜곡이다. 일반적으로 배경잡음은 음성인식 시스템의 성능을 저하시키고 이로 인해 사용 장소의 제약을 받게 한다. DSR (Distributed Speech Recognition) 기반의 음성인식 역시 이와 같은 문제로 성능 향상에 어려움을 겪고 있다. 이러한 문제를 해결하기 위해 다양한 잡음제거 알고리듬이 사용되고 있으나 낮은 SNR환경에서 부정확한 잡음추정으로 발생하는 스펙트럼 손상과 잔존 잡음은 음성인식기의 인식환경과 학습 환경의 불일치를 만들게 되어 인식률을 저하시키는 원인이 된다. 본 논문에서는 이와 같은 문제를 해결하기 위해 잡음제거 알고리듬으로 MMSE-STSA 방법을 사용하였고 손상된 스펙트럼을 보상하기 위해 Ideal Binary Mask를 이용하였다. 잡음환경 (SNR 15 ~ 0 dB)에 따른 실험결과 제안된 방법을 사용했을 때 향상된 스펙트럼을 얻을 수 있었고 향상된 인식성능을 확인했다. The major factor that disturbs practical use of speech recognition is distortion by the ambient and channel noises. Generally, the ambient noise drops the performance and restricts places to use. DSR (Distributed Speech Recognition) based speech recognition also has this problem. Various noise cancelling algorithms are applied to solve this problem, but loss of spectrum and remaining noise by incorrect noise estimation at low SNR environments cause drop of recognition rate. This paper proposes methods for speech enhancement. This method uses MMSE-STSA for noise cancelling and ideal binary mask to compensate damaged spectrum. According to experiments at noisy environment (SNR 15 dB ~ 0 dB), the proposed methods showed better spectral results and recognition performance.

      • KCI등재

        잡음 환경에서 심리음향모델 기반 음성 에너지 최대화를 이용한 음성 검출 방법

        최갑근,김순협,Choi, Gab-Keun,Kim, Soon-Hyob 한국음향학회 2009 韓國音響學會誌 Vol.28 No.5

        이 논문은 음성 에너지를 최대화 하여 낮은 SNR환경에서 음성 존재 여부를 판단하고 정확한 끝점을 검출하는 방법에 대한 것이다. 전통적인 VAD (Voice Activity Detection) 알고리듬은 잡음의 추정치를 이용해 음성과 비음성 구간을 선택하여 낮은 SNR환경이나 비안정 잡음환경에서는 정확하지 못한 문턱값으로 인해 부정확한 끝점검출을 하였다. 또한 잡음의 시간적 변화를 반영하기 위해 비교적 큰 분석 구간을 두어 계산량이 증가함에 따라 실제 응용에 적합하지 않은 단점이 있다. 이 논문은 잡음환경에서 정확한 음성 구간의 검출을 위해 심리음향 모델에 기반 한 바크 스케일 필터 뱅크를 이용하여 주어진 프레임에서 음성 에너지를 최대화 시키고 잡음을 억제하는 SEM-VAD (Speech Energy Maximization-Voice Activity Detection) 방법을 제안하였다. 다양한 잡음환경, SNR 15 dB, 10 dB 5 dB 0 dB 상황에서 실험한 결과 SNR의 변화에 안정적인 문턱값을 얻었고, 음성 검출을 위한 실험에서 자동차 잡음 환경에 대한 PHR (Pause Hit Rate)은 모든 잡음 환경에서 100%의 정확도를 보였고, FAR (False Alarm Rate)는 SNR 15 dB와 10 dB에서는 0%, SNR 5 dB에서 5.6% SNR 0 dB에서 9.5%의 성능을 보였다. This paper introduces the method for detect voices and exact end point at low SNR by maximizing voice energy. Conventional VAD (Voice Activity Detection) algorithm estimates noise level so it tends to detect the end point inaccurately. Moreover, because it uses relatively long analysis range for reflecting temporal change of noise, computing load too high for application. In this paper, the SEM-VAD (Speech Energy Maximization-Voice Activity Detection) method which uses psycho-acoustical bark scale filter banks to maximize voice energy within frames is introduced. Stable threshold values are obtained at various noise environments (SNR 15 dB, 10 dB, 5 dB, 0 dB). At the test for voice detection in car noisy environment, PHR (Pause Hit Rate) was 100%accurate at every noise environment, and FAR (False Alarm Rate) shows 0% at SNR15 dB and 10 dB, 5.6% at SNR5 dB and 9.5% at SNR0 dB.

      • KCI등재후보

        5.1채널 스피커 시스템에서 트랜스오럴 필터 구현에 관한 연구

        최갑근,방승범,김순협,정완섭 한국음향학회 2002 韓國音響學會誌 Vol.21 No.3

        5.1채널 스피커 시스템을 이용하여 음향을 재현시 나타나는 현상인 크로스토크를 제거하여 청취자에게 보다 입체적인 음을 재현하는 방법에 관한 것이다. 본 논문에서는 크로스토크를 제거하기 위하여 자유음장 모델을 사용하였다. 이것을 구현함에 있어 주파수 영역에서 심리음향에 기초한 바크 스케일 (bark scale)을 사용한 복소이득 보상을 실시하였으며, 서라운드 채널에 관해서는 밴드패스 필터를 추가하여 주파수 제한적인 음질 보상을 실시하였다. 정면 채널과 서라운드채널의 음원을 제작하여 기존의 2채널 및 5.1 시스템에서 제시하는 음원과 비교하여 객관적인 음질 평가 및 청취자를 대상으로 한 주관 평가를 실시하였다. 제안된 방법에 따라 측정한 결과에 따르면 ±30°의 정면 스피커를 배치한 돌비 표준 스피커 배치에서 38 dB이상의 분리도를 얻었으며 확산감에 대해 전문가를 대상으로 한 주관 평가는 5점 평가를 기준으로 0.4점이 향상되었다. This thesis deals a method to deliver more realistic sound by cancelling the cross-talk which is inherent to the 5.1 channel speaker system. The acoustical model for cross-talk cancellation is the free field model. This model minimizes distortion of sound. I used the bark scale sound quality compensation which based on psycho-acoustic. For the surround channels, band-limited sound quality compensation is performed in the frequency domain. I also performed the sound quality assessment test on the traditional 2 channel stereo and 5.1 channel system. This test is performed in the test chamber which satisfies the ITU-R specifications. I uses the IACC (Inter-Aural Cross-Correlation) to determine the preferences of the amateur and the golden ear experts to asses the trans-aural filter. According to the result from the proposed method, I got more the 38 dB separation rates with the Dolby standard speaker array. The results on the diffusion by the subjective test with the experts shows 0.4 point increased then before.

      • KCI등재

        엔트로피와 하모닉 검출을 이용한 잡음환경에 강인한 음성검출

        최갑근(Gab-Keun Choi),김순협(Soon-Hyob Kim) 大韓電子工學會 2010 電子工學會論文誌-SP (Signal processing) Vol.47 No.1

        이 논문은 잡음환경에서 음성인식률 향상을 위한 끝점 검출 방법에 대해 소개한다. 제안된 방법은 엔트로피와 음성의 하모닉 검출을 이용해 음성 구간과 비음성 구간을 검출한다. 음성의 스펙트럴 에너지에 대한 엔트로피를 사용하여 끝점검출을 하게 되면 비교적 높은 SNR 환경(SNR 15dB)에서는 성능이 우수하나 잡음환경의 변화에 따라 음성과 비음성의 문턱값이 변화하여 낮은 SNR환경(SNR 0dB)에서는 정확한 끝점 검출이 어렵다. 본 논문은 낮은 SNR 환경(0dB)에서도 정확한 끝점을 검출할 수 있도록 음성의 스펙트럴 엔트로피와 하모닉 성분을 검출하여 끝점을 검출하는 방법을 제안한다. 실험결과 기존의 엔트로피만을 이용한 방법보다 개선된 성능을 보였다. This paper explains end-point detection method for better speech recognition rates. The proposed method determines speech and non-speech region with the entropy and the harmonic detection of speech. The end-point detection using entropy on the speech spectral energy has good performance at the high SNR(SNR 15dB) environments. At the low SNR environment(SNR 0dB), however, the threshold level of speech and noise varies, so the precise end-point detection is difficult. Therefore, this paper introduces the end-point detection methods which uses speech spectral entropy and harmonics. Experiment shows better performance than the conventional entropy methods.

      • KCI등재

        멀티밴드 스펙트럼 차감법과 엔트로피 하모닉을 이용한 잡음환경에 강인한 분산음성인식

        최갑근(Gab-Keun Choi),김순협(Soon-Hyob Kim) 大韓電子工學會 2011 電子工學會論文誌-CI (Computer and Information) Vol.48 No.1

        음성인식의 실용화에 가장 저해되는 요소는 배경잡음과 채널에 의한 왜곡이다. 일반적으로 잡음은 음성인식 시스템의 성능을 저하시키고 이로 인해 사용 장소의 제약을 많이 받고 있다. DSR(Distributed Speech Recognition) 기반의 음성인식 역시 이와 같은 문제로 성능 향상에 어려움을 겪고 있다. 이 논문은 잡음환경에서 DSR기반의 음성인식률 향상을 위해 정확한 음성구간을 검출하고, 잡음을 제거하여 잡음에 강인한 특징추출을 하도록 설계하였다. 제안된 방법은 엔트로피와 음성의 하모닉을 이용해 음성구간을 검출하며 멀티밴드 스펙트럼 차감법을 이용하여 잡음을 제거한다. 음성의 스펙트럴 에너지에 대한 엔트로피를 사용하여 음성검출을 하게 되면 비교적 높은 SNR 환경(SNR 15dB)에서는 성능이 우수하나 잡음환경의 변화에 따라 음성과 비음성의 문턱 값이 변화하여 낮은 SNR환경(SNR 0dB)에서는 정확한 음성 검출이 어렵다. 이 논문은 낮은 SNR 환경(0dB)에서도 정확한 음성을 검출할 수 있도록 음성의 스펙트럴 엔트로피와 하모닉 성분을 이용하였으며 정확한 음성 구간 검출에 따라 잡음을 제거하여 잡음에 강인한 특징을 추출하도록 하였다. 실험결과 잡음환경에 따른 인식조건에서 개선된 인식성능을 보였다. The background noises and distortions by channel are major factors that disturb the practical use of speech recognition. Usually, noise reduce the performance of speech recognition system. DSR(Distributed Speech Recognition) based speech recognition also has difficulty of improving performance for this reason. Therefore, to improve DSR-based speech recognition under noisy environment, this paper proposes a method which detects accurate speech region to extract accurate features. The proposed method distinguish speech and noise by using entropy and detection of spectral energy of speech. The speech detection by the spectral energy of speech shows good performance under relatively high SNR(SNR 15dB). But when the noise environment varies, the threshold between speech and noise also varies, and speech detection performance reduces under low SNR(SNR 0dB) environment. The proposed method uses the spectral entropy and harmonics of speech for better speech detection. Also, the performance of AFE is increased by precise speech detections. According to the result of experiment, the proposed method shows better recognition performance under noise environment.

      • 변형에 강인한 내용기반 동영상 검색방법

        최갑근(Gab-Keun Choi),김순협(Soon-Hyob Kim) 한국HCI학회 2008 한국HCI학회 학술대회 Vol.2008 No.2

        동영상 내용검색을 위해서 가장 많이 사용되고 있는 기술은 컷 추출에 의한 내용비교 방법이다. 그러나 컷 추출을 위해 사용되는 CHD(Color Histogram Difference)나 ECR(Edge Change Ratio)둥은 영상물의 Cropping, Resizing, Low bit rate등의 변화에 대해 대단히 취약하다. 본 방법은 이러한 변형에 강인하도록 상대적으로 변형이 적은 오디오정보를 이용하여 Indexing과 Searching을 수행하였다. 특히 변형에 강인한 Searching을 위해 오디오의 장면(Scene)을 검출하였고 장면을 중심으로 Time-frequency domain에서 각각의 Frequency bin.에 대한 스펙트럴 파워를 파워임계값을 중심으로 이진화(Binary)하였다. 제안된 방법으로 Cropping, clipping, Lowbit rate, Additive Frame 등의 변형본에 대한 검색을 시도한 결과 False positive Error 와 True Negative Error에 대해 각각 1 %미만의 오탐지 결과를 얻었다. The most widely used method for searching contents of motion picture compares contents by extracted cuts. The cut extraction methods, such as CHD(Color Histogram Difference) or ECR(Edge Change Ratio), are very weak at modifications such as cropping, resizing and low bit rate. The suggested method uses audio contents for indexing and searching to make search be robust against these modification. Scenes of audio contents are extracted for modification-robust search. And based on these scenes, make spectral powers b i nary on each frequency bin. in the time-frequency domain. The suggested method shows failure rate less than 1% on the false positive error and the true negative error to the modified(using cropping, clipping, row bit rate, addtive frame) contents.

      • Fail Safe 기반 마이크로그리드 게이트웨이 하드웨어 설계

        최갑근(GabKeun Choi),송기웅(GiUng Song),송병근(ByeongKeun Song),박용석(Yongseok Park),오쌍석(SSangSuk Oh),장학(Hak Jang) 대한전기학회 2016 대한전기학회 학술대회 논문집 Vol.2016 No.3

        본 논문에서는 결함의 영향을 받지 않고, 결함이 발생하여도 안전측으로 동작할 수 있는 고장안전 특성 구조를 가지는 마이크로 그리드를 위한 게이트웨이 시스템의 하드웨어 설계에 관한 논문이다. 마이크로그리드를 위한 게이트웨이의 운용환경은 온도 및 습도등 환경이 열악한 곳이 대부분이고 인적이 드문 곳이나 관리자가 접근하기 곤란한 격오지에 설치될 가능성이 높아 게이트웨이의 기능상 문제가 발생하면 즉각적인 조치가 어렵다. 본 논문에서는 이와 같은 문제를 극복하고 운용환경에 강건한 게이트웨이 하드웨어 성능을 확보하기 위해 고장안전 기반의 하드웨어 설계를 실시하였고 동작상태를 모니터링하여 정상 운용상태와 비정상 운용상태를 판단하기 위한 통계적 모델에 기반 한 고장분석 및 진단 방법과 전원 이중화 및 소프트웨어와 하드웨어를 전부 사용하는 이중수준(Dual level) 와치독(Watch dog) 기능 설계를 제안하였다.

      • KCI등재

        빅데이터 및 인공지능 기반의 소청심사결정 예측 시스템 연구

        김두연,최갑근,최진명,박진호,김종배 한국IT정책경영학회 2020 한국IT정책경영학회 논문지 Vol.12 No.3

        Teachers' appeals are increasing every year. However, it is difficult to process decision work due to the lack of a system that can utilize information on past decision cases. Therefore, it is necessary to establish a search system for teacher disciplinary decision and a case information service system to which the latest technologies such as Bigdata and Artificial Intelligence are applied. Doing so can greatly help protect the authority from unfair discipline and reduce judgment errors. The system for predicting the decision of teacher appeal review based on Bigdata and Artificial Intelligence that presented in this study consists of content-based precedent search, Bigdata analysis, and artificial intelligence. In the future, if the information service based on big data and artificial intelligence presented in this study is implemented, it is expected that the anxiety of teachers will be resolved, and as a result, it will greatly contribute to improving teacher satisfaction and welfare.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼