RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        계층구조 음성 부호화기를 위한 지연 없는 MDCT 구조

        성호상,박호종,Sung, Ho-Sang,Park, Ho-Chong 한국음향학회 2007 韓國音響學會誌 Vol.26 No.3

        고성능 계층구조 음성 부호화기는 매우 낮은 전송율의 1차 계층과 미세 계층구조를 가지는 2차 계층을 요구하고, 이는 각 계층에서 하모닉 부호화기와 MDCT 기반 변환 부호화기를 사용하여 구현할 수 있다. 그러나 이 구조는 하모닉 부호화기와 변환부호화기에서 각각 독립적인 주파수 변환이 필요하고 각 변환에서 발생하는 시간지연이 누적되어 전체 부호화기의 시간지연이 증가하는 문제를 가진다. 본 논문에서는 시간지연이 누적되는 문제를 해결하기 위하여 2차 계층의 MDCT가 1차 계층의 Look-Ahead 영역을 공유하도록 하고 이 때 발생하는 MDCT 동작의 오류를 분석하고 이 성분을 IMDCT출력에서 제거하는 새로운 MDCT동작 구조를 제안한다 제안한 지연 없는 MDCT구조를 위하여 추가로 전송할 정보는 없으며 동등한 부호화 성능을 유지하면서 시간지연을 감소시켜 부호화기 성능을 크게 향상시킨다. A high-Performance scalable speech codec generally requires a very low-rate first layer and a fine granule second layer, and this codec can be implemented with the harmonic codec and the MDCT-based transform codec for each layer. In this structure, however. each codec requires independent frequency transform and the time delay of each codec is accumulated. resulting in long time delay for the overall codec. In this paper, new MDCT structure in the second layer is Proposed. where MDCT is forced to share the look-ahead region of the first layer in order to prevent the time delay accumulation and the resulting functional error of MDCT is analyzed and removed after IMDCT The Proposed delayless MDCT requires no additional bits and Provides the equivalent coding performance with the reduced time delay, yielding a meaningful enhancement of the overall codec.

      • KCI등재

        선택적 비트 플레인 부호화를 이용한 오디오 주파수 계수의 무손실 부호화 기술

        유승관,박호종,오승준,안창범,심동규,백승권,강경옥,Yoo, Seung-Kwan,Park, Ho-Chong,Oh, Seoung-Jun,Ahn, Chang-Beom,Sim, Dong-Gyu,Beak, Seung-Kwon,Kang, Kyoung-Ok 한국음향학회 2008 韓國音響學會誌 Vol.27 No.1

        본 논문에서는 오디오 부호화기의 양자화 된 주파수 계수 인덱스를 무손실 부호화 하는 새로운 방법을 제안한다. 기존의 무손실 부호화기는 계수의 통계적 특성을 이용하여 허프만 부호화 하고 있으나 간단한 구조로 인하여 최고의 성능을 제공하지 못한다. 본 논문에서는 비트 플레인 변환과 런렝스 부호화 기술을 사용하여 성능이 향상된 새로운 주파수 계수의 무손실 부호화 기술을 제안한다. 제안하는 방법은 주파수 계수의 양자화 인덱스를 비트 플레인 변환을 거쳐 상관도가 높은 1차원 비트열로 변환하고 이를 런렝스 부호화 하고 최종적으로 런렝스 심볼을 허프만 부호화 한다. 또한 주파수 대역을 크게 3개의 구역으로 나누고 각 구역에서 비트 플레인 부호화 방법을 선택적으로 사용하도록 하여 성능을 추가로 향상시킨다. 제안한 무손실 부호화 성능을 엔트로피에 의한 이론적 비트 수로 측정하면 기존의 AAC 무손실 부호화에 비하여 최대 6% 성능 향상을 제공한다. In this paper, new lossless coding method of spectral coefficients for audio codec is proposed. Conventional lossless coder uses Huffman coding utilizing the statistical characteristics of spectral coefficients, but does not provide the high coding efficiency due to its simple structure. To solve this limitation, new lossless coding scheme with better performance is proposed that consists of bit-plane transform and run-length coding. In the proposed scheme, the spectral coefficients are first transformed by bit-plane into 1-D bit-stream with better correlative properties, which is then coded intorun-length and is finally Huffman coded. In addition, the coding performance is further increased by applying the proposed bit-plane coding selectively to each group, after the entire frequency is divided into 3 groups. The performance of proposed coding scheme is measured in terms of theoretical number of bits based on the entropy, and shows at most 6% enhancement compared to that of conventional lossless coder used in AAC audio codec.

      • KCI등재

        디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술

        서진호,박호종,Seo, Jin-Ho,Park, Ho-Chong 한국음향학회 2005 韓國音響學會誌 Vol.24 No.7

        디지털 통신 시스템에서의 음성 인식은 음성 부호화기에 의한 음성 신호의 왜곡으로 인하여 성능이 크게 저하된다. 본 논문에서는 음성 부호화기에 의한 스펙트럼 왜곡을 분석하고 왜곡된 주파수 정보를 보상하는 전처리 과정을 통하여 음성 인식 성능을 향상시키는 방법을 제안한다. 현재 널리 사용되는 표준 음성 부호화기인 IS-127 EVRC, ITU G.729 CS-ACELP. IS-96 QCELP를 사용하여 부호화에 의한 왜곡을 분석하고, 모든 음성 부호화기에 공통으로 적용하여 왜곡을 보상할 수 있는 전처리 방법을 개발하였다. 본 논문에서 제안하는 왜곡 보상 방법을 세 종류의 음성부호화기에 각각 적용하였으며, 왜곡된 음성 신호에 대한 음성 인식률에 비하여 최대 $15.6\%$의 인식률 향상을 얻을 수 있었다. Speech recognition in digital communication systems has very low performance due to the spectral distortion caused by speech codecs. In this paper, the spectral distortion by speech codecs is analyzed and a pre-processing method which compensates for the spectral distortion is proposed for performance enhancement of speech recognition. Three standard speech codecs. IS-127 EVRC. ITU G.729 CS-ACELP and IS-96 QCELP. are considered for algorithm development and evaluation, and a single method which can be applied commonly to all codecs is developed. The performance of the proposed method is evaluated for three codecs, and by using the speech features extracted from the compensated spectrum. the recognition rate is improved by the maximum of $15.6\%$ compared with that using the degraded speech features.

      • KCI등재

        패킷 중요도 결정에 의한 VoIP 통화 품질 향상 기술

        윤제열,박호종,Yoon, Jae-Yul,Park, Ho-Chong 한국음향학회 2010 韓國音響學會誌 Vol.29 No.5

        VoIP 시스템의 통화 품질은 패킷의 전송 손실에 의하여 크게 저하되며, 각 패킷의 손실에 의한 음질 저하 정도는 해당 패킷의 특성에 따라 결정된다. 따라서 각 패킷 손실에 의한 음질 저하를 미리 분석하여 전송 과정에서 손실되는 패킷을 선택적으로 조정하면 VoIP 통화 품질을 향상시킬 수 있다. 본 논문에서는 DS 기반의 네트워크를 사용하는 VoIP에서 각 패킷에 전송 우선순위를 할당하여 통화 품질을 향상시키는 구조를 제안하고, 이를 위한 패킷 중요도 결정 방법을 제안한다. Gilbert 모델에 따른 패킷 손실 환경에서 제안한 방법의 성능을 측정하였으며, 객관적 음질 평가와 주관적 음질 평가를 통하여 VoIP 통화 품질이 향상되는 것을 확인하였다. In VoIP system, the speech quality is seriously degraded due to packet loss, and the degree of degradation by each packet loss depends on the characteristics of the corresponding packet. Therefore, it is possible to improve the speech quality of VoIP by selectively controlling the packet to be lost during transmission based on the expected degradation by the loss of each packet. In this paper, a new scheme to improve speech quality of DiffServ-based VoIP by assigning priority to each packet is proposed, and a method to determine the priority of each packet is developed. The performance of proposed method was measured in packet loss environment based on Gilbert model, and it was verified both objectively and subjectively that the speech quality is improved by the proposed method.

      • KCI등재

        청각 기억 게임을 위한 리듬 유사도 측정 기술

        김주완,이세원,박호종,Kim, Ju-Wan,Lee, Se-Won,Park, Ho-Chong 한국음향학회 2011 韓國音響學會誌 Vol.30 No.3

        본 논문에서는 청각 기억 게임을 위하여 두 개의 소리 파형을 비교하여 파형의 리듬 유사도를 정량적으로 측정하는 기술을 제안한다. 제안한 방법은 두 입력 파형에 대하여 에너지 변화, 에너지 피크의 지속 시간, 음색 등을 분석하여 각 파형에 포함된 비트 위치를 검출하고, 두 파형의 템포 차이와 비트 수의 차이를 보상하는 과정을 통하여 두 파형의 리듬 벡터를 각각 정의한다. 다음, 두 리듬 벡터 사이의 차이와 비트 수의 차이를 적용하여 두 입력 파형의 리듬 유사도를 정량적으로 표현하는 식을 정의한다. 제안한 방법으로 측정한 리듬 유사도와 주관적 청취 평가로 측정한 리듬 유사도를 비교하였으며, 두 방법에 의한 리듬 유사도가 상관도 0.86을 가지는 것을 확인하였다. In this paper, a method for measuring rhythmic similarity between two sound signals for auditory memory game is proposed. The proposed method analyzes energy fluctuation, the temporal duration of energy peak, the timbre of two signals, and detects beat positions for each signal. Then, it determines the rhythm vector after compensating a difference in tempo and the number of beats between two signals. Finally, a method for rhythmic similarity measurement is defined as a function of the dissimilarity between two rhythm vectors and a difference in the number of beats. The rhythmic similarity measured by the proposed method and that by the subjective listening test are compared, and the correlation of 0.86 between two results is achieved.

      • KCI등재

        보컬 피치 검출의 성능 향상을 위한 보컬 강화 기술

        이세원,송재종,이석필,박호종,Lee, Se-Won,Song, Chai-Jong,Lee, Seok-Pil,Park, Ho-Chong 한국음향학회 2011 韓國音響學會誌 Vol.30 No.6

        본 논문에서는 다성 음악 신호의 보컬 피치 검출 성능을 향상시키기 위해 음악 신호의 보컬 신호를 강화시키는 전처리 기술을 제안한다. 제안한 보컬 강화 기술은 입력된 다성 음악 신호로부터 반주 신호를 예측하고, 예측된 반주 신호를 입력된 보컬 신호의 크기에 맞춰 가공하여 반주 복사본 신호를 생성한다. 마지막으로 주파수 영역에서 반주 복사본 신호를 원래 다성 음악 신호에서 제거하여 보컬이 강화된 출력 신호를 생성한다. 원 음악 신호와 제안한 방법으로 보컬이 강화된 신호에 동일한 보컬 피치 검출 방법을 각각 적용하여 피치 검출의 정확도를 측정하였고, 제안한 기술에 의하여 피치 검출 정확도가 평균 7.1 % 포인트 향상된 것을 확인하였다. This paper proposes a vocal enhancement technique for improving the performance of vocal pitch detection in polyphonic music signal. The proposed vocal enhancement technique predicts an accompaniment signal from the input signal and generates an accompaniment replica signal according to the vocal power. Then, it removes the accompaniment replica signal from the input signal, resulting in a vocal-enhanced signal. The performance of the proposed method was measured by applying the same vocal pitch extraction method to the original and the vocal-enhanced signal, and the vocal pitch detection accuracy was increased by 7.1 % point in average.

      • KCI등재

        잡음 환경에서의 음성 명료도 향상 기술

        윤제열,김중회,오은미,박호종,Yoon, Jae-Yul,Kim, Jung-Hoe,Oh, Eun-Mi,Park, Ho-Chong 한국음향학회 2009 韓國音響學會誌 Vol.28 No.1

        주변 잡음이 심한 환경의 음성 통신에서 음성 명료도는 주변 잡음의 마스킹 효과로 인하여 크게 저하된다. 본 논문에서는 잡음 환경에서 음성 명료도를 향상시켜 통화 품질을 높이는 새로운 방법을 제안한다. 청각 이론에 의하면 음성의 시간축포락선은 명료도 결정에 중요한 역할을 한다. 이에 따라 본 논문에서는 대역별 시간축 포락선의 변화를 강화하여 명료도를 향상시키는 방법을 사용하며, 음질을 추가로 향상시키기 위한 피치 강화동작을 포함한다. 또한, 실제 통화상황에서의 정확한 주관적 성능 평가를 위하여 양 귀를 이용하는 새로운 주관적 성능 평가 방법을 제안한다. 제안하는 평가 방식을 통하여 제안하는 명료도 향상 기술의 성능을 평가하였으며, 명료도와 음질이 모두 향상되는 것을 확인하였고, 동작 파라미터 조정을 통하여 명료도와 음질 사이의 상호 관계가 조정되는 것을 확인하였다. In speech communications in noisy environments, speech intelligibility is seriously degraded due to the masking effect of ambient noise. In this paper, a new method to improve speech intelligibility in noisy environments is proposed. Based on the perception theory that the temporal envelope plays a major role in determining intelligibility, the proposed method uses a novel operation that enhances the fluctuation of band-wise temporal envelope and also contains pitch enhancement for improving speech naturalness. In addition, a new subjective evaluation scheme employing binaural listening is proposed in order to measure more reliable performance. The subjective performance measured with the proposed scheme shows that the proposed method improves both intelligibility and naturalness in various environments, whereas a function parameter can control the performance trade-off between intelligibility and naturalness.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼