http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
개선된 머리전달함수를 이용한 3차원 입체음향 성능 개선 연구
구교식,차형태,Koo, Kyo-Sik,Cha, Hyung-Tai 한국음향학회 2009 韓國音響學會誌 Vol.28 No.6
인간의 청각기관은 소리의 방향과 거리인지에 있어서 여러 가지의 정보들을 복합적으로 이용한다. 이러한 양 귀에 들어오는 소리세기의 차이, 위상의 차이, 그리고 주파수 스펙트럼의 차이 등의 정보들을 종합적으로 포함하고 있는 것이 머리전달함수 (HRIF: Head Related Transfer Function)이다. 2채널 음향재생 시스템에서 이 머리전달함수를 이용하여 다채널 입체음향을 재생하는 방법이 많이 쓰이고 있다. 그러나 머리전달함수의 비개인화적인 특성 때문에 양쪽 귀까지의 거리가 같아지는 혼돈원추 상에서는 앞/뒤 방향 지각에 대한 혼돈을 주게 됨으로써 입체감을 저하시키게 된다. 본 논문에서는 입체음향을 생성하기 위해 머리전달함수를 사용하는 과정예서 발생하는 혼돈원추 문제점을 해결하기 위한 알고리즘을 제안한다. 각 머리전달함수의 주파수 차 및 인간의 청각 특성을 이용하여 각 방향에 해당하는 머리전달함수의 주파수 스펙트럼 특성을 조절하였다. 본 알고리즘의 성능을 평가하기 위하여 음상정위 테스트 및 청감 테스트를 실시하였으며 실험 결과 헤드폰을 기반으로 한 2채널 입체음향 시스템에서 향상된 입체음향을 재생하였다. 더불어 구현된 입체음향의 음질의 열화도 적음을 확인할 수 있었다. To perceive the direction and the distance of a sound, we always use a couple of information. Head Related Transfer Function (HRTF) contains the information that sound arrives from a sound source to the ears of the listener, like differences of level, phase and frequency spectrum. For a reproduction system using 2 channels, we apply HRTF to many algorithms which make 3d sound. But it causes a problem to localize a sound source around a certain places which is called the cone-of-confusion. In this paper, we proposed the new algorithm to reduce the confusion of sound image localization. The difference of frequency spectrum and psychoacoustics theory are used to boost the spectral cue among each directions. To confirm the performance of the algorithm, informal listening tests are carried out. As a result, we can make the improved 3d sound in 2 channel system based on a headphone. Also sound quality of improved 3d sound is much better than conventional methods.
구교식,차형태,Koo, Kyo-Sik,Cha, Hyung-Tai 한국음향학회 2011 韓國音響學會誌 Vol.30 No.5
The Head Related Transfer Function (HRTF) means a process related to acoustic transmission from 3d space to the listener's ear. In other words, it contains the information that human can perceive locations of sound sources. So, we make virtual 3d sound using HRTF, despite it doesn't actually exist. But, it can deteriorate some three-dimensional effect by the confusion between front and back directions due to the non-individual HRTF depending on each listener. In this paper, we proposed the new algorithm to reduce the confusion of sound image localization using human's acoustic characteristics. The frequency spectrum and global masking threshold of 3d sounds using HRTF are used to calculate the psychoacoustical differences among each directions. And perceptible cues in each critical band are boosted to create effective 3d sound. As a result, we can make the improved 3d sound, and the performances are much better than conventional methods. 3차원 공간에서 음원으로부터 사람의 귀로 음향적인 전달 과정을 표현하는 머리전달함수는 사람이 음원의 위치를 판단할 수 있는 중요한 정보를 포함하고 있으며, 이를 이용하여 실질적으로는 존재하지 않는 음원을 근사적으로 생성할 수 있다. 그러나 각 청자에 특화되지 않는 머리전달함수를 사용함으로 인해 전후 방향이나 상하 방향의 혼동이 발생하게 되어 음상정위 성능이 저하된다. 이 논문에서는 머리전달함수를 통해 생성된 입체음향을 인간의 청각 특성을 사용하여 개선하는 알고리즘을 제안한다. 머리전달함수가 적용된 사운드 신호의 전역 마스킹 값을 계산한 후, 청자에게 크게 영향을 미치는 주파수 대역만을 추출하여 이를 강조함으로서 각 방향에 해당하는 인지 특성을 부각시키는 방법을 제안하였으며, 제안된 방법의 성능을 청감테스트를 통해 증명하였다.
구교식,차형태,Koo, Kyo-Sik,Cha, Hyung-Tai 한국음향학회 2010 韓國音響學會誌 Vol.29 No.4
본 논문에서는 독립 성분 분석 기법과 적응 지각 필터를 이용하여 잡음에 오염된 신호에서 잡음을 추정 및 제거함으로서 보다 효율적으로 오디오 신호를 개선하는 방법에 대해 제안한다. 기존의 적응 지각 필터는 묵음 구간에서 추정된 고정적인 추정 잡음을 사용하기 때문에 잡음이 시간에 따라 가변적일 경우 성능이 상당히 저하된다. 그러나 제안된 알고리즘은 독립 성분 분석 기법을 이용하여 신호 구간마다 달라지는 잡음을 추정한 후 이를 적응 지각 필터에 적용시켜 준다. 제안된 알고리즘의 성능 분석을 위하여 기존 및 제안된 알고리즘을 이용한 시뮬레이션을 수행하였으며, 그 결과로 제안된 알고리즘은 기존의 알고리즘에 비해 향상된 결과를 생성하였다. 더불어 음질의 열화도 적음을 확인할 수 있었다. In this paper, we proposed an algorithm that improves tone quality of noisy audio signals by using ICA(Independent Component Analysis) algorithm and perceptual filters. Many algorithms have been proposed to eliminate the noise from the audio signals, such as spectral subtraction method, perceptual filter, etc. The perceptual filter uses a noise that is acquired from silent ranges in the input signal. In this case, the improvement rate of tone quality decreases if the noise energy is changed by the environmental variation in a signal frame. But the proposed method estimates a noise that is changed at each frame using ICA algorithm. The estimated noise is applied to perceptual filter. To show the performance of the proposed algorithm, several tests are performed to various input signals. With the proposed algorithm, we could confirm the enhancement of tone quality in terms of segmental SNR (SSNR), noise-to-mask ratio (NMR) and Degradation Category Rating (DCR) test.
청각에너지를 이용한 모노럴 시스템에서의 음상 정위 특성 연구
구교식,차형태,Koo, Kyo-Sik,Cha, Hyung-Tai 한국음향학회 2011 韓國音響學會誌 Vol.30 No.4
디지털 신호처리 기술의 발달로 게임, 멀티미디어 콘텐츠, 가상현실 등에서 입체음향에 대한 관심이 증대되었다. 입체음향에 대한 많은 연구에서는 현실감을 증가시키기 위한 여러 가지 단서를 제시하고 있다. 그러나 이런 단서들은 입체음향이 인간의 두 귀가 정상인 바이노럴 환경에서 생성됨을 기본 바탕으로 삼고 있다. 따라서 이 단서들을 한쪽의 귀에만 적용하는 모노럴 환경에 적용하게 되면 그 성능이 감소된다. 이에 모노럴 환경에서도 효율적인 입체음향 구현을 위한 여러 가지 단서들이 연구되고 있는데 가장 대표적인 것이 양이 단서 (Duplex theory)이다. 양이 단서는 음이 방사되는 방향에 따라서 귓바퀴 등의 인간의 신체에 의해 영향을 받게 된다는 것으로 이 특성을 강조시키면 모노럴 환경에서도 각 방향에 따른 방향감을 개선시킬 수 있게 된다. 본 논문에서는 인간의 청각 특성을 이용하여 모노럴 환경에서 음상 정위감을 개선시키기 위한 알고리즘을 제안한다. 서로 대칭되는 각 머리전달함수의 여기에너지를 계산하고 각 bark 대역에 따른 비율을 추출한 후 이를 이용하여 각 방향에 해당하는 특성을 부각시키는 방법을 제안하였으며 청감테스트를 통하여 제안한 방식이 모노럴 환경의 입체음향 시스템에서 향상된 입체음향을 재생함을 확인할 수 있었다. According to developments of digital signal processing, 3D sound come into focus on multimedia systems. Many studies on 3d sound have proposed lots of clues to create realistic sounds. But these clues are only focused on binaural systems which two ears are normal. If we make the 3d sound using those clues at monaural systems, the performance goes down dramatically. In order to use the clues for monaural systems, we have studies algorithms such as duplex theory. In duplex theory, the sounds that we listen are affected by human's body, pinna and shoulder. So, we can enhance sound localization performances using its characteristics. In this paper, we propose a new method to use psychoacoustic theory that creates realistic 3D audio at monaural systems. To improve 3d sound, we calculate the excitation energy rates of each symmetric HRTF and extract the weights in each bark range. Finally, they are applied to emphasize the characteristics related to each direction. Informal listening tests show that the proposed method improves sound localization performances much better than the conventional methods.
서정국,차형태,Seo Joung-Kook,Cha Hyung-Tai 한국음향학회 2005 韓國音響學會誌 Vol.24 No.1
본 논문에서는 잡음 에너지 제어를 통한 지각 필터의 성능을 향상시킴으로써 잡음에 의해 열화 된 오디오 신호의 음질을 개선하는 알고리즘을 제안한다. 기존의 방식에서는 묵음 구간에서 획득한 잡음 에너지를 사용하여 필터를 구성하여 사용하지만, 신호 구간마다 달라지는 신호의 세기 및 잡음의 환경 정도에 많은 영향을 받아 잡음의 에너지가 급격하게 변화한다면 음질의 개선률이 감소함을 알 수 있다. 그러나 제안하는 방식에서는 묵음 구간에서 추정한 잡음의 에너지 제어를 통해 초기 추정 잡음보다 가까운 추정 잡음을 얻음으로써 잡음 에너지가 급격하게 변화하여도 음질 개선률에는 변화가 적음을 알 수 있었다. 또한 저 대역에 영향을 미치는 잡음의 경우에도 다른 방법들과는 달리 음질의 개선이 뚜렷하였다. 기존 방식과의 비교를 위해 다양한 신호 대 잡음 비 (signal-to-noise ratio, SNR)에서 열화 된 오디오 신호를 입력으로 사용하였다. 입력 SNR이 5dB, l0dE, 15dB와 20dB의 각각의 경우에 대하여 SSNR (Segmental SNR)과 잡음 대 마스킹 비 (Noise-to-mask ratio, NMR), 음질 테스트를 수행한 결과, 청감 테스트 (Mean Opinion Score, MOS Test)결과의 향상과 음질의 개선을 확인할 수 있었다. In this paper, we propose an algorithm that improves a tone quality of a noisy audio signal in order to enhance a Performance of perceptual filter using noise energy control. Most of the algorithms which were proposed by the other researchers usually applied a filter using the noise energy acquired from a silent range. In this case. the improvement rate of tone quality decreases if the noise energy is changed by the magnitude or environment variation in a signal frame. But the Proposed method Provides the means to find a food estimated noise through energy control of the estimated noise which is obtained from a silent range. Also we can get the enhancement of tone qualify in low frequency band unlike other methods. To show the performance of the Proposed algorithm, various input signals which had a different signal-to-noise ratio (SNR) such as 5dB, l0dB, 15dB and 20dB were used to test the proposed algorithm. With the proposed algorithm, we could confirm the enhancement of tone quality in terms of segmental SNR (SSNR). noise-to-mask ration (NMR) and mean opinion score (MOS) test.
구교식,차형태,Koo, Kyo-Sik,Cha, Hyung-Tai 한국음향학회 2008 韓國音響學會誌 Vol.27 No.4
입체음향을 구현하는 방법으로는 다수의 스피커를 사용하는 다채널 음향재생 시스템과 2개의 스피커나 스테레오 헤드폰을 이용하는 2채널 음향재생 바이노럴 시스템이 있다. 그 중에서 공간 및 비용 상의 문제로 인하여 2채널을 이용한 음향재생시스템이 주목을 받고 있다. 일반적으로 2채널로 입체음향을 재생하기 위해서는 소리가 음원으로부터 청자의 두 귀에 이르는 경로를 모델링한 머리전달함수 (HRTF : Head Related Transfer Function)를 이용하지만 혼돈원추 상에서 음상정위의 혼돈을 주게 되므로 입체감을 저하시킨다는 단점이 있다. 본 논문에서는 2채널 입체음향 시스템을 효과적으로 구현하기 위하여 머리전달함수를 개선하는 알고리즘을 제안한다. HRTF 그룹화 및 심리음향을 이용하여 각 방향에 해당하는 주파수 스펙트럼 특성을 부각시키는 방법을 적용하였으며 시뮬레이션을 통하여 제안한 알고리즘이 정확한 방향감을 생성할 수 있음을 확인하였다. To create 3D sound, we usually use two methods which are two channels or multichannel sound systems. Because of cost and space problems, we prefer two channel sound system to multi-channel. Using a headphone or two speakers, the most typical method to create 3D sound effects is a technology of head related transfer function (HRTF) which contains the information that sound arrives from a sound source to the ears of the listener. But it causes a problem to localize a sound source around a certain places which is called cone-of-confusion. In this paper, we proposed the new algorithm to reduce the confusion of sound image localization. HRTF grouping and psychoacoustics theory are used to boost the spectral cue with spectrum difference among each directions. Informal listening tests show that the proposed method improves the front-back sound localization characteristics much better than conventional methods.
한의환 ( Eui Hwan Han ),차형태 ( Hyung Tai Cha ) 한국감성과학회 2014 감성과학 Vol.17 No.3
In this paper, we verify the relation between elements (active and inactive) of Russell`s emotional dimension (A Circumplex Model) to propose a new representing method. Russell`s emotional dimension expresses emotional words (happy, joy, sad, nervous, etc.) as a point on the two dimensions (Arousal and Valence). It is most commonly used in many filed such as Science of Emotion & Sensibility, Human-Computer Interaction (HCI), and Psychology etc. But other researchers have insisted that Russell`s emotional dimension have to be modified because of its inherent problems. Such problems included the possibility of mixed feelings, the difference of emotion and sensibility, and the difference of Arousal axis and Valence axis. Therefore, we verify relationship of A Circumplex Model`s elements (active and inactive) and find how to people express their Arousal feelings using survey. We finally propose new method to express emotion in Russell`s emotional dimension. Using this method, we can solve Russell`s problems and compensate other researches.
구교식(Kyo-Sik Koo),차형태(Hyung-Tai Cha) 한국지능시스템학회 2008 한국지능시스템학회논문지 Vol.18 No.3
최근 게임, 멀티미디어 콘텐츠, 가상현실 등을 제공하는 멀티미디어 장치에서 2개의 스피커나 헤드폰을 이용하여 3차원 입체 음향효과를 내고자 하는 가상 입체음향 기법에 관한 연구가 많이 이루어지고 있다. 가상 업체음향 기법 중 가장 대표적인 것으로는 소리가 음원으로부터 청자의 두 귀에 이르는 정보를 포함하고 있는 머리전달함수를 사용하는 방법이 있다. 그러나 이 방법은 혼돈원추 상에서 음상정위의 혼돈을 주게 됨으로서 입체감이 저하된다는 단점이 있다. 본 논문에서는 인간의 청각특성에 따른 여기에너지를 이용하여 현실감있는 입체음향을 생성하는 알고리즘을 제안하고자 한다. 서로 대칭되는 각 머리전달함수의 여기에너지를 계산하고 각 bark 대역에 따른 비율을 추출한 후 앞방향에 해당하는 머리전달함수의 저주파 영역을 보상해줌으로서 스펙트럼 특성을 부각시키는 새로운 방법을 제안하였으며 청감테스트를 통하여 제안한 방식이 기존의 방법보다 방향감을 개선시킴을 확인할 수 있었다. Virtual 3D audio methods that create 3D sound effects are researched highly for multimedia devices using 2 speakers or headphone. The most typical method to create 3D effects is a technology through use of head related transfer function (HRTF) which contains the information that sound arrives from a sound source to the ears of the listener But it can decline some 3D effects by cone of confusion between front and back directions due to the non-individual HRTF depending on each listener. In this paper, we propose a new method to use psychoacoustic theory that creates realistic 3D audio. In order to improve 3D sound, we calculate the excitation energy of each symmetric HRTF and extract the ratio of energy of each bark range. Informal listening tests show that the proposed method improves the front-bach sound localization characteristics much better than the conventional methods.
지각 특성 및 라우드니스를 이용한 입체음향의 성능 개선
구교식(Kyo-Sik Koo),차형태(Hyung-Tai Cha) 한국방송·미디어공학회 2011 방송공학회논문지 Vol.16 No.5
The binaural auditory system of human has ability to differentiate the direction and the distance of the sound sources by using the information which are inter-aural intensity difference(IID), inter-aural time difference(ITD) and/or the spectral shape difference(SSD). These information is generated from the acoustical transfer of a sound source to pinna, the outer ears. We can create a virtual sound system using the information which is called Head related transfer function(HRTF). However the performance of 3D sound is not always satisfactory because of non-individual characteristics of the HRTF. In this paper, we propose the algorithm that uses human's auditory characteristics for accurate perception. To achieve this, excitation energy of HRTF, global masking threshold and loudness are applied to the proposed algorithm. Informal listening test shows that the proposed method improves the sound localization characteristics much better than conventional methods.
복합적 감정,mixed feelings에 대한 감정차원 연구
한의환 ( Eui Hwan Han ),차형태 ( Hyung Tai Cha ) 한국감성과학회 2013 감성과학 Vol.16 No.4
In this paper, we propose new method to reduce variance and express mixed feelings in Russell`s emotional dimension(A Circumplex model). A Circumplex model shows mean and variance of emotions (joy, sad, happy, enjoy et. al.) in PAD(Pleasure, Arousal, Dominace, et. al.) dimension using self-diagnostic method(SAM: Self-Assessment- Manikin). But other researchers consistently insisted that Russell`s model had two problems. First, data(emotional words) gathered by Russell`s method have too big variance. So, it is difficult to separate valid value. Second, Russell`s model can not properly represent mixed feelings because it has structural problem (It has a single Pleasure dimension). In order to solve these problems, we change survey methods, so that we reduce value of variance. And then we conduct survey (which can induce mixed feelings) to prove Positive/Negative (Pleasure) part in emotion and confirm that Russell`s model can be used to express mixed feelings. Using this method, we can obtain high reliability and accuracy of data and Russell`s model can be applied in many other fields such as bio-signal, mixed feelings, realistic broadcasting, et. al.