http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
음성인식기 성능 향상을 위한 영상기반 음성구간 검출 및 적응적 문턱값 추정
송태엽,이경선,김성수,이재원,고한석,Song, Taeyup,Lee, Kyungsun,Kim, Sung Soo,Lee, Jae-Won,Ko, Hanseok 한국음향학회 2015 韓國音響學會誌 Vol.34 No.4
본 연구에서는 음성인식기 성능향상을 위한 영상기반 음성구간 검출방법을 제안한다. 기존의 광류기반 방법은 조도변화에 대응하지 못하고 연산량이 많아서 이동형 플렛홈에 적용되는 스마트 기기에 적용하는데 어려움이 있고, 카오스 이론 기반 방법은 조도변화에 강인하지만 차량 움직임 및 입술 검출의 부정확성으로 인해 발생하는 오검출이 발생하는 문제점이 있다. 본 연구에서는 기존 영상기반 음성구간 검출 알고리즘의 문제점을 해결하기 위해 지역 분산 히스토그램(Local Variance Histogram, LVH)과 적응적 문턱값 추정 방법을 이용한 음성구간 검출 알고리즘을 제안한다. 제안된 방법은 조도 변화에 따른 픽셀 변화에 강인하고 연산속도가 빠르며 적응적 문턱값을 사용하여 조도변화 및 움직임이 큰 차량 운전자의 발화를 강인하게 검출할 수 있다. 이동중인 차량에서 촬영한 운전자의 동영상을 이용하여 성능을 측정한 결과 제안한 방법이 기존의 방법에 비하여 성능이 우수함을 확인하였다. In this paper, we propose an algorithm for achieving robust Visual Voice Activity Detection (VVAD) for enhanced speech recognition. In conventional VVAD algorithms, the motion of lip region is found by applying an optical flow or Chaos inspired measures for detecting visual speech frames. The optical flow-based VVAD is difficult to be adopted to driving scenarios due to its computational complexity. While invariant to illumination changes, Chaos theory based VVAD method is sensitive to motion translations caused by driver's head movements. The proposed Local Variance Histogram (LVH) is robust to the pixel intensity changes from both illumination change and translation change. Hence, for improved performance in environmental changes, we adopt the novel threshold estimation using total variance change. In the experimental results, the proposed VVAD algorithm achieves robustness in various driving situations.
Multiple Subarea Pose Models based Top-view People Detection for Smart Home System
Sungmok Hwang(황석목),Taeyup Song(송태엽),Sangyun Kim(김상윤),Seungmyun Baek(백승면),Dubok Park(박두복),Hanseok Ko(고한석) 대한전자공학회 2017 대한전자공학회 학술대회 Vol.2017 No.6
본 논문에서는 평면 시점에서 촬영된 영상에서 효과적인 사람 검출을 위한 다중 영역 자세 모델을 이용한 사람 검출 기술을 제안한다. 제안된 기술은 3가지 단계로 첫 번째로 밝기 변화에 대응하기 위해 히스토그램의 상/하한 문턱값 및 감마 보정을 통한 밝기 보정 기술, 다음으로 다중 영역별 자세 모델을 이용한 사람 검출기술, 마지막으로 카오스 이론 기반의 움직임 측정을 통한 검출결과 정련 기술로 구성된다. 실험 결과를 통해 제안된 방법은 단일 자세 모델기반의 사람 검출 기술에 비해 향상된 성능을 보이는 것을 확인할 수 있다.