http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
음성인식기 성능 향상을 위한 영상기반 음성구간 검출 및 적응적 문턱값 추정
송태엽,이경선,김성수,이재원,고한석,Song, Taeyup,Lee, Kyungsun,Kim, Sung Soo,Lee, Jae-Won,Ko, Hanseok 한국음향학회 2015 韓國音響學會誌 Vol.34 No.4
본 연구에서는 음성인식기 성능향상을 위한 영상기반 음성구간 검출방법을 제안한다. 기존의 광류기반 방법은 조도변화에 대응하지 못하고 연산량이 많아서 이동형 플렛홈에 적용되는 스마트 기기에 적용하는데 어려움이 있고, 카오스 이론 기반 방법은 조도변화에 강인하지만 차량 움직임 및 입술 검출의 부정확성으로 인해 발생하는 오검출이 발생하는 문제점이 있다. 본 연구에서는 기존 영상기반 음성구간 검출 알고리즘의 문제점을 해결하기 위해 지역 분산 히스토그램(Local Variance Histogram, LVH)과 적응적 문턱값 추정 방법을 이용한 음성구간 검출 알고리즘을 제안한다. 제안된 방법은 조도 변화에 따른 픽셀 변화에 강인하고 연산속도가 빠르며 적응적 문턱값을 사용하여 조도변화 및 움직임이 큰 차량 운전자의 발화를 강인하게 검출할 수 있다. 이동중인 차량에서 촬영한 운전자의 동영상을 이용하여 성능을 측정한 결과 제안한 방법이 기존의 방법에 비하여 성능이 우수함을 확인하였다. In this paper, we propose an algorithm for achieving robust Visual Voice Activity Detection (VVAD) for enhanced speech recognition. In conventional VVAD algorithms, the motion of lip region is found by applying an optical flow or Chaos inspired measures for detecting visual speech frames. The optical flow-based VVAD is difficult to be adopted to driving scenarios due to its computational complexity. While invariant to illumination changes, Chaos theory based VVAD method is sensitive to motion translations caused by driver's head movements. The proposed Local Variance Histogram (LVH) is robust to the pixel intensity changes from both illumination change and translation change. Hence, for improved performance in environmental changes, we adopt the novel threshold estimation using total variance change. In the experimental results, the proposed VVAD algorithm achieves robustness in various driving situations.
번호판 인식 향상을 위한 번호판 검출과 초해상도 융합 방법
송태엽(Tae-Yup Song),이영현(Young-Hyun Lee),김민재(Min-Jae Kim),구본화(Bon-Hwa Ku),고한석(Han-Seok Ko) 한국컴퓨터정보학회 2011 韓國컴퓨터情報學會論文誌 Vol.16 No.4
본 논문에서는 저해상도 영상에서 번호판 인식 성능 향상을 위해 번호판 검출 기술과 초해상도 복원 기술의 융합 방법을 제안한다. 제안된 알고리즘에서 번호판 검출 부분은 구조적 패턴 특징을 기반으로 하였으며, 초해상도 부분은 칼만 필터 기반 순차적 데이터 방법으로 구성된다. 제안한 융합 방법은 입력 영상에서 번호판 검출 여부에 따라 (i) 전체 영상에 대한 초해상도 복원 과정을 거친 후 고해상도 번호판 영상을 얻는 방법과, (ii) 번호판 검출 후 검출된 번호판 영역에 대해 초해상도 복원을 수행하여 고해상도 번호판 영상을 얻는 방법으로 나뉜다. 다양한 환경에서의 모의 실험을 통해 제안된 융합 방법의효용성을 입증하였다. 다양한 환경에서의 모의 실험을 통해 제안된 융합 방법의 효용성을 입증하였다. This paper proposes fusion methods of license plate detection and super-resolution for improving license plate recognition in low-resolution images. In the proposed method, we apply the license plate detection based on local structure pattern feature and the sequential super-resolution based on Kalman filter. The proposed fusion methods are divided into two according to whether the license plate is detected or not in the input image : (i) performing license plate detection after restoring whole image through super resolution, and (ii) restoring only the detected region through super-resolution after detecting the license plate. We demonstrated effectiveness of the proposed methods in various environments.
Multiple Subarea Pose Models based Top-view People Detection for Smart Home System
Sungmok Hwang(황석목),Taeyup Song(송태엽),Sangyun Kim(김상윤),Seungmyun Baek(백승면),Dubok Park(박두복),Hanseok Ko(고한석) 대한전자공학회 2017 대한전자공학회 학술대회 Vol.2017 No.6
본 논문에서는 평면 시점에서 촬영된 영상에서 효과적인 사람 검출을 위한 다중 영역 자세 모델을 이용한 사람 검출 기술을 제안한다. 제안된 기술은 3가지 단계로 첫 번째로 밝기 변화에 대응하기 위해 히스토그램의 상/하한 문턱값 및 감마 보정을 통한 밝기 보정 기술, 다음으로 다중 영역별 자세 모델을 이용한 사람 검출기술, 마지막으로 카오스 이론 기반의 움직임 측정을 통한 검출결과 정련 기술로 구성된다. 실험 결과를 통해 제안된 방법은 단일 자세 모델기반의 사람 검출 기술에 비해 향상된 성능을 보이는 것을 확인할 수 있다.
자동차용 8.8 Grade 이하 BOLT의 보론강 적용 연구
김순식(Soonsik Kim),김경수(Kyoungsoo Kim),오상훈(Sanghoon Oh),송태엽(Taeyeop Song) 한국자동차공학회 2005 한국자동차공학회 춘 추계 학술대회 논문집 Vol.2005 No.11_3
If the boron should be added to the low carbon steel, the spheroidizing heat treatment could be dismissed in the raw material processing, which would cost reduction about 15%. Thus, it was deemed necessary to change the raw material for less than 8.8 grade bolts coupled for the vehicles, from the medium carbon steel to a boron added low carbon steel. The test samples were made by quenching and tempering M8 and M10 bolt hexes. As a consequence of comparatively testing the medium carbon steel and the boron steel, it was found that the latter showed higher values of mechanical properties and max. axial force than the fanner. However, the two materials showed almost the same values in fatigue test, torque dispersion, micro-structure, metal flow and salt spray test. The boron steel would be subject to the vehicle test before being mass-production.
적응적 파라미터 추정을 통한 향상된 블록 기반 배경 모델링
김한준(Hanj-Jun Kim),이영현(Young-Hyun Lee),송태엽(Tae-Yup Song),구본화(Bon-Hwa Ku),고한석(Han-Seok Ko) 한국컴퓨터정보학회 2011 韓國컴퓨터情報學會論文誌 Vol.16 No.4
본 논문에서는 모델 히스토그램 개수를 적응적으로 조절하는 블록기반의 배경 모델링 방법을 제안한다. 기존의 블록 기반의 배경 모델링 방법은 각 블록에 대한 모델 히스토그램의 개수를 고정한다. 따라서 조명변화와 움직이는 객체에 대해 오검출이 발생하는 문제가 있고 움직임이 없는 객체에 대해서는 검출이 되지 않는 문제가 있다. 또한 입력영상의 종류마다 달라질 수 있는 최적의 모델 히스토그램의 개수를 수동적으로 찾아야 하는 문제가 있다. 본 논문에서는 실험을 통해 엘리베이터 내에서 조명변화가 있고 객체가 움직이는 상황과 조명변화가 없고 객체가 정지해 있는 상황에 대해 기존의 방법과 성능을 비교하여 제안한 알고리즘의 효용성을 입증한다. In this paper, an improved block-based background modeling technique using adaptive parameter estimation that judiciously adjusts the number of model histograms at each frame sequence is proposed. The conventional block-based background modeling method has a fixed number of background model histograms, resulting to false negatives when the image sequence has either rapid illumination changes or swiftly moving objects, and to false positives with motionless objects. In addition, the number of optimal model histogram that changes each type of input image must have found manually. We demonstrate the proposed method is promising through representative performance evaluations including the background modeling in an elevator environment that may have situations with rapid illumination changes, moving objects, and motionless objects.