http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Particle Swarm 기반 최적화 멤버쉽 함수에 의한 잡음 환경에서의 화자인식 성능향상
민소희,송민규,나승유,김진영,Min, So-Hee,Song, Min-Gyu,Na, Seung-You,Kim, Jin-Young 한국음성학회 2007 음성과학 Vol.14 No.2
The performance of speaker identifier is severely degraded in noisy environments. A study suggested the concept of observation membership for enhancing performances of speaker identifier with noisy speech [1]. The method scaled observation probabilities of input speech by observation identification values decided by SNR. In the paper [1], the authors suggested heuristic parameter values for membership function. In this paper we attempt to apply particle swarm optimization (PSO) for obtaining the optimal parameters for speaker identification in noisy environments. With the speaker identification experiments using the ETRI database we prove that the optimization approach can yield better performance than using only the original membership function.
입술정보를 이용한 음성 특징 파라미터 추정 및 음성인식 성능향상
민소희,김진영,최승호,Min So-Hee,Kim Jin-Young,Choi Seung-Ho 대한음성학회 2002 말소리 Vol.44 No.-
Speech recognition performance is severly degraded under noisy envrionments. One approach to cope with this problem is audio-visual speech recognition. In this paper, we discuss the experiment results of bimodal speech recongition based on enhanced speech feature vectors using lip information. We try various kinds of speech features as like linear predicion coefficient, cepstrum, log area ratio and etc for transforming lip information into speech parameters. The experimental results show that the cepstrum parameter is the best feature in the point of reconition rate. Also, we present the desirable weighting values of audio and visual informations depending on signal-to-noiso ratio.
민소희(So Hee Min),김진영(Jin Young Kim),송민규(Min Gyu Song),나승유(Seung You Na),최승호(Seung Ho Choi) 한국음성학회 2007 음성과학 Vol.14 No.4
The performance of speaker identification is severely degraded in noisy environments. Recently probability weighting method based on observation membership was proposed for overcoming the noise problem[1]. In the paper[1] the observation confidence was calculated from SNR with sigmoid function. However, estimating SNR needs additive calculation amount and estimated SNR is corrupted in dynamic noisy environments. In this paper we propose estimation methods of the observation confidence based on score-based reliabilities (SBR) of entropy and dispersion measures. Generally SBRs are obtained from speaker models' probabilities. The proposed methods are evaluated with ETRI speaker recognition DB. We compared the performances of the proposed methods with those in [1][8]. The experimental results show that the proposed methods can be successfully applied for the case where SNR is not available.
민소희 ( So Hee Min ),송민규 ( Min Gyu Song ) 전남대학교 전자통신기술연구소 2007 전자통신기술논문지 Vol.10 No.1
잡음 환경하에서는 화자식별 성능은 크게 저하된다. 최근 잡음문제를 극복하기 위해 관측신뢰도를 계산하여 가중치로써 확률계산에 반영하기 위한 방법이 제안되었다. 논문[l]의 관측신뢰도는 시그모이드 함수로부터 SNR을 계산하였다. 그러나 SNR을 추정하기 위해서는 부가적 계산량이 필요하며 잡음의 특성이 매우 동적이어서 SNR 추정이 쉽지않다. 본 논문에서는 엔트로피와 이산척도의 스코어 기반 관측신뢰도의 멤버쉽 함수 추정방법을 제안하여 SNR의 정확한 측정이 어려운 환경에 적용하고자 한다. 일반적인 스코어기반 신뢰도 함수는 화자모델들의 계산된 확률분포로부터 얻어진다. 제안된 방법은 ETRI의 화자인식 DB를 가지고 실험하였다. 실험 결과, SNR기반의 관측신뢰도를 이용하는 경우[8]에 비해 성능 저하가 있었지만, 여전히 잡음환경 아래에서 식별 성능을 향상시킬 수 있음을 보였다. 따라서 SNR을 추정하기 어려운 환경에서, 제안한 방법이 유용하게 사용되리라고 판단된다. The performance of speaker identification is severely degraded in noisy environments. Recently probability weighting method based on observation membership was proposed for overcoming the noise problem[l]. In the paper [l] the observation confidence was calculated from SNR with sigmoid function. However, estimating SNR needs additive calculation amount and estimated SNR is corrupted in dynamic noisy environments. In this paper we propose estimation methods of the observation confidence based on score-based reliabilities (SBR) of entropy and dispersion measures. Generally SBRs are obtained from speaker models` probabilities. The proposed methods are evaluated with ETRI speaker recognition DB. We compared the performances of the proposed methods with [l][8]. The experimental results show that the proposed methods can be successfully applied for the case where SNR is not available.
송민규(Min Gyu Song),민소희(So Hee Min),김진영(Jin Young Kim),나승유(Seung You Na) 대한전자공학회 2007 대한전자공학회 학술대회 Vol.2007 No.11
For visual prosody analysis, we need to analyze facial expression and head movement while human produces speech. In this paper, we propose a marker detecting and tracking method using YCbCr coordinate and matching algorithm for above analysis. For the entire experiment, CU-CNU database was used and our propose method showed better performance and thus verified our algorithm.
간호대학생의 자기인식, 공감능력이 의사소통능력에 미치는 영향
김건희(Gun-Hee Kim),한은경(Eun-Kyoung Han),김다현(Da-Hyeon Kim),김수현(Su-Hyun Kim),김지은(Ji-Eun Kim),김현진(Hyun-Jin Kim),김혜인(Hye-Inn Kim),민소희(So-Hee Min),박수경(Soo-Kyung Park),방윤선(Yun-Seon Bahng),오현정(Hyeon-Jeong Oh) 학습자중심교과교육학회 2020 학습자중심교과교육연구 Vol.20 No.7
본 연구는 간호대학생의 자기인식, 공감능력이 의사소통능력에 미치는 영향을 알아보기 위한 서술적 조사 연구이다. 자료 수집은 2019년 4월 25일부터 6월 27일까지 경기도에 소재한 E대학교에 재학 중인 간호대학생 300명을 대상으로 구조화된 설문지를 배부하여 조사하였다. 수집된 자료는 SPSS/WIN 25.0 프로그램을 이용하여 기술통계, Pearson’s correlation, hierarchical multiple regression을 실시하였다. 연구결과 간호대학생의 의사소통능력은 자기인식(r=.51, p<.001), 공감능력(r=.53, p<.001)과 모두 유의한 양의 상관관계가 있었다. 위계적 회귀분석 결과, 가족과의 의사소통 만족도(β=.11, p=.023), 자기인식(β=.35, p<.001), 공감능력(β=.40, p<.001)이 유의한 영향요인으로 확인되었으며, 의사소통능력을 45% 설명하였다. 따라서 간호대학생의 의사소통 능력을 증진시키기 위하여 의사소통 교과목과 임상실습 교육과정을 통해 자기인식과 공감능력을 증진시킬 수 있는 다양한 교수법 및 프로그램 개발이 필요하다. This study is a descriptive study to find out the influence of self-awareness and empathy on the communication ability of nursing students. The data collection was conducted from April 25 to June 27, 2019, distributing structured questionnaires to 300 nursing college students attending E University in Gyeonggi-do. The collected data were conducted using the SPSS/WIN 25.0 program for descriptive statistics, Pearson correlation, and Hierarchical Multiple Regression Analysis. According to the study, the communication ability of nursing college students had a positive correlation with self-awareness(r=.51, p<001) and empathy(r=.53, p<001). As a result of a hierarchical regression analysis, satisfaction to family communication(β=.11, p=.023), self-awareness(β=.35, p<001), and empathy(β=.40, p<.001) were identified as significant influencing factors and 45% explained communication ability. Therefore, in order to enhance the communication ability of nursing college students, it is necessary to develop various teaching methods and programs that can increase self-awareness and empathy through communication courses and clinical practice curriculum.
시각 음성인식을 위한 영상 기반 접근방법에 기반한 강인한 시각 특징 파라미터의 추출 방법
송민규(Song Min Gyu),Thanh Trung Pham,민소희(So Hee Min),김진영(Jing Young Kim),나승유(Seung You Na),황성택(Hwang Sung Taek) 한국지능시스템학회 2010 한국지능시스템학회논문지 Vol.20 No.3
음성 인식 기술의 발전에도 불구하고 잡음 환경하의 음성 인식은 여전히 어려운 분야이다. 이를 해결하기 위한 방안으로 음성 정보 이외에 시각 정보를 이용한 시각 음성인식에 대한 연구가 진행되고 있다. 하지만 시각 정보 또한 음성과 마찬가지로 주위 조명 환경이나 기타, 다른 요인에 따른 영상잡음이 존재하며, 이런 영상잡음은 시각 음성 인식의 성능 저하를 야기한다. 따라서 인식 성능 향상을 위해 시각 특징 파라미터를 어떻게 추출하느냐는 하나의 관심분야이다. 본 논문에서는 HMM기반 시각 음성인식의 인식 성능 향상을 위한 영상 기반 접근방법에 따른 시각 특징 파라미터의 추출 방법에 대하여 논하고 그에 따른 인식성능을 비교하였다. 실험을 위해 105명에 화자에 대한 62단어의 데이터베이스를 구축하고, 이를 이용하여 히스토그램 매칭, 입술 접기, 프레임 간 필터링 기법, 선형마스크, DCT, PCA 등을 적용하여 시각 특징 파라미터를 추출하였다. 실험결과, 제안된 방법에 의해 추출된 특징 파라미터를 인식기에 적용하였을 때의 인식 성능은 기본 파라미터에 비해 약21%의 성능 향상이 됨을 알 수 있다. In spite of development in speech recognition technology, speech recognition under noisy environment is still a difficult task. To solve this problem, Researchers has been proposed different methods where they have been used visual information except audio information for visual speech recognition. However, visual information also has visual noises as well as the noises of audio information, and this visual noises cause degradation in visual speech recognition. Therefore, it is one the field of interest how to extract visual features parameter for enhancing visual speech recognition performance. In this paper, we propose a method for visual feature parameter extraction based on image-base approach for enhancing recognition performance of the HMM based visual speech recognizer. For experiments, we have constructed Audio-visual database which is consisted with 105 speackers and each speaker has uttered 62 words. We have applied histogram matching, lip folding, RASTA filtering, Liner Mask, DCT and PCA. The experimental results show that the recognition performance of our proposed method enhanced at about 21% than the baseline method.