http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
마비성 구어장애인들의 마찰음 /s/에 대한 음향학적·청지각적 연구
박희정,신혜정,정옥란,석동일 대구대학교 특수교육재활과학연구소 2006 특수교육재활과학연구 Vol.45 No.1
본 연구의 목적은 마비성 구어장애인들의 마찰음 /s/에 대한 음향학적 그리고 청지각적 특성을 살펴보는데 있다. /s/음에 대한 음향학적 분석을 위해 지속시간, 최고 주파수, 강도를 이용하였으며, 청지각적 분석은 /s/음을 포함한 음절의 명료도와 전체 구어명료도를 분석하였다. 연구 결과는 다음과 같다. 첫째, /s/음의 최고 주파수와 강도는 마비성 구어장애 집단과 정상 통제집단 간의 유의한 차이가 나타났다. 둘째, 마비성 구어장애 집단과 정상 통제집단은 청지각적 분석에서 유의한 차이가 나타났다. 셋째, Pearson 상관분석 결과 음향학적 분석 중 /s/음의 최고 주파수는 청지각적 분석과 강한 부적상관관계가 나타났다. 음향학적 매개변수들은 마찰음소가 포함된 음절을 조음하는데 있어 조음자 조절의 편차가 나타났으며, 설단과 소근육 조절의 결여로 마찰음을 왜곡하는 것으로 나타났다. Impairment of the neuromuscular control of speech can affect several or all aspects of speech production. The purpose of this study was to compare acoustic and perceptual differences of fricative /s/ between the dysarthric subjects and normal subjects. In addition, the subjects' speeches were evaluated in terms of word intelligibility containing /s/ and total speech intelligibility as perceptual parameters. Acoustic parameters were duration, peak frequency, and intensity of /s/. The results showed that the first peak frequency and intensity of /s/ were significantly different between dysarthric subjects and normal subjects. Second, perceptual parameters were significantly different between dysarthric subjects and normal subjects. The Pearson product moment was used to determine the relationship between the acoustical and perceptual data. The results showed that there was a strong correlation between perceptual parameters and peak frequency of /s/.
The Effect of Lee Silverman Voice Treatment (LSVTⓇ) on Parkinsonian Phonation
최성희(Seong Hee Choi) 한국언어청각임상학회 2011 Communication Sciences and Disorders Vol.16 No.3
배경 및 목적: 리실버만 음성치료는 파킨슨씨병 환자의 음성, 말, 삼킴 장애를 개선하는 것으로 알려져 왔으며, 음향학적 분석은 음성 장애의 치료 효과를 측정하는데 사용되어져 왔다. 많은 연구들이 리실버만 음성치료법에 대한 효과성을 보고하였음에도 불구하고, 대부분 리실버만 음성치료법 중재 전후의 단순 비교만을 보고하였다. 무작위 통제 실험연구는 가장 최선의 임상 중재를 위하여 치료의 효과에 대한 증거를 제공하는데, 이러한 통제 실험 연구는 거의 시도되지 않았다. 전통적인 섭동적 분석과 달리, 주기적 신호와 비주기적 음성 신호를 신뢰성 있게 모두 정량화하기 위하여 최근 비선형 역동적 분석법이 사용되고 있다. 본 연구는 증거참조 중재를 위하여 파킨슨씨병 환자의 음성에 대한 1단계 수준의 치료 효과를 조사하고, 비선형 역동적 음향학적 접근법이 파킨슨씨병에서 흔히 관찰되는 비주기적인 음성을 정량화 할 수 있는 지 평가하는 데 목적을 두고 있다. 방법: 특발성파킨슨씨병으로 진단받은 15명의 환자를 통제군(치료 받지 않은 집단, 7명)과 치료 집단(8명)에 무작위로 할당하였다. 한 명의 언어치료사에 의해 실험군의 파킨슨씨병 환자군은 일주일에 4회, 4주 동안 총 16회의 집중적인 리실버만 음성치료를 받았다. 비선형 역동적 분석법이 비주기적인 파킨슨씨병 음성을 분석하기 위해 사용되었다. 연장 모음 /아/를 사용하여 실험군은 치료 전과 치료 4주 후에, 통제군은 치료 없이 4주 후에 비선형 역동적 분석, 전통적 섭동적 음향학적 분석과 청지각적 분석을 실시하였다. 3명의 측정자에 의해 /아/ 연장 모음으로 전반적인 음성장애의 정도를 치료 전ㆍ후에 통제군과 치료군의 음성을 측정하였으며 통계학적으로 분석되었다. 결과: 주기간 주파수 변동률 (p=0.039)와 상관지수(D2, p=0.023)는 음성치료 후 유의미하게 감소하였으나, 주기간 진폭 변동률은 차이가 없었다. 반면, 치로 받지 않은 통제군은 4주 후 모든 음향학적 지수; 주기간 주파수 변동률((p=0.875), 주기간 진폭 변동률 (p=0.250), 상관지수((p=0.078)에 모두 유의미한 차이가 없었다. 게다가 청지각적으로 관찰된 음질은 치료군에서는 음성 치료 후 개선되었으나, 통제군에서는 4주 전후 유의한 차이가 없었다. 논의 및 결론: 리실버만 음성치료후 비주기성이 개선되었으며, 이전에 보고된 음성 치료 결과를 지지하였으며 비선형 역동적 분석 파라미터인 상관지수(D2)는 비주기적인 파킨슨씨병 음성의 특성을 정량화할 수 있었다. 따라서 리실버만 음성치료는 효과적으로 파킨슨씨병 환자의 음성을 개선시킬 수 있음을 증명하였으며, 이는 증거 참조 중재를 위한 의사결정 시 임상가들에게 유용한 정보를 제공할 것으로 보인다. Background & Objectives: Lee Silverman Voice Treatment (LSVTⓇ) has been widely accepted to improve Parkinsonian voice, speech, and swallowing. Acoustic analysis has been used to measure the treatment effectiveness for dysphonia. Unlike traditional perturbation analysis, a nonlinear dynamic approach has been applied to reliably quantify both periodic and aperiodic voice signals. The present study aims to investigate the effectiveness of LSVTⓇ on Parkinsonian voice with acoustic and perceptual analysis for evidence-based practice (EBP) and to evaluate whether nonlinear dynamic methods can be used to quantify the aperiodic phonation which is frequently exhibited in Parkinsonian voice. Methods: Fifteen Idiopathic Parkinson’s Disease (IPD) patients were enrolled and randomly assigned to a control (no treatment) (N=7) or treatment group (N=8). The standard LSVTⓇ program was administered by a speech language pathologist four times a week for four weeks, for a total of 16 sessions with the experimental PD group. Nonlinear dynamic methods with traditional perturbation measures were used to test treatment effects for a clinical quantification of aperiodic Parkinsonian phonation. All acoustic and perceptual parameters with /a/ sustained vowels were obtained before and four weeks after the voice therapy in the experimental group and before and four weeks after no treatment in the control group. Three listeners rated general vocal impairments with sustained /a/ vowel segments from a randomly ordered dataset for the control and experimental group before and four weeks after voice therapy. Results: Results demonstrated that both % jitter (p=0.039) and D2 (p=0.023) were significantly lower following voice therapy, whereas % shimmer values were not. For the PD control group (no treatment group), no significant differences were revealed before versus after four weeks in all acoustic parameters; % jitter (p=0.875), % shimmer (p=0.250), and D₂ (p=0.078). In addition, perceived voice quality was improved following voice therapy for the treated group, while no change was found between before and four weeks after in the control group. Discussion & Conclusions: LSVTⓇ improves aperiodicity and supplements prior treatment outcomes. These findings suggest that the nonlinear measure of correlation dimension (D₂) can be applicable for the characterization of aperiodic Parkinsonian voice, and the treatment effects of LSVTⓇ may provide useful information to clinicians for evidence-based decision making in Parkinsonian voices.
김재옥 한국언어치료학회 2019 言語治療硏究 Vol.28 No.2
Purpose : The purpose of this study was to investigate the effect of semi-occluded vocal tract exercise (SOVTE) using tube or straw phonation on subjective voice (auditoryperceptual and patient’s self) evaluation in patients with functional dysphonia, which was analyzed by Meta-analysis. We also examined if a difference in subjective voice evaluation by subtype of SOVTE according to the number of vibration source exists. Methods : Nine studies published between the years 2000 and 2018 that met the inclusion criteria were selected from 9 databases (RISS, Cochrane, EBSCO, EMBASE, ERIC, ProQuest, PsycINFO, PubMed, Science Direct). These nine studies were divided into 13 subjects by dysphonic type and SOVTE subtype, and their effect sizes and mean effect size were calculated using Hedges’ g. Results : Based on the results of Meta-analysis, auditory-perceptual voice evaluation (G, R, and B scales) were significantly decreased with moderate effect size after SOVTE. In self voice evaluation, the total score of Voice Handicap Index was significantly decreased and voice quality was significantly improved, but the total score of Vocal Tract Discomfort Scale was unchanged. In addition, the SOVTE subtype by the number of vibration source did not impact auditory-perceptual and self voice evaluation. Conclusions : The study revealed that SOVTE using tube or straw phonation is effective in improving voice quality in patients with dysphonia. 목적 : 본 연구는 최근 음성장애 치료에 많이 사용되고 있는 빨대 발성을 이용한 반폐쇄성도훈련(semi-occluded vocal tract exercise, SOVTE)이 음성장애 환자의 청지각적 및 자가 음성평가의주관적 음성평가에 미치는 효과를 종합적으로 살펴보기 위해 체계적 문헌고찰을 통한 메타분석을실시하였다. 또한 SOVTE의 진동원 수에 따른 하위 중재 유형에 따라 청지각적 및 자가 음성평가에미치는 효과 차이가 있는지도 살펴보았다. 방법: 9개의 국내외 데이터베이스(RISS, Cochrane, EBSCO, EMBASE, ERIC, ProQuest, PsycINFO, PubMed, Science Direct)를 통해 2000년부터2018년 사이에 학술지에 게재된 빨대 발성을 이용한 SOVTE의 주관적 음성평가 효과에 관한 국내외문헌들 중에서 선정기준을 적용하여 총 9편의 연구를 선정하였고, 연구대상과 중재방법에 따라13편으로 구분하여 Hedges’ g를 사용한 효과크기를 산출하였다. 결과: 메타분석 결과, SOVTE를음성장애 환자에게 실시하였을 때 청지각적 음성평가인 G, R, B 척도 모두에서 중간 이상의 효과크기를 나타내 SOVTE가 음질을 유의하게 향상시켰음을 알 수 있다. 또한 자가 음성평가에서는음성장애지수(Voice Handicap Index) 점수가 유의하게 감소하였고 음질은 유의하게 향상되었으나음성불편감척도(Vocal Track Discomfort Scale)는 SOVTE 실시 전과 후에 차이가 없었다. SOVTE의진동원 수에 따른 하위 중재 유형(빨대 끝을 물속에 넣거나 공기 중에 노출)에 따른 효과는 청지각적및 자가 음성평가 모두에서 유의한 차이가 없었다. 결론: 본 연구를 통해 빨대 발성을 이용한SOVTE는 음성장애 환자의 음질을 향상시키는데 효과적임을 알 수 있다.
고기능 자폐스펙트럼장애 아동과 일반 아동의 감정 발화 모방 능력 비교: 청지각적 평가 및 음향학적 분석
박지현,심현섭 이화여자대학교 특수교육연구소 2022 특수교육 Vol.21 No.3
Purpose: This study was designed to investigate prosodic characteristics in emotional utterances of children diagnosed with high-functioning autism spectrum disorders (HF-ASD). Method: Ten primary grade children with HF-ASD and 10 children with typical development (TD) aged 7 to 11 years participated in this study. To compare the two groups, auditory-perceptual rating and acoustic analysis of three dimensions [temporal (overall speech rate), intensity (mean intensity, APQ, HNR), and spectral (mean fundamental frequency, SD F0, PPQ)] in emotional utterance tasks (neutral, happiness, anger, sadness) were performed. Results: There were significant differences in auditory-perceptual rating of happiness, anger, and sadness except neutral between the two groups. Also, compared to the TD group in acoustic analysis, children with HF-ASD produced greater mean intensity, SD F0 in happiness, greater SD F0 in anger, and faster overall speech rate in sadness. Conclusion: This study demonstrates that children with HF-ASD have atypical prosodic characteristics in emotional utterances. This finding suggests that the prosodic control ability of HF-ASD should be considered in interventions to enhance their emotional expression skills. 연구목적: 본 연구는 감정 발화 과제에서 고기능 자폐스펙트럼장애 아동(HF-ASD)과 일반 아동이 감정 발화를 산출할 때, 운율적 특성에 집단 간 차이가 있는지 살펴보고자 하였다. 연구방법: 초등학교(만 7-11세) HF-ASD 아동 10명과 일반 아동 10명을 연구대상으로 감정 발화 모방 과제(중립, 기쁨, 화남, 슬픔)를 통해 청지각적 평가와 시간(전체 말속도), 강도(평균 강도, APQ, HNR), 스펙트럴(평균 기본주파수, 기본주파수의 표준편차, PPQ)의 세 개의 차원에서 음향학적 분석을 실시하였다. 연구결과: 청지각적 평가에서 중립을 제외한 기쁨, 화남, 슬픔의 감정에서 유의한 집단 간 차이를 보였다. 또한 음향학적 분석 결과, 기쁨의 평균 강도와 기본주파수의 표준편차, 화남의 기본주파수의 표준편차, 그리고 슬픔의 전체 말속도에서 집단 간 유의한 차이를 보였다. 결론: 본 연구는 HF-ASD 아동이 감정 발화를 적절히 산출하는 데 어려움을 보이며, 이를 위한 운율 산출 능력 증진을 위한 중재가 요구됨을 시사한다.
발화자 목소리의 음성음향학적 특징이 청자의 호감도 평가에 미치는 영향
송혜선,이영미,김예지,이송민,최소라,노신희 한국언어치료학회 2022 言語治療硏究 Vol.31 No.2
Purpose: This study analyzed whether there was a significant difference in the results of auditory-perceptual voice evaluation according to the gender of listeners and what kind of voice factors caused listeners to identify a specific voice as attractive. Methods: A total of 32 voices (16 male and 16 female speakers in their 20s) were selected from the public voice corpus provided by the National Institute of Korean Language. The acoustic factors of each voice were analyzed using Praat. Twenty listeners (10 male and 10 female) were asked to evaluate the attractiveness of each voice in eight auditory perceptions. The speakers were median-split into two groups (speakers with higher voice attractiveness vs. speakers with lower voice attractiveness) based on the voice attractiveness scores. Results: As a result of the auditory-perception analysis, female listeners tended to give higher attractiveness scores than male listeners, and gave higher ‘softness’ scores regardless of gender. In addition, the acoustic analysis showed that the group with high attractiveness scores among male speakers had longer speech length, higher pitch standard deviation, and higher intensity standard deviation than the group with low attractiveness scores. The group with higher scores among female speakers had higher intensity standard deviation than the other group with lower scores. Conclusions: Female and male listeners have different methods of evaluating voice attractiveness and different criteria according to the speaker’s gender. In addition, the acoustic characteristics that increase attractiveness differ according to the gender of the speaker. This study is meaningful in that it suggested a way to improve voice attractiveness in terms of the subjective and objective aspects of voice. 목적: 본 연구에서는 청자의 성별에 따라 청지각적 음성 평가 결과에 유의한 차이가 있는지와, 어떠한 음성학적 요인이 청자로 하여금 특정 목소리를 호감이 가는 목소리로 인식하게 하는지를 분석하였다. 방법: 20대 남, 녀 화자 각 16명씩 총 32명의 음성을 국립국어원에서 제공한 공개 음성 코퍼스에서 선택한 후, Praat을 통해 각 음성의 음향학적 요인을 분석하였다. 그리고 20명의 20대 청자(남 10명, 여 10명)에게 각 음성의 호감도를 8개 청지각적 측면에서 평가하게 하였다. 전체 화자는 중앙치 반분법(median-split)에 따라 더 높은 호감도 점수를 받은 집단과 더 낮은 호감도 점수를 받은 집단으로 분리되었다. 결과: 청지각적 분석 결과, 여성 청자는 남성 청자에 비해 음성 호감도를 높게 평정하는 경향이 있었으며, 성별과 무관하게 '부드러움' 점수를 높게 주었다. 또한 음향학적 분석 결과, 남성 화자 중 호감도 점수가 높은 집단은 호감도 점수가 낮은 집단에 비해 발화길이가 더 길고, 음도표준편차와 강도표준편차가 더 높았다. 여성 화자 중 호감도 점수가 높은 집단은 호감도 점수가 낮은 집단에 비해 강도표준편차가 더 높았다. 결론: 여성 청자와 남성 청자는 목소리의 호감도를 평가하는 방법이 다르며, 화자의 성별에 따라서도 서로 다른 기준을 갖는다. 또한 호감도를 높이는 음향학적 특징은 화자의 성별에 따라 다르다. 본 연구는 주관적, 객관적 측면에서 음성 호감도를 증진시킬 수 있는 방안을 제시하였다는 의의가 있다.
음성장애의 성대접촉 양상에 따른 모음연장발성과 연속발화의 음향학적 및 청지각적 평가 비교
이은정(Eun-Jung Lee),김재옥(Jaeock Kim) 한국언어청각임상학회 2020 Communication Sciences and Disorders Vol.25 No.3
배경 및 목적: 본 연구는 음성장애를 발성 시 성대접촉 양상과 후두 긴장 여부에 따라 과다기능성 음성장애(Hyper) 집단과 과소기능성 음성장애(Hypo) 집단으로 분류한 후, 두 집단의 모음연장발성과 연속발화의 음향학적 및 청지각적 평가 차이를 비교하였다. 방법: Hyper 집단 46명과 Hypo 집단 46명이 포함되었다. 모음연장발성 /a/와 연속발화(“가을” 문단 읽기)를 통해 음성자료를 수집하였고, 수집된 자료는 음향학적 평가를 위해 캡스트럼 분석(CPP, mean CPP F0, L/H ratio)과 청지각적 평가를 위해 GRBAS 척도로 분석되었다. 결과: 음향학적 평가에서는 CPP가 연속발화보다 모음연장발성에서 높았으며, mean CPP F0는 연속발화에서 더 높았다. 또한 Hyper 집단에서 CPP가 높은 반면, mean CPP F0는 Hypo 집단에서 높게 나타났다. 청지각적 평가에서 두 집단은 B척도와 A척도로 구분되었으나, R과 S척도에서는 차이가 없었다. 두 집단 모두 GRBAS 척도는 모음연장발성과 연속발화에서 CPP와 L/H ratio와 유의한 부적 상관관계를 나타냈다. 논의 및 결론: 본 연구는 모음연장발성과 연속발화를 함께 적용하여 음향학적 및 청지각적 음성평가를 실시할 때 성대접촉 양상에 따른 음성장애 유형을 파악하고 성대폐쇄부전의 과다기능적 보상전략을 감별하는 데 도움이 될 수 있음을 알 수 있다. Objectives: This study classified voice disorders into hyper-functional (Hyper) and hypo-functional voice disorder (Hypo) by glottal closure pattern and compared acoustic and auditory-perceptual evaluation in sustained vowel and connected speech. Methods: The participants consisted of 46 patients in the Hyper group and 46 patients in the Hypo group. Data were collected through sustained vowel /a/ and connected speech (reading the “Autumn” paragraph) and were analyzed with cepstral analysis (CPP, mean CPP F0, and L/H ratio) for acoustic evaluation, and GRBAS scales for auditory-perceptual evaluation. Results: In the acoustic evaluation, CPP was higher in the sustained vowel than in connected speech, however the mean CPP F0 was the opposite. CPP was higher in the Hyper group than the Hypo group and the mean CPP F0 was higher in the Hypo group. In the auditory-perceptual evaluation, the two groups were distinguishable on the B and A scale, but were not different on the R and S scale. In addition, in both groups, the GRBAS scale was significantly negative correlated with CPP and L/H ratio in both sustained vowel and connected speech. Conclusion: This study revealed that it was possible to identify voice disorders through acoustic and auditory-perceptual evaluation using a combination of sustained vowel and connected speech. These evaluation methods are helpful to discriminate compensatory strategies for glottal incompetency in hypofunctional voice disorder.
조성미(Sung-Mi Jo),정옥란(Ok-Ran Jeong) 한국언어치료학회 2006 言語治療硏究 Vol.15 No.1
Voice seems to be one of the most influential factors in the personal communication. However, there have been few attempts to analyze and judge voice quality objectively. The purpose of this study was to determine characteristics of sexy voice perceptually.The voice samples from one male and one female actor were collected and their pitch, amplitude, nasalance were modified for a perceptual measurement. One-hundred-fifty-seven adults with normal hearing participated in the listening experiment and judged the degree of sexiness on a 7-point scale.The results showed that perceptual analyses on pitch, huskiness, and nasality had significant differences as a function of listeners gender and age. the perceptual parameters of sexy voice matched acoustic aspects of a previous study: Low pitch-low fundamental frequency and husky voice-high shimmer. On the other hand, the nasalance score did not match that of the previous study: Decreased nasalance had a higher score on sexiness scale judged by the listeners.It would be desirable to study the voice quality by analyzing and controling more acoustic and auditory parameters for practical applications in the future.
한국인 화자에서 새로운 버전의 Acoustic Voice Quality Index 적용
김근효(Geun-Hyo Kim),이연우(Yeon-Yoo Lee),배인호(In-Ho Bae),박희준(Hee-June Park),권순복(Soon-Bok Kwon) 한국언어청각임상학회 2018 Communication Sciences and Disorders Vol.23 No.4
배경 및 목적: 본 연구에서는 한국인 화자에서 정상음성과 병리적 음성을 정량화하는 Acoustic Voice Quality Index (AVQI)의 새로운 회귀식을 제시하여 기존의 회귀식(AVQIv2, AVQIv3)과 비교하고자 하였다. 또한 AVQI 측정치와 청지각적 평가 간의 상관관계도 알아 보고, 정상과 병리적 음성을 감별할 수 있는 최적의 절사값 및 진단 예측력도 알아보았다. 방법: 한국인 화자 2,369명으로부터 모음연장 발성 /아/ 5초와 표준문단 ‘산책’ 읽기를 통해서 녹음하였다. 모음의 안정구간 2초와 읽기샘플 25음절을 연결하여 Praat 스크립트를 적용하여 유성음 분절을 추출하고 AVQI를 측정하였다. 또한 음성장애의 중증도를 평가하기 위해서, 5명의 언어재활사가 두 가지 청지각적 평가(GRBAS의 Grade척도, CAPE-V의 overall severity 척도)를 사용하였다. 결과: 전체 AVQI 측정치는 AVQIv2, AVQIv4-K, AVQIv3 순으로 높았으며, AVQIv3는 나머지 AVQI 측정치들에 비해서 유의미하게 낮았다. 각 버전 모두 정상과 병리적 음성 집단 간에 유의 미한 차이를 보였다. AVQI와 청지각적 평가 간에는 .82 이상의 높은 상관관계를 보였고, AVQIv4-K와 상관관계가 가장 높았다. ROC 분석을 통해서 모든 AVQI는 모두 .94 이상의 AUC, 9.5 이상의 LR(+), .2 이하의 LR(-)를 나타내었다. 논의 및 결론: AVQIv4-K는 기존 AVQI 버전에 상응하는 높은 수준의 진단적 성능을 가지는 것으로 여겨진다. Objectives: The purpose of the present study was to compute the new version of Acoustic Voice Quality Index (AVQI) and compare with existing AVQI versions. Additionally, we also investigated the correlation between AVQI measurements and auditory-perceptual ratings, and confirmed the optimal cutoff value and diagnostic predictive power to distinguish between normal and pathological voice. Methods: Voice samples of 2,369 native Korean subjects with normal voices (N= 143) and with dysphonia (N= 2,226) were recorded through both 5 seconds of sustained vowel /a/ and connected speech (Korean text “Walk”). We used the Praat script to extract the voiced segments and measure the AVQI. Additionally, two auditory-perceptual ratings (grade in GRBAS and overall severity in CAPE-V) were used by five speech language pathologists to assess the voice disorder severity. Results: Overall AVQI measurements were higher in order of AVQIv2, AVQIv4-K and AVQIv3; and AVQIv3 was significantly lower than other AVQI measures. In each version, there was a significant difference between normal and pathological voice groups. The correlation between AVQI and auditory evaluation was above .82, and the correlation with AVQIv4-K was the highest. All versions of the AVQI showed an above .94 for AUC, above 9.5 for LR(+), and below .2 for LR(–). Conclusion: AVQIv4-K is considered to have a high level of diagnostic power comparable to the existing AVQI versions.
다차원적 음성 프로파일 분석을 통한 20-30대 한국 여성의 합성음성과 실제음성의 특성 비교
권순하(Soonha Kwon),전예솔(Yesol Jeon),유성아(Sung Ah Yoo),오유림(Yoorim Oh),이영미(Youngmee Lee) 한국언어치료학회 2022 言語治療硏究 Vol.31 No.4
Purpose : This study aimed to examine the difference between a female synthesized voice and a real voice based on multi-dimensional analysis. Methods : Sixteen female adults aged between 23 and 35 years old participated in this study. They read three sentences with their speech being recorded. In addition, 16 young female voices were synthesized using the voice synthesis program Naver Clova Dubbing and Typecast. The data for all 32 voices were measured in terms of 4 dimensions: speech rate, prosody, articulation, and auditory-perceptual evaluation. Results : First, the portion of synthesized voice pause was significantly longer than that of the real voice. Second, there were no significant differences between synthesized and real voice pitches. Third, the vowel duration in the CVC contexts was significantly longer than that of the real voice, and the vowel space area of the synthesized voice was significantly larger than that of the real voice. Finally, listeners perceived the real voice as being softer than the synthesized voice. They also perceived the synthesized voice as being faster and clearer than the real voice. Conclusions : The current study found that female synthesized voices are different from female real voices in terms of speech rate, articulation, and auditory perception. Compared to the human voice, the synthesized voice represented a young female voice with a faster speech rate and clearer articulation. Through experimental evaluations, we have confirmed that TTS (text-to-speech) techniques successfully synthesize a real voice.
급성 COVID-19 감염의 음성 변화 추적 관찰 1예
이승진 대한후두음성언어의학회 2022 대한후두음성언어의학회지 Vol.33 No.3
Dysphonia is well known as one of the otolaryngological symptoms of coronavirus disease 2019 (COVID-19) infection. The vocal changes of the COVID-19 condition have been reported in terms of parameters of multi-dimensional voice assessment, including acoustic analysis, auditory-perceptual evaluation, and psychometric assessment. However, there has not been a daily followup study in patients with acute COVID-19 infection. In this study, a 41-year-old male performed daily voice recordings of vowel phonation and passage-reading tasks during the self-quarantine period of one week. Compared to the normal voice status of the prepandemic period, voice abnormalities peaked on day two after the diagnosis of COVID-19 infection and recovered after one week.