본 연구는 개인마다 음성 변이가 다양하고 명료도가 낮은 마비 말 장애 음성에 대하여 기존에 사람이 수행하던 발화 명료도 평가가 음성 인식 시스템에 의해 대체될 수 있는지를 고찰하는 것을 그 목적으로 한다. 이를 위하여 5 명의 뇌성마비 화자의 각 194 개 단어 음성데이터를 대상으로 화자 독립과 화자 적응 방식에서 각각 음성인식 실험을 하고, 8 명의 청자가 화자 당 50 개 단어를 듣고 철자 전사와 5 점 척도의 명료도 평정 평가를 실시한 다음, 음성 인식률과 사람의 평가 점수를 비교하였다. 실험 결과 화자 적응 방식의 음성 인식률과 전사점수 사이에 매우 큰 양의 상관관계(0.99 이상)가 나타났는데, 이는 화자 적응 방식의 음성 인식률이 마비 말 장애 화자들의 음성을 전사 점수에 의한 명료도와 거의 비슷한 양상으로 구분한다는 것을 보여주어, 음성 인식 시스템에 의한 명료도 자동 구분의 가능성을 시사한다.
Dysarthric speech indicates various phonetic variations for each person and low intelligibility. This paper aims to examine whether speech intelligibility assessment which has been usually done by human can be replaced by a speech recognition system. For this purpose, two experiments with a speaker independent system and a speaker dependent system were performed with 194 words spoken by each person of 5 speakers with cerebral palsy. 8 listeners evaluated 50 utterances of each speaker by transcribing and rating in 5-scale per each word. Finally, the recognition rate of dysarthric speech by the speech recognition system is compared to the rate of human listeners. The results indicate that the speaker-adaptive speech recognition accuracy and human transcription score is highly correlated and suggest that a speech recognition system could be employed for the automatic intelligibility assessment of dysarthric speech.