강인한 음성인식을 위한 켑스트럼 거리와 로그 에너지 기반 묵음 특징 정규화

Title
강인한 음성인식을 위한 켑스트럼 거리와 로그 에너지 기반 묵음 특징 정규화
Other Titles
Cepstral Distance and Log-Energy Based Silence Feature Normalization for Robust Speech Recognition
Author(s)
정현열신광호[신광호]
Keywords
Speech recognition; Feature enhancement; Silence feature normalization; Cepstral distance; 음성 인식; 특징 향상; 묵음 특징 정규화; 켑스트럼 거리
Issue Date
201005
Publisher
한국음향학회
Citation
한국음향학회지, v.29, no.4, pp.278 - 285
Abstract
훈련환경과인식환경의차이가음성인식성능저하의주요요인이다.이러한환경의불일치를줄이기위한방법으로다양한묵음특징정규화방법이제안되고있다.기존의묵음특징정규화방법은낮은SNR (Signal-to-Noise Ratio)에서묵음구간의에너지레벨이증가하여음성/묵음분류의정확도가떨어짐으로인해인식성능이저하되는문제점이있었다.본논문에서는로그에너지와음성/묵음(또는잡음)의켑스트럼특징의분포특성의차이를나타내는켑스트럼유클리디언(Euclidean)거리를결합하여음성/묵음을분류하는묵음특징정규화방법(Cepstral distance and Log-energy based Silence Feature Normalization)을제안하였다. 제안한방법은높은SNR에서는로그에너지특징이잡음의영향을적게받는특성을반영하여 기존의 묵음 특징 정규화 (Silence Feature Normalization)방법의 우수성을 그대로 유지하는 반면, 낮은 SNR에서는로그에너지대신음성/묵음분류의분별력이우수한켑스트럼거리정보를이용함으로써인식성능을향상시킬수있다. 인식실험결과 기존의 SFN-I/II, CSFN 방법에 비해 전반적으로 향상된 인식성능을 얻을 수 있어 그 유효성을 확인할 수있었다.
URI
http://hdl.handle.net/YU.REPOSITORY/22432
ISSN
1225-4428
Appears in Collections:
공과대학 > 모바일정보통신공학과 > Articles
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE