首页 期刊 华南理工大学学报·社会科学版 基于两步判决的口语中非文字音频事件检测方法 【正文】

基于两步判决的口语中非文字音频事件检测方法

作者:贺前华 李艳雄 李韬 张虹 杨继臣 华南理工大学电子与信息学院 广东广州510640
非文字音频事件   门限判决   统计模型检测   口语语音   语音处理  

摘要:为了有效利用非文字音频事件进行会话语音的语义分析,在分析口语中频繁出现的音频事件特征差异的基础上,提出了一种基于两步判决的口语中非文字音频事件的检测方法.该方法利用音频事件的信号特征构造音频事件信号段,采用门限判决来检测长掌声(第一步判决),而用统计模型来检测其它音频事件(第二步判决).实验结果表明:该方法检测填音、笑声、掌声3种非文字音频事件的平均准确率、召回率和F1度量值分别为87.3%、93.8%和90.4%;与现有文献数据相比,F1度量值平均提高了7.5%,且文中方法能更精确地确定非文字音频事件的边界.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅