【免费】基于Viseme的连续语音识别系统及Talking Head-发表之家

基于Viseme的连续语音识别系统及Talking Head

作者：蒋冬梅; 谢磊; Ilse; Ravyse; 赵荣椿; Hichem; Sahli; Jan; Cornelis 西北工业大学计算机科学与工程系; 西安; 710072; Dept; ETRO; Free; University; Brussels; Pleinlaan; 2; B-1050; Brussels; Belgium

说话人头部动画 viseme 连续语音识别 triseme决策树图像相似度加权

摘要：为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统.它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列.建模采用triseme的概念来考虑viseme的上下文相关性,但它需要超大量的训练数据.该文根据viseme图像及其相似度权值(VSW)定义视觉问题集,用来建立triseme决策树,以实现triseme的状态捆绑及HMM参数共享.为比较系统性能,基于phoneme(听觉领域的语音基本单位)的语音识别结果也被映射为viseme序列.在评价准则上,定义viseme图像相似度加权识别精度,更全面地考虑输出和参考图像序列的差别,并用嘴形圆度和VSW曲线中的突变点来评估所得viseme序列的平滑性.结果表明,基于viseme的语音识别系统能给出更平滑和合理的嘴形图像序列.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

国际学生教育管理研究科技与经济统计与经济计算机教育计算机与信息技术数值计算与计算机应用计算机工程与设计计算机技术与发展计算机辅助设计与制造电气技术与经济交通与计算机机械科学与技术

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

电子与信息学报

影响因子：1.36

期刊级别：北大期刊

发行周期：月刊

服务介绍

基于Viseme的连续语音识别系统及Talking Head

电子与信息学报

期刊咨询

订阅杂志

期刊推荐