作者:解琳; 范海涛 期刊:《中国女性》 2010年第02期
"一个世界有你,一个世界没有你。让两者的不同最大,就是你一生的意义。"曾经,他用"世界因我不同"激励自己追寻梦想;现在,他用"世界因你不同"激励别人发掘潜能。
作者:付跃文; 杜利民 期刊:《中文信息学报》 2005年第06期
本文在采用堆栈译码词网重估输出作为识别最终输出的连续语音识别实时解码条件下,利用决策树方法将多个预测子融合,对识别输出词进行正确和错误的判别.本文首先构造了词后验概率、词长、相邻词的后验概率、词的声学和语言得分等共13个预测子,然后利用决策树方法,通过选择不同的预测子组合方式和适当的决策树建树参数,筛选出预测子的最佳组合,建立优化的决策树进行输出词的正误判别.实验结果表明:利用局域词图计算的词后验概率与词...
作者:蒋冬梅; 谢磊; Ilse; Ravyse; 赵荣椿; Hichem; Sahli; Jan; Cornelis 期刊:《电子与信息学报》 2004年第03期
为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统.它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列.建模采用triseme的概念来考虑viseme的上下文相关性,但它需要超大量的训练数据.该文根据viseme图像及其相似度权值(VSW)定义视觉问题集,用来建立triseme决策树,以实现triseme的状态捆绑及HMM参数共享.为比较系统性能,基于phoneme(听觉领域的语音基本单位)的语音...
作者:戴海生; 朱小燕; 罗予频; 杨士元 期刊:《电子技术应用》 2005年第09期
家电语音控制系统在复杂的背景环境下,由于识别率显著下降而导致关键词检出率偏低.介绍了利用孤立词、连接词以及连续语音识别引擎构造的多识别引擎的识别器,该识别器允许用户自由选择语音输入方式,扩大了关键词的检出范围,从而达到提高关键词检出率的目的.同时给出了家电语音控制系统的整体结构,分析了影响系统性能的关键因素,并且给出了相应的解决方案.
作者:秦楚雄; 张连海 期刊:《数据采集与处理》 2017年第05期
作为一种基于深层神经网络提取的低维特征,瓶颈特征在连续语音识别中取得了很大的成功。然而训练瓶颈结构的深层神经网络时,瓶颈层的存在会降低网络输出层的帧准确率,进而反过来影响该特征的性能。针对这一问题,本文基于非负矩阵分解算法,提出一种利用不包含瓶颈层的深层神经网络提取低维特征的方法。该方法利用半非负矩阵分解和凸非负矩阵分解算法对隐含层权值矩阵分解得到基矩阵,将其作为新的特征层权值矩阵,然后在该层不设置偏...
新生报到季,某校刚刚入学的新同学没有像以往一样领到厚厚的一本新生指南,取而代之的是一个叫“新生助手”的小盒子或者手机“小马甲”。在这个陌生的环境下,这个“新生助手”就成为了同学们融入校园生活最可靠的伙伴了。
作者:王守觉; 沈孙园; 曹文明 期刊:《哈尔滨工程大学学报》 2006年第B07期
提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小和数目来判断有多少关键词.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.
作者:茅力群 期刊:《科技与创新》 2006年第01Z期
本文主要研究利用改进的HMM模型从非特定人的连续语音中识别出声母、韵母,以及每个音的持续时间.提出了这些语音信息与嘴巴的扩张程度、嘴型和持续时间等口型信息的关系,以便把它们传送给步进电机,以驱动实物模型。
作者:孙健; 王作英 期刊:《计算机工程与设计》 2007年第08期
为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。为了在中、英文连续语音识别系统中能够尽早的对语音所属的语言种类做出判决以便进行识别,从而降低解码的计算量,对语种辨识过程中的语种剪枝进行了研究,表明采用合理的语种剪枝门限在不...
作者:倪曼蒂; 李彪; 邹丽萍; 张楚才 期刊:《湖南师范大学自然科学学报》 2014年第03期
为了解决连续语音识别在自然环境中噪声估计高误差、去除噪声和语言失真不能良好平衡、导致关键词识别率低下的问题,提出了一种全新的自动语音识别系统(ASR).本系统将双通道含噪语音信号通过空间增强模块进行噪声提取,通过均衡考虑语音信号和参考噪声输入谱减法模块进行去噪与语音失真的噪声去除和信号放大,最后进入基于隐马尔科夫模型(HMM)的自适应语音信号识别模块进行识别处理.实验显示,本系统可有效减少运算负载、提高关键...
作者:达瓦·伊德木草 木合亚提·尼亚孜别克 吾守尔·斯拉木 期刊:《新疆大学学报·哲学人文社会科学版》 2014年第01期
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度...
作者:朱立忠 华宇宁 范长青 期刊:《沈阳理工大学学报》 2009年第04期
在虚拟仪器开发软件LABVIEW平台上,利用LABVIEW和MATLAB混合编程,通过声卡获得原始语音信号,经过小波消噪处理、预加重处理和端点检测处理得到干净的语音信号,提取语音信号的美尔频率倒谱系数及其一阶、二阶差分系数作为语音识别的特征参数,通过矢量量化(VQ)与隐马尔可夫模型(HMM)实现非特定人连续语音的训练与识别,构建了基于LabVIEW平台的连续语音识别系统.实验表明,系统的识别速度较快,识别率达到90%左右,而且成...
作者:袁里驰 期刊:《中南大学学报·社会科学版》 2012年第02期
为了克服古典隐藏的 Markov 的缺点,当模特儿(唔) , Markov 家庭模型(MFM ) ,一个新统计模型被建议。Markov 家庭模型被用于语音识别和自然语言处理。标注实验的独立地连续的语音识别实验和词类给那个 Markov 家庭模特儿看的说话者比隐藏的 Markov 模型有高效。精确在标注实验的词类从 94.642% ~ 96.214% 被提高,并且工作率被 11.9% 在语音识别实验减少关于唔基线系统。
作者:王霅煜 涂惠燕 期刊:《计算机应用与软件》 2011年第04期
为了在远程教育环境中满足多媒体课件的关键词检索需求,描述了一种基于矢量量化(VQ)及连续语音识别(CSR)的关键词检索系统的设计与实现。该系统首先利用矢量量化算法对声学特征空间进行聚类并生成码本;接着利用该码本对语音文件逐帧进行处理并保存若干与该帧特征最相似的码表向量所对应的码值做成特征矩阵;然后利用改进的快速符号查找算法从特征矩阵中找出若干候选结果段;使用经简化的连续语音识别算法对候选段进行验证筛选,从...
作者:陶梅 吾守尔·斯拉木 那斯尔江·吐尔逊 期刊:《中文信息学报》 2008年第05期
维吾尔语属于阿勒泰语系突厥语族,是黏着性语言。本文根据维吾尔语的特点,分析设计了维吾尔语语音识别系统的总体结构,讨论了维吾尔语最佳识别基元的选择方法,提出建立基于决策树聚类的上下文相关模型,并采用混合高斯分布(GMD)拟合现测概率分布,优化维吾尔语连续语音中HMM模型系统以提高识别性能。最后给出实验对比,得出结论,为今后维吾尔语连续语音识别研究提供依据。
作者:冷冰涛 梁维谦 董保帅 原道德 期刊:《电声技术》 2011年第11期
基于线性网络的孤立词识别系统识别时间与词表规模成正比,识别性能严重受限于词表的规模。根据汉语孤立词特点,提出了一种基于连续识别的大词表孤立词识别系统。该系统围绕嵌入式识别所关注的速度和内存消耗性能,采用先实现应用多级搜索、定点化策略的连续识别,再对连续识别的识别结果进行音字转换处理的方法,将连续语音识别应用于大词表孤立词识别任务。在10000词表规模下该系统与采用线性网络的基线系统相比,识别率基本保...
作者:孙德民 何鹏举 期刊:《今日电子》 2010年第10期
语音识别是近年来十分活跃的一个研究领域,被广泛应用于工业控制、智能家居、医疗、高端家电等多个领域。根据识别的对象不同,语音识别可分为孤立词识别、关键词识别和连续语音识别。目前用于语音识别的方法有基于动态时间规整(DTW)技术的模板匹配法、基于概率统计的HMM法和基于人工神经网络的最优搜索法。
作者:欧建林 林茜 史晓东 期刊:《计算机工程与应用》 2009年第32期
研究了潜在语义分析(LSA)理论及其在连续语音识别中应用的相关技术,在此基础上利用WSJ0文本语料库上构建L5A模型,并将其与3-gram模型进行插值组合,构建了包含语义信息的统计语言模型;同时为了进一步优化混合模型的性能,提出了基于密度函数初始化质心的k-means聚类算法对LSA模型的向量空间进行聚类。WSJ0语料库上的连续语音识别实验结果表明:LSA+3-gram混合模型能够使识别的词错误率相比较于标准的3-gram下降13.3%。
作者:王艳 冯宏伟 张利平 忽满利 期刊:《计算机工程与应用》 2011年第14期
在基于声韵母的汉语连续语音识别中,声韵母基元的准确分割是非常重要的一步。当前的声韵母分割方法在非连续语音中分割准确度较高,但在连续语音中准确度大幅度降低。利用熵与汉语元音的共振峰能量设计了一种新的分割方法,并引入重叠分割策略,完整地分割出汉语连续语音中的声韵母基元。实验结果表明,这种分割方法在低信噪比下也有很高的分割正确率
作者:涂俊辉 续晋华 期刊:《现代计算机》 2009年第11期
介绍一个连续语音识别系统的构成以及HTK工具的使用.然后尝试利用该工具搭建一个连续语音识别系统,使用该系统在一个非特定人的大词汇量连续语音数据库——TIMIT上进行实验,讨论如何选择不同的声学单元进行建模.并且对模型的参数进行一系列的改进。