《清华大学学报·自然科学版》杂志2016年第11期期刊目录-发表之家

基于自然语言处理的特定属性物体检测

作者：张旭; 王生进刊期：2016年第11期

该文研究如何在图片中定位特定属性物体（如“废弃的车”等）。由于一个物体可能包含几十甚至上百个非互斥的属性,训练特定属性物体检测器的难点是为大量的特定属性物体收集训练图片并标定边界框。该文提出使用特定属性物体分类器扩展物体检测器获取特定属性物体检测器的方法。其中的特定属性物体分类器通过使用从互联网上挖掘的图片以及从物体...
基于深度神经网络和Bottleneck特征的说话人识别系统

作者：田垚; 蔡猛; 何亮; 刘加刊期：2016年第11期

近来,一种结合语音识别中深度神经网络（deep neural network,DNN）模型和说话人识别中身份认证矢量（identity vector,i-vector）模型的方法被证明对说话人识别十分有效。为了进一步提升系统性能,该文提出使用基于说话人标签的DNN模型提取Bottleneck特征代替该模型中的短时频谱特征来计算充分统计量,从而使统计量中包含更多有利于说话人识别的...
“发嗲”的情感语音基频特征分析

作者：孔江平; 林悠然刊期：2016年第11期

发嗲是一种特殊的情感语音。该文从情感类型的角度出发,认为发嗲并非简单的某种情绪或态度,而是一种情感上主动性强的言语模式。该文提取了发嗲在基频上的特征,发现其在基频上最显著的特征是基频提高,这种提高并非整体的同步提升,而是与调类、性别、元音等因素有关,并且伴随着基频曲线形状和基频范围的变化。该文通过语音合成和听辨实验来检验基...
基于GSOM模型的音位范畴习得建模

作者：曹梦雪; 李爱军; 方强刊期：2016年第11期

为了探究神经网络模型在儿童语言习得模拟研究中的应用,该文在可扩展的自组织网络模型（growing selforganizing map,GSOM）算法的基础上,模拟了婴幼儿习得标准德语部分元音和辅音音位范畴的过程。该研究将优化的网络扩展策略和“循环性强化和复习训练”学习算法与传统的GSOM算法进行了结合。模拟结果显示：“循环性强化和复习训练”算法可以有...
藏语语者英语单元音发音可视化矫正

作者：冯卉; 宋瑞; 高晓东; 吴桐雨; 党建武刊期：2016年第11期

藏语语者英语语音学习的现状和需求迫使研究者尽快开发出适合其语音学习的有效工具。该文利用“藏族人说汉语普通话、英语、藏语”声学特征语料库（CETTS）中的相关声学参数,建立直观易懂的舌位图模型辅助藏语语者了解其英语单元音的产出特点。在此舌位模型基础上设计舌位自我纠正软件,并通过为学习者提供实时的语音反馈,辅助其有针对性地改善自...
母语为粤语和英语的普通话学习者的话语基频偏误特征

作者：顾文涛刊期：2016年第11期

语音的自然度在很大程度上取决于韵律特征如声调、句调、轻重音等,而普通话、粤语与英语在这些特征上形成了鲜明对比。该文以普通话为研究对象,采用声学分析比较了普通话母语被试以及母语分别为标准粤语和美式英语的2组普通话二语被试的基频特征。通过一组句类、目标字调、焦点位置受控的语句,考察了每组被试的句调、声调、焦点重音的基频编码方...
一种改善言语清晰度的子带自适应降噪算法

作者：梁维谦; 郑方; 郑佳春; 朴志刚刊期：2016年第11期

助听器对声音进行压缩放大,需要高言语清晰度的降噪算法。该文提出了一种子带自适应噪声抑制方法,通过加权重叠相加滤波器组和基于心理声学模型的子带划分、基于先验和后验信噪比的快变的非线性降噪增益、基于噪声声压级估值的慢变的增益下限阈值、基于峰值跟踪的子带增益平滑及其跟踪和释放时间系数的精细选择等算法,明显提高了言语清晰度。主...
基于特征迁移学习方法的跨库语音情感识别

作者：宋鹏; 郑文明; 赵力刊期：2016年第11期

在实际语音情感识别系统中,训练语音和测试语音往往来自不同的语料库,识别率下降显著。针对这一问题,该文提出一种有效的基于特征迁移学习的跨库语音情感识别方法。引入最大均值差异（maximum mean discrepancy,MMD）来描述不同数据库情感特征分布之间的相似度,并通过最大均值差异嵌入（maximum mean discrepancy embedding,MMDE）算法及特征降...
成年人声道参数与身高的相关性

作者：曹洪林; 孔江平刊期：2016年第11期

为了评估成年人声道与身高的关系,该文采用声反射技术测量了19～30岁之间的109位男性和105位女性的声道形态数据,对声道的长度、体积和比例等8个声道参数与身高之间的相关性进行了研究。研究发现,成年人的声道参数存在显著的性别差异：男性的声道比女性的更长、更大;在咽腔和口腔的比例上,男性的咽腔相对更长、更大。声道与身高之间的关系存在一...
复杂噪声场景下的活动语音检测方法

作者：郭武; 马啸空刊期：2016年第11期

该文提出一种适用于各种复杂噪声场景下的鲁棒性活动语音检测方法。采用能量、主频率分量和短时谱熵3种声学参数形成三维特征,这3种参数在各种各样的噪声中表现出很强的互补性;在活动语音脉冲检测中,采用K均值聚类算法自适应地选择特征并且计算语音检测过程中所用到的阈值。在美国国家标准与技术研究院说话人评测2008和2012年任务上进行实验,结...
焦点重音对普通话音段产出和声学特征的影响

作者：李英浩; 孔江平刊期：2016年第11期

为考察普通话焦点重音对窄焦点域内和域外音段的产出和声学特征的影响,使用动态电子腭位（EPG）获取/t/和/i/的舌腭接触信号,同时采集同步的声门阻抗（EGG）和声学信号。分析结果表明,在窄焦点域内,/t/的舌腭接触面积增大,生理持阻时长增长,持阻段声门状态相对紧张。/i/的舌体上升并前移,元音时长和声强增长或增大,元音频谱发生变化。焦点重音的...
普通话塞擦音的声学特性研究

作者：李善鹏; 顾文涛刊期：2016年第11期

该文考察了普通话6个塞擦音的声学参数与其语音特征之间的关系。通过Praat软件提取时长、振幅、频谱能量分布、后接元音第二共振峰（F2）起始频率等9个声学参数。通过方差分析,揭示了统计上分别区分3个发音部位、2个送气状态以及2个后接元音的声学参数;判别分析结果显示,9个声学参数的组合对6个塞擦音的辨别率为85.9%;主成分分析结果显示,前5个...
块体加固土体大型直剪试验

作者：王腾; 张嘎刊期：2016年第11期

在土中通过灌浆等方式形成大块体是一种有潜力的新加固结构型式。该文进行了多组砾石、铝柱等模拟块体加固土的大型直剪试验。试验结果表明：直剪试验条件下块体发生滑移、翻转等运动,逐渐形成作用链。这显著提高了土的抗剪强度,引起土发生明显的剪胀。随着块体加固比的增大,土的抗剪强度随之增大,其变形特性由应变硬化和体积收缩逐渐发展为应变...
单液滴运动相变模型

作者：赵富龙; 赵陈儒; 薄涵亮刊期：2016年第11期

在对汽水分离装置中液滴运动过程中的相变现象描述和物理机理解释的基础上,结合压力变化条件下静止单液滴相变模型的基础和液滴运动模型,建立了单液滴运动相变模型。该模型给出了液滴运动过程中,由于流动阻力和局部结构改变造成压力降低,打破汽液相平衡而造成液滴的快速蒸发和汽液相平衡蒸发2个阶段的机理解释和数学表述,与已有结果和理论分析结...
基于DNN的发音偏误趋势检测

作者：张劲松; 高迎明; 解焱陆刊期：2016年第11期

正音反馈的计算机辅助对外汉语发音训练系统已有发音偏误趋势的标注体系和基于HMM的偏误趋势检测系统。为了进一步提高系统的性能,该文应用深度神经网络进行声学建模,比较Mel频率倒谱系数（Mel-frequency cepstral coefficient,MFCC）、感知线性预测分析系数（perceptual linear predictive analysis,PLP）和Mel滤波器组系数（Mel filter bank,F...

清华大学自主招生

清华大学学报·自然科学版杂志北大期刊 CSCD期刊 统计源期刊

Journal of Tsinghua University(Science and Technology)

基于自然语言处理的特定属性物体检测

基于深度神经网络和Bottleneck特征的说话人识别系统

“发嗲”的情感语音基频特征分析

基于GSOM模型的音位范畴习得建模

藏语语者英语单元音发音可视化矫正

母语为粤语和英语的普通话学习者的话语基频偏误特征

一种改善言语清晰度的子带自适应降噪算法

基于特征迁移学习方法的跨库语音情感识别

成年人声道参数与身高的相关性

复杂噪声场景下的活动语音检测方法

焦点重音对普通话音段产出和声学特征的影响

普通话塞擦音的声学特性研究

块体加固土体大型直剪试验

单液滴运动相变模型

基于DNN的发音偏误趋势检测

科学技术与工程

江苏农业科学

科技风

材料导报

魅力中国

活力

食品科学

教育科学

科学咨询·教育科研

佳木斯大学学报

价值工程

领导科学

清华大学学报·自然科学版杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Tsinghua University(Science and Technology)

基于自然语言处理的特定属性物体检测

基于深度神经网络和Bottleneck特征的说话人识别系统

“发嗲”的情感语音基频特征分析

基于GSOM模型的音位范畴习得建模

藏语语者英语单元音发音可视化矫正

母语为粤语和英语的普通话学习者的话语基频偏误特征

一种改善言语清晰度的子带自适应降噪算法

基于特征迁移学习方法的跨库语音情感识别

成年人声道参数与身高的相关性

复杂噪声场景下的活动语音检测方法

焦点重音对普通话音段产出和声学特征的影响

普通话塞擦音的声学特性研究

块体加固土体大型直剪试验

单液滴运动相变模型

基于DNN的发音偏误趋势检测

科学技术与工程

江苏农业科学

科技风

材料导报

魅力中国

活力

食品科学

教育科学

科学咨询·教育科研

佳木斯大学学报

价值工程

领导科学

清华大学学报·自然科学版杂志北大期刊 CSCD期刊统计源期刊