《北京大学学报·自然科学版》杂志2018年第02期期刊目录-发表之家

融合词、句层级信息的抽取式摘要优化框架

作者：林心宜; 严睿; 赵东岩刊期：2018年第02期

提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评测的高分,证明了该框架的有效性。
大规模图数据的正则路径查询

作者：张雨; 曾立; 邹磊刊期：2018年第02期

提出一种基于大规模RDF查询引擎gStore的分而治之方法,对查询的正则表达式进行划分。在对定长字符串预处理的基础上,再处理带有通配符的即时路径查询。该方法能够在开始阶段对搜索空间进行大量剪枝,可以提高查询性能,还能很好地解决正则表达式在RDF图中的路径匹配问题,保证了对大规模图数据的支持。在DBpedia和LUBM上的实验表明,该方法能够平均...
基于发音特征的汉语发音偏误自动标注

作者：魏星; 王玮; 陈静萍; 解焱陆; 张劲松刊期：2018年第02期

针对发音偏误检测系统语音标注费时、费力和标注不一致的问题,基于发音特征,构建偏误检测系统,给出Top-N的识别结果,通过praat软件呈现机器初步标注文本,在此基础上进行人工二次标注。实验结果表明,与单纯的人工标注相比,所提出的自动标注加人工二次标注方法在标注一致性上从80.7%提高到92.48%,平均每个句子的标注时间从10分钟减少到3分钟。所提...
基于瓶颈特征的藏语拉萨话连续语音识别研究

作者：周楠; 赵悦; 李要嫱; 徐晓娜; 才旺拉姆; 吴立成刊期：2018年第02期

基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。
基于翻译质量估计的神经网络译文自动后编辑

作者：谭亦鸣; 王明文; 李茂西刊期：2018年第02期

针对译文后编辑中的过度修正问题,提出利用神经网络自动后编辑方法,训练专门用于提供少量复合编辑修正和单一编辑类型修正的神经网络后编辑模型。在此基础上,通过建立一个基于翻译质量估计的译文筛选算法,将提出的模型与常规的神经网络自动后编辑模型进行联合。在WMT16自动后编辑任务测试集上的实验结果表明,与基准系统相比,所提方法显著提高了...
利用URL-Key领域术语识别方法

作者：吕书宁; 董志安刊期：2018年第02期

首次提出利用URL-Key进行领域术语识别的方法。以URL作为媒介,借助已知URL-Key的领域性来判断未知领域候选术语的领域性。首先,借助互联网中已有的人工分类领域URL,根据URL-Key在各领域汇总使用的频度,采用基于方差的领域URL-Key识别方法,构建领域URL-Key词表;然后,利用伪反馈技术,收集候选领域词检索得到的URL结果集,根据URL结果集构建候选领域...
足球赛事战报的自动写作研究

作者：王文超; 吕学强; 张凯; 周建设刊期：2018年第02期

在分析不同类型体育赛事报道特点的基础上,首次提出一种以实时数据作为数据源的足球赛事战报自动写作方法。该方法利用历史战报,对实时数据进行自动标注,得到训练集,使用卷积神经网络(CNN)对标注后的实时数据进行建模,自动识别实时数据中的关键事件,将关键事件中结构化的信息生成战报风格的自然语言。实验表明,与其他方法相比,该方法写作效果更...
基于伪数据的机器翻译质量估计模型的训练

作者：吴焕钦; 张红阳; 李静梅; 朱俊国; 杨沐昀; 李生刊期：2018年第02期

为向基于深度学习的机器翻译质量估计模型提供高效的训练数据,提出面向目标数据集的伪数据构造方法,采用基于伪数据预训练与模型精调相结合的两阶段模型训练方法对模型进行训练,并针对不同伪数据规模设计实验。结果表明,在构造得到的伪数据下,利用两阶段训练方法训练得到的机器翻译质量估计模型给出的得分与人工评分的相关性有显著的提升。
基于LSTM的大规模知识库自动问答

作者：周博通; 孙承杰; 林磊; 刘秉权刊期：2018年第02期

针对大规模知识库问答的特点,构建一个包含3个主要步骤的问答系统:问句中的命名实体识别、问句与属性的映射和答案选择。采用别名词典结合LSTM语言模型进行命名实体识别,使用双向LSTM模型结合两种不同的注意力机制进行属性映射,最后综合前两步的结果进行实体消歧和答案选择。该系统在NLPCC-ICCPOL 2016 KBQA任务提供的数据集上的平均F1值为0.810...
一种基于TLP输入的系统级ESD模型分析方法

作者：王艺泽; 王源; 曹健; 张兴刊期：2018年第02期

基于已有的传输线脉冲发生器(TLP)与IEC 61000-4-2应力的等效关系,提出一种以TLP应力作为输入的系统级模型分析方法。与传统的IEC应力作为系统输入的分析方法相比,该方法解决了对流入待测器件(DUT)残余能量的计算不够精确的问题,同时提高了DUT失效预测方面的精准性。通过SPICE仿真,预测了上述两种应力作为系统输入的DUT失效情况。通过相应的印制...
基于多级放大结构的高速低功耗时间数字转换器设计

作者：范传奇; 贾嵩; 王振宇; 严伟; 吴泽波刊期：2018年第02期

提出一种多级放大时间数字转换器新型结构。该结构由粗测和细测组成,粗测部分利用延时链得到小于一个延时单元的关键余量,并设计了面积小、功耗低的关键余量选择逻辑。细测部分,利用两倍时间放大器和过半判断器从高位到低位依次产生4位二进制码。在SMIC 65 nm工艺下仿真,新型结构的分辨率为1.44 ps,量程为736 ps,转换速度可达470 MS/s,在100 MHz...
一种基于ICA方法的网格化无线电监测方案

作者：张竟枢; 吕梦菲; 李斗; 杨延军; 赵玉萍刊期：2018年第02期

为了解决网格化无线电监测的布局和信号处理问题,提出一种基于独立成分分析(ICA)方法的监测方案,利用ICA方法对监测信号进行处理,达到源信号分离及异常信号源检测的目的。搭建仿真平台对该方案的可行性和有效性进行仿真验证,并对影响监测效果的因素进行分析,结果表明,该方案对源信号分离和异常信号源的检测具有较好的效果。
一种低资源数字抽取滤波器设计

作者：钱泽斌; 严伟刊期：2018年第02期

设计并实现一个应用于音频Sigma-Delta模数转换器的低资源数字抽取滤波器。该滤波器采用多级多采样率结构,整体带内纹波小于0.06 dB,带宽为21.6 kHz,最低工作频率为10 MHz。通过滤波器硬件架构的设计,有效地缩小了抽取滤波器的电路面积和功耗。芯片测试结果表明,对64倍过采样率、4阶Sigma-Delta调制的1 bit脉冲密度调制信号输出码流进行处理,得...
基于分隔符的跨站脚本攻击防御方法

作者：张慧琳; 李冠成; 丁羽; 段镭; 韩心慧; 肖建国刊期：2018年第02期

通过分析跨站脚本攻击的特性,提出一种基于分隔符的跨站脚本攻击防御方法,该方法适用于UTF-8编码的Web应用程序。首先,仅对可信数据中的分隔符进行积极污点标记;然后,利用字符UTF-8编码值的转换轻量级完成污点标记,该污点信息可随着字符串操作直接传播到结果页面;最后,根据结果页面中分隔符的污点信息及页面上下文分析,检查脚本执行节点的合法性...
多尺度空间填充曲线空间连续性研究

作者：翟卫欣; 陈波; 童晓冲; 程承旗刊期：2018年第02期

将二维Hilbert编码和Z编码拓展到以尺度维作为第三维的三维填充曲线:多尺度Hilbert曲线和Z曲线。在多尺度数据条件下,这两种曲线能够提高空间填充曲线的空间连续性,适应多尺度的需求。依托四叉树模型,将多尺度的Hilbert曲线与按照相同思路设计的多尺度Z曲线进行两类对比试验,验证了多尺度Hilbert曲线相对于Z曲线在空间连续性方面的优势,提高的比...

北京烤鸭

北京大学学报·自然科学版杂志北大期刊 CSCD期刊 统计源期刊

Acta Scientiarum Naturalium Universitatis Pekinensis

融合词、句层级信息的抽取式摘要优化框架

大规模图数据的正则路径查询

基于发音特征的汉语发音偏误自动标注

基于瓶颈特征的藏语拉萨话连续语音识别研究

基于翻译质量估计的神经网络译文自动后编辑

利用URL-Key领域术语识别方法

足球赛事战报的自动写作研究

基于伪数据的机器翻译质量估计模型的训练

基于LSTM的大规模知识库自动问答

一种基于TLP输入的系统级ESD模型分析方法

基于多级放大结构的高速低功耗时间数字转换器设计

一种基于ICA方法的网格化无线电监测方案

一种低资源数字抽取滤波器设计

基于分隔符的跨站脚本攻击防御方法

多尺度空间填充曲线空间连续性研究

佳木斯大学学报

齐齐哈尔医学院学报

南方医科大学学报

齐齐哈尔大学学报·哲学社会科学版

护理学报

中国多媒体与网络教学学报·下旬刊

材料科学与工程学报

重庆医科大学学报

黑龙江教育学院学报

长春大学学报

土木工程学报

南方农业学报

北京大学学报·自然科学版杂志 北大期刊 CSCD期刊 统计源期刊

Acta Scientiarum Naturalium Universitatis Pekinensis

融合词、句层级信息的抽取式摘要优化框架

大规模图数据的正则路径查询

基于发音特征的汉语发音偏误自动标注

基于瓶颈特征的藏语拉萨话连续语音识别研究

基于翻译质量估计的神经网络译文自动后编辑

利用URL-Key领域术语识别方法

足球赛事战报的自动写作研究

基于伪数据的机器翻译质量估计模型的训练

基于LSTM的大规模知识库自动问答

一种基于TLP输入的系统级ESD模型分析方法

基于多级放大结构的高速低功耗时间数字转换器设计

一种基于ICA方法的网格化无线电监测方案

一种低资源数字抽取滤波器设计

基于分隔符的跨站脚本攻击防御方法

多尺度空间填充曲线空间连续性研究

佳木斯大学学报

齐齐哈尔医学院学报

南方医科大学学报

齐齐哈尔大学学报·哲学社会科学版

护理学报

中国多媒体与网络教学学报·下旬刊

材料科学与工程学报

重庆医科大学学报

黑龙江教育学院学报

长春大学学报

土木工程学报

南方农业学报

北京大学学报·自然科学版杂志北大期刊 CSCD期刊统计源期刊