北京大学学报·自然科学版

北京大学学报·自然科学版杂志 北大期刊 CSCD期刊 统计源期刊

Acta Scientiarum Naturalium Universitatis Pekinensis

杂志简介:《北京大学学报·自然科学版》杂志经新闻出版总署批准,自1955年创刊,国内刊号为11-2442/N,是一本综合性较强的科技期刊。该刊是一份双月刊,致力于发表科技领域的高质量原创研究成果、综述及快报。主要栏目:研究论文、研究简报

主管单位:中华人民共和国教育部
主办单位:北京大学
国际刊号:0479-8023
国内刊号:11-2442/N
全年订价:¥ 480.00
创刊时间:1955
所属类别:科技类
发行周期:双月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.4
复合影响因子:1.02
总发文量:1685
总被引量:22058
H指数:56
引用半衰期:4.9732
立即指数:0.0422
期刊他引率:0.9661
平均引文率:14.506
  • 基于融合条目词嵌入和注意力机制的自动ICD编码

    作者:张虹科; 付振新; 任前平; 徐辉; 赵东岩; 严睿 刊期:2020年第01期

    构建一种基于融合条目词嵌入和注意力机制的深度学习模型,可以充分利用电子病案中的多种非结构化文本数据,对病案首页的主要诊断进行自动ICD编码。该模型首先对含有病案条目的文本进行融合条目的词嵌入,并通过关键词注意力来丰富词级别的类别表示;然后利用词语注意力来突出重点词语的作用,增强文本表示;最后通过全连接神经网络分类器进行分类,输...

  • 基于主题约束的篇章级文本生成方法

    作者:黄炎; 孙海丽; 徐科; 余晓阳; 王同洋; 张新访; 路松峰 刊期:2020年第01期

    针对计算机自动生成的文本缺乏主题思想这一问题,提出一种基于主题约束的篇章级文本自动生成方法。该方法围绕用户输入的主题描述语句提取若干主题词;然后对主题词进行扩展和主题聚类,形成文章主题规划;最后利用每个聚类中的关键词信息约束每个段落的文本生成。该模型从文本主题分布、注意力评分方法和主题覆盖生成3个方面对现有基于注意力机制...

  • 一种融入背景知识的交互文本立场分析方法

    作者:刘常健; 杜嘉晨; 冷佳; 陈荻; 毛瑞彬; 张俊; 徐睿峰 刊期:2020年第01期

    提出一种融入背景知识的交互文本立场分析方法。该方法以交互文本作为查询,从维基百科中检索相关的背景知识文本,然后对背景知识文本进行编码,并通过深度记忆网络获取相关的背景知识特征,以此来增强交互文本的表示学习。在3个英文在线辩论数据集上的实验结果表明,通过选取适当的背景知识嵌入层数以及背景知识嵌入层连接方式,可以有效地提高交互...

  • 汉语篇章小句关联结构的表示与识别

    作者:冯文贺; 陈伊琳; 任亚峰; 任函 刊期:2020年第01期

    将篇章结构表示为小句关联结构,与修辞结构等层次化篇章结构模式相比,可以有效地刻画非连续和跨层级的小句之间的直接语义关联。首先,提出篇章小句关联结构的形式表示、判断准则和形式限制,并进行人工标注。然后,对汉语篇章小句关联结构进行自动识别。在自建汉语篇章小句关联结构语料库上,基于分类模型,设计连接词和词汇等分类特征,得到的最佳识...

  • 面向维汉神经机器翻译的双向重排序模型分析

    作者:张新路; 李晓; 杨雅婷; 王磊; 董瑞 刊期:2020年第01期

    在维吾尔语到汉语等低资源语料库上,神经机器翻译的拟合训练容易陷入局部最优解,导致单一模型的翻译结果可能不是全局最优解。针对此问题,通过集成策略,有效整合多个模型预测的概率分布,将多个翻译模型作为一个整体;同时采用基于交叉熵的重排序方法,将具有相反解码方向的翻译模型相结合,最终选出综合得分最高的候选翻译作为输出。在CWMT2015维汉...

  • 融合门控机制的远程监督关系抽取方法

    作者:李兴亚; 陈钰枫; 徐金安; 张玉洁 刊期:2020年第01期

    提出一种融合门控机制的远程监督关系抽取方法。首先在词级别上自动选择正相关特征,过滤与关系标签无关的词级别噪声;然后在门控机制内引入软标签的思想,弱化硬标签对噪声过滤的影响;最后结合句子级别的噪声过滤,提升模型的整体性能。在公开数据集上的实验结果表明,相对于句子级别噪声过滤方法,所提方法的性能有显著提高。

  • 基于句法结构的神经网络复述识别模型

    作者:刘明童; 张玉洁; 徐金安; 陈钰枫 刊期:2020年第01期

    为解决已有复述语义计算方法未考虑句法结构的问题,提出基于句法结构的神经网络复述识别模型,设计基于树结构的神经网络模型进行语义组合计算,使得语义表示从词语级扩展到短语级。进一步地,提出基于短语级语义表示的句法树对齐机制,利用跨句子注意力机制提取特征。最后,设计自注意力机制来增强语义表示,从而捕获全局上下文信息。在公开英语复述...

  • 联合自编码任务的多机制融合复述生成模型

    作者:刘明童; 张玉洁; 张姝; 孟遥; 徐金安; 陈钰枫 刊期:2020年第01期

    基于神经网络编码–解码框架的复述生成模型存在两方面的问题:1)生成的复述句中存在实体词不准确、未登录词和词汇重复生成;2)复述平行语料的有限规模限制了编码器的语义学习能力。针对第一个问题,本文提出在解码过程中融合注意力机制、复制机制和覆盖机制的多机制复述生成模型,利用复制机制从原句复制词语来解决实体词和未登录词生成问题;利用...

  • 基于编码器共享和门控网络的生成式文本摘要方法

    作者:田珂珂; 周瑞莹; 董浩业; 印鉴 刊期:2020年第01期

    结合基于自注意力机制的Transformer模型,提出一种基于编码器共享和门控网络的文本摘要方法。该方法将编码器作为解码器的一部分,使解码器的部分模块共享编码器的参数,同时使用门控网络筛选输入序列中的关键信息。相对已有方法,所提方法提升了文本摘要任务的训练和推理速度,同时提升了生成摘要的准确性和流畅性。在英文数据集Gigaword和DUC2004...

  • 面向微博用户的消费意图识别算法

    作者:贾云龙; 韩东红; 林海原; 王国仁; 夏利 刊期:2020年第01期

    利用迁移学习的方法,融合京东问答平台数据与少量已标注的微博数据构建训练集,提出一种基于注意力机制的双向长短期记忆神经网络(Attentional-Bi-LSTM)模型,用于识别用户的隐性消费意图。针对显性意图识别问题,提出一种结合TF-IDF(termfrequency-inversedocumentfrequency)与句法分析中动宾关系(VOB)的消费意图对象提取算法。实验结果表明,通过...

  • 基于情感信息辅助的多模态情绪识别

    作者:吴良庆; 刘启元; 张栋; 王建成; 李寿山; 周国栋 刊期:2020年第01期

    不同于纯文本的情绪分析,本文面向多模态数据(文本和语音)进行情绪识别研究。为了同时考虑多模态数据特征,提出一种新颖的联合学习框架,将多模态情绪分类作为主任务,多模态情感分类作为辅助任务,通过情感信息来辅助提升情绪识别任务的性能。首先,通过私有网络层对主任务中的文本和语音模态信息分别进行编码,以学习单个模态内部的情绪独立特征表...

  • 融合篇章表征的事件指代消解研究

    作者:吴瑞萦; 孔芳 刊期:2020年第01期

    事件指代消解任务比实体指代消解难度大,主要原因为事件描述在非结构化文本中分布稀疏,且不具备同指关系的单链占很大比例,同时事件自身承载的语义信息比实体更加丰富。为了准确地抽取文本中的同指事件,针对以上特点,提出一种融合篇章表征的事件指代消解模型。该模型通过CRF有效地区分非事件句、单链以及同指链,同时利用分层注意力机制捕捉句子...

  • 句法增强的UCCA语义分析方法

    作者:蒋炜; 李正华; 张民 刊期:2020年第01期

    考虑到句法结构与语义结构之间的紧密联系,尝试将句法信息融入UCCA语义分析模型中来增强语义分析的性能。基于目前性能最好的基于图的UCCA语义分析模型,提出并比较4种不同的融入依存句法信息的方法。采用SemEval-2019国际评测语义分析任务的英文数据集进行实验,在本领域和跨领域两个数据集上的结果均表明,句法增强的方法能够给显著地提高UCCA分...

  • 基于神经耦合模型的异构词法数据转化和融合

    作者:黄德朋; 李正华; 龚晨; 张民 刊期:2020年第01期

    为了扩大人工标注数据的规模,从而提高模型性能,尝试充分利用已有的异构人工标注数据训练模型参数。将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架,直接在两个异构训练数据上训练参数,测试阶段则同时预测两个标签序列。在词性标注、分词词性联合标注两个任务上进行大量实验,结果表明,与多任务学习方法和传统耦合模型相比,...

  • 基于多模态融合技术的用户画像方法

    作者:张壮; 冯小年; 钱铁云 刊期:2020年第01期

    针对当前用户画像工作中各模态信息不能被充分利用的问题,提出一种跨模态学习思想,设计一种基于多模态融合的用户画像模型。首先利用Stacking集成方法,融合多种跨模态学习联合表示网络,对相应的模型组合进行学习,然后引入注意力机制,使得模型能够学习不同模态的表示对预测结果的贡献差异性。改进后的模型具有精心设计的网络结构和目标函数,能够...