中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 600.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 基于转移神经网络的中文AMR解析

    作者:吴泰中; 顾敏; 周俊生; 曲维光; 李斌; 顾彦慧 刊期:2019年第04期

    抽象语义表示(abstract meaning representation,AMR)是一种领域无关的句子语义表示方法,它将一个句子的语义抽象为一个单根有向无环图,AMR解析旨在将句子解析为对应的AMR图。目前,中文AMR研究仍然处于起步阶段。该文结合中文AMR特性,采用基于转移神经网络的方法对中文AMR解析问题展开了试验性研究。首先,实现了一个基于转移解码方法的增量式中...

  • 基于潜在语义特性的语义双关语检测及双关词定位

    作者:刁宇峰; 杨亮; 林鸿飞; 吴迪; 樊小超; 徐博; 许侃 刊期:2019年第04期

    语义双关语是幽默、笑话和喜剧等作品的来源之一,在人类写作的发展进程中具有重要的历史地位。由于语义双关语存在歧义难懂的特点,因此难以挖掘语义双关语的潜在语义信息,故目前语义双关语的检测和双关词的定位是自然语言处理任务中的一项困难和挑战。该文在语义双关语的理论基础上,挖掘了一系列的潜在语义特性,并构建了对应每个特性的特征集,用...

  • 中文基本复合名词短语语义关系体系及知识库构建

    作者:刘鹏远; 刘玉洁 刊期:2019年第04期

    名词短语一直是中外语言学领域的重要研究对象,近年来在自然语言处理领域也受到了研究者的持续关注。英文方面,已建立了一定规模的名词短语语义关系知识库。但迄今为止,尚未建立相应或更大规模的描述名词短语语义关系的中文资源。该文借鉴国内外诸多学者对名词短语语义分类的研究成果,对大规模真实语料中的基本复合名词短语实例进行试标注与分析...

  • 基于描述约束的词表示学习

    作者:冶忠林; 赵海兴; 张科; 朱宇 刊期:2019年第04期

    词语作为语言模型中的基本语义单元,在整个语义空间中与其上下文词语具有很强的关联性。同样,在语言模型中,通过上下文词可判断出当前词的含义。词表示学习是通过一类浅层的神经网络模型将词语和上下文词之间的关联关系映射到低维度的向量空间中。然而,现有的词表示学习方法往往仅考虑了词语与上下文词之间的结构关联,词语本身所蕴含的内在语义...

  • 基于领域知识的增强约束词向量

    作者:王恒升; 刘通; 任晋 刊期:2019年第04期

    词向量是一种词语的数字化的表达。基于神经网络模型,利用语料中词语之间的上下文关系这一约束条件,通过大量训练得到词向量。词向量在表达词的语义上的表现给人以无限的希望与想象空间,基于词向量的文本分类、人机对话、智能检索等得到了广泛的研究。该文针对校园信息查询的特定应用,建立了所涉及词语的分类本体,除了利用语料中词语上下文关系...

  • 基于语义分类和描述框架的网络攻击知识抽取研究及其应用

    作者:方芳; 王亚; 王石; 符建辉; 曹存根 刊期:2019年第04期

    随着计算机技术的迅猛发展,自然语言处理成为计算机科学领域与人工智能领域中的一个重要方向,且文本知识获取(knowledge acquisition from text,KAT)是人工智能的重要研究内容。当前对于文本研究,大多采用关键字以及机器学习方法,准确率并不高。该文提出了一种基于语义文法的中文网络攻击事件知识获取方法。首先介绍参考FrameNet构建的语义分类...

  • 第十六届全国自然语言处理青年学者研讨会(YSSNLP 2019)在海南琼海顺利召开

    刊期:2019年第04期

    2019年5月3日至5日,第十六届全国自然语言处理青年学者研讨会(YSSNLP 2019)在海南琼海顺利召开。本次研讨会由中国中文信息学会主办,海南大学承办,近200名代表参会。

  • 基于汉盲对照语料库和深度学习的汉盲自动转换

    作者:蔡佳; 王向东; 唐李真; 崔晓娟; 刘宏; 钱跃良 刊期:2019年第04期

    汉盲转换是指将汉字文本自动转换为对应的盲文文本,其在盲文出版、盲人教育等领域具有重要应用价值,但当前已有系统性能难以满足实用需求。该文提出一种基于汉盲对照语料库和深度学习的汉盲自动转换方法,首次将深度学习技术引入该领域,采用按照盲文规则分词的汉字文本训练双向LSTM模型,从而实现准确度高的盲文分词。为支持模型训练,提出了从不精...

  • 注意力的端到端模型生成藏文律诗

    作者:色差甲; 华果才让; 才让加; 慈祯嘉措; 柔特 刊期:2019年第04期

    文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果。目前主流的生成方法是基于深度学习的方法,而该文则提出了一种基于注意力的端到端模型生成藏文律诗法。该方法基本框架是一个双向LSTM的编码-解码模型,在此基础上引入了藏文字嵌入、注意力机制和多任务学习法。实验结果表明,该文提出的方法在藏文...

  • 基于等价压缩快速聚类的Web表格知识抽取

    作者:吴小龙; 曹存根 刊期:2019年第04期

    Web表格知识抽取是一种重要的获取高质量知识的途径,在知识图谱、网页挖掘等方面具有广泛的研究意义与应用价值。传统的Web表格知识抽取方法主要依赖于良好的表格结构和足够的先验知识,但在复杂的表格结构以及先验知识不足等情形下难以奏效。针对这类方法的问题,该文通过充分利用表格自身的结构特点,提出了一套可面向大规模数据的基于等价压缩快...

  • 基于混合表示的中文事件检测方法研究

    作者:秦彦霞; 王中卿; 郑德权; 张民 刊期:2019年第04期

    传统中文事件检测方法采用人工定义的特征表示候选触发词,耗时耗力。基于神经网络的特征学习方法在中英文事件检测任务中得到了验证。现有的基于神经网络的中文事件检测方法初步探索了字信息对解决分词错误的作用。字是中文的最小结构单元和语义表示单元。词语的字符级信息能够提供词语的结构性信息和辅助词语级语义。该文研究了字/词混合神经网...

  • 基于查询的新闻多文档自动摘要技术研究

    作者:王凯祥; 任明 刊期:2019年第04期

    针对新闻文本领域,该文提出一种基于查询的自动文本摘要技术,更加有针对性地满足用户信息需求。根据句子的TF-IDF、与查询句的相似度等要素,计算句子权重,并根据句子指示的时间给定不同的时序权重系数,使得最近发生的新闻内容具有更高的权重,最后使用最大边界相关的方法选择摘要句。通过与基于TF-IDF、TextRank、LDA等六种方法的对比,该摘要方法...

  • 基于卷积神经网络与篇章结构的足球新闻自动生成方法

    作者:刘茂福; 齐乔松; 胡慧君 刊期:2019年第04期

    当前的足球比赛新闻通常是由专家或记者手工撰写的,足球比赛新闻的手工写作既费时又低效。随着在线直播平台与社交媒体的流行,体育网络直播脚本大幅增加,但网络直播脚本通常只记载一场比赛的流水,具有冗长且重点模糊的特性,不适宜于赛后直接阅读。为了解决以上问题,在比赛之后,可以基于直播脚本撰写和足球比赛新闻。因此,该文提出一种从网络直播...

  • 金庸小说中主角复杂爱情模式的识别与分析

    作者:张旋; 梁循; 李志宇; 张树森; 赵晓磊 刊期:2019年第04期

    该文提出了一种基于复杂网络分析方法的小说人物关系识别模型。通过以金庸14部武侠小说的分析过程为样例,首先提出了基于小说社会网络关系的降噪分析框架,然后在此基础上构建了人物亲密度评估与关系判别模型,最后给出了一种识别小说主角复杂爱情模式的通用模型。实验发现该模型能够有效地分析出小说中的复杂爱情模式,且在保证识别效率的同时还具...

  • 面向问答文本的属性分类方法

    作者:江明奇; 沈忱林; 李寿山 刊期:2019年第04期

    属性分类是属性级情感分析中的一个重要任务。该任务旨在对文本包含的某些具体属性进行自动分类。已有的属性分类方法研究基本都是面向新闻、评论等文本类型。与已有研究不同的是,该文的研究主要面向问答文本的属性分类任务。针对问答文本的属性分类问题,该文提出了一种多维文本表示的方法。首先,该方法进行中文句子切分;其次,使用LSTM模型对每...