中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 600.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 英语学习者书面语法错误自动检测研究综述

    作者:刘磊; 梁茂成 刊期:2018年第01期

    英语学习者书面语法错误检测和修改系统可为作文自动评分提供参数,评测作文整体质量;也可用于计算机辅助英语教学,为学生提供书面纠错反馈,促进其二语写作能力的发展。该文概述了近十年来自然语言处理技术在英语学习者语法错误自动检测研究中的应用,首先介绍了基于大规模本族语和学习者语料库的三种数据驱动的系统设计方法,然后讨论了语误检测系...

  • 汉语“的”字短语认知神经机制的ERP研究

    作者:苏裴; 江铭虎; 白晨 刊期:2018年第01期

    隐喻是我们日常生活中常见的语言现象,更是我们认知、理解、描述世界的重要方式。该文围绕汉语独有的隐喻形式,考察汉语NP+NP形式的"的"字短语隐喻的脑认知加工机制。通过有意义程度(plausibility)、熟悉度(familiarity)和比喻的程度(figurativeness)三个方面来对语料进行筛选和预处理。实验结果显示,隐喻组别激发了比本义组别更为明显...

  • 汉语小句的俄语对应单位研究

    作者:杨毅; 冯文贺 刊期:2018年第01期

    该文标注汉俄平行文本中汉语小句的俄语对应单位,并统计分析。首先,根据汉语小句切分对齐切分俄语,得到俄语对应单位;其次,对俄语对应单位进行语法标注;最后,基于标注语料,分析发现俄语对应单位。研究发现:(1)句子组成部分多(74.85%),句子少(25.15%);(2)单一述谓核心多(69.04%),无述谓核心次之(27.63%),多述谓核心少(3.33%);(3...

  • 基于语言学特征向量和词嵌入向量的汉语动词事件类型预测

    作者:刘洪超; 黄居仁; 侯仁魁; 李洪政 刊期:2018年第01期

    该文主要介绍汉语动词事件类型的预测。事件类型是根据内部时间结构对汉语动词进行的重要分类,包括状态、活动、变化(完结和达成)。对汉语动词事件类型进行预测从理论上能够对以往语言学研究提出的特征进行验证,从应用上可以服务于机器翻译等任务。该文基于两种方式构建词向量进行汉语动词事件类型的预测,一种是根据语言学特征有监督地构建词...

  • 基于知识库的汉语未登录词语义预测

    作者:瞿健菊; 冯敏萱 刊期:2018年第01期

    该文基于知识库的语素构词知识,采用了分阶段的算法自动预测未登录词的语素构词知识,以此实现对未登录词的语义预测。基本思路是通过语素义组合或语素义类组合的匹配,先预测语义层面的知识,再确定相应语素项,最终获得未登录词多层面的语素构词知识。该算法简单、直观、合理,在首素性类、首素义类、首素义、尾素性类、尾素义类、尾素义、构词方式...

  • 基于主题相似度的宏观篇章主次关系识别方法

    作者:蒋峰; 褚晓敏; 徐昇; 李培峰; 朱巧明 刊期:2018年第01期

    篇章分析是自然语言处理领域的一个重要任务。分析篇章主次关系有助于理解篇章的结构和语义,并为自然语言处理的应用提供有力的支持。该文在微观篇章主次关系识别研究的基础上,重点研究宏观篇章主次关系,提出了一种基于word2vec和LDA的主题相似度的宏观篇章主次关系识别模型。基于word2vec的主题相似度和基于LDA的主题相似度在不同维度上计算语...

  • 面向多语料库的通用事件指代消解

    作者:陆震寰; 孔芳; 周国栋 刊期:2018年第01期

    事件同指消解对篇章理解、信息抽取意义重大。该文在事件抽取完成的基础上聚焦事件同指,给出了一个基于卷积神经网络的事件同指消解完整框架,针对实例分布不均衡问题给出了基于事件语义类别和时态信息的事件兼容性过滤策略。为了最大化适用不同的事件标注策略,提出了最小事件本身描述和事件间关系描述相结合的特征表示方法。针对基于事件对模型...

  • 基于音系学模型的手语理解

    作者:姚登峰; 江铭虎; 阿布都克力木·阿布力孜; 李晗静; 哈里旦木·阿布都克里木 刊期:2018年第01期

    该文试图模拟人脑处理手势信号的过程,设计了一个混合的深层神经网络模型来解决基于音系学模型的手语理解问题,即手语音韵信息到文本转换的问题。为此该文首先综合了手语语言学里同时性和序列性这两个观点的长处,提出了一个手语音系学的改进模型,并针对难点设计了基于音系学模型的手语理解算法。直接从语言学的音韵特征推断手语文本,相比从视觉...

  • 机器词典释义模版的建构和运用

    作者:王恩旭; 袁毓林 刊期:2018年第01期

    机器理解词主要借助于词典,但目前的词典释义还不准确,也不完备。对于这些问题,该文通过分析词的语义结构和建构词的释义模版来解决。通过分析词的语义结构,弄清词义中包含着哪些语义成分、语义关系,确定哪些是必有成分、必有关系,哪些是可有成分、可有关系。然后,结合实例讨论释义模版的建构过程、原则与方法。最后,通过释义模版,解决词典释义...

  • 中英文篇章依存树库构建与分析

    作者:吴永芃; 李素建; 秦沐坤; 杨安; 王厚峰 刊期:2018年第01期

    该文在篇章依存关系的基础上,建立了小规模中英文篇章依存树库,并针对多核心关系问题、依存关系的选择、长篇章与复杂篇章的标注、层次结构信息的损失等标注过程中遇到的困难进行了分析研究,给出了解决方案。并对篇章依存树库进行了简单的统计分析,对中英文篇章中的异同进行了初步探索。

  • 由粗到精的哈萨克语短语结构句法分析研究

    作者:梁金莲; 古丽拉·阿东别克 刊期:2018年第01期

    该文针对哈萨克语短语结构句法分两个阶段采用由粗到精的方法进行哈萨克语句法分析研究。第一阶段使用粗略的句法分析器生成20个最佳候选树;第二阶段采用感知机的方法训练,提取特征信息,并对第一阶段生成的20个最佳候选树进行重排序,最终解析结果是第一阶段产生的候选树的结果和重排序结果按照比例选取。该方法在两个阶段不仅可以获取到句子的结...

  • MHW蒙古文脱机手写数据库及其应用

    作者:范道尔吉; 高光来; 武慧娟 刊期:2018年第01期

    建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5 000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5 000样本,测试集Ⅱ包含14 085样本。该文利用蒙古文文字长度可变特征研究了自动错误检测算法,提...

  • 采用多尺度注意力机制的远程监督关系抽取

    作者:蔡强; 郝佳云; 曹健; 李海生 刊期:2018年第01期

    针对目前大多数关系抽取模型中局部特征及全局特征利用不充分的缺点,该文提出一种采用多尺度注意力机制的远程监督关系抽取模型。在词语层面,通过在池化层构建权重矩阵来衡量词语与关系的相关程度,从而捕捉句子中重要的语义特征;在句子层面,采用注意力机制将预测关系与句子进行相关性比较,获得句子级别的重要信息。模型在NYT数据集上平均准确率...

  • 面向专业文献知识实体类型的抽取和标注

    作者:温雯; 伍思杰; 蔡瑞初; 郝志峰 刊期:2018年第01期

    知识实体的类型标注是专业文献的结构化管理和知识脉络挖掘中的一个重要问题。然而,由于知识实体具有专业性强、类型多样等特点,传统的实体抽取方法并不能很好地实现知识实体的类型标注。为了解决这一问题,该文从数据中发现并总结出知识实体类型的独有特性,根据这些特性首先提出一种基于启发式规则的类型抽取方法、实现部分知识实体的类型标注,...

  • 基于CNN-BLSTM-CRF模型的生物医学命名实体识别

    作者:李丽双; 郭元凯 刊期:2018年第01期

    命名实体识别是自然语言处理任务的重要步骤。近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现出了很好的性能。然而在生物医学领域,许多实验表明基于领域知识的人工特征对于神经网络模型的结果影响很大。因此,如何在不依赖人工特征的情况下获得较好的生物医学命名实体识别性能是有待解决的问题。该文提出一种基于CNN-BLS...