中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 600.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 中亚语言自然语言处理综述

    作者:吐尔根·依布拉音; 卡哈尔江·阿比的热西提; 艾山·吾买尔; 买合木提·买买提 刊期:2018年第05期

    该文对中亚地区属于同一个语族的土耳其语、哈萨克语等诸语言的自然语言处理现状进行了综述。首先分别回顾土耳其语、哈萨克语和其他中亚语言在词法分析、句法分析、命名实体识别、机器翻译方面的研究进展,随后讨论了与具体语言无关的黏着语词法分析方面的研究情况,最后指出国内外中亚诸语言处理自然语言领域中所面临的问题和挑战,并对未来的研...

  • 交互式问答的关系结构体系及标注

    作者:周小强; 王晓龙; 陈清财 刊期:2018年第05期

    交互式问答是一种对话式的、连续的、前后关联的信息交互形式,交互式问答的关系结构直接体现了交互式场景在不同语言层面上的上下文关联。该文归纳分析了交互式问答中的对话行为和语句关系,在此基础上提出了对应的关系结构体系;为了验证类别体系的合理性,对真实环境中的交互式问答语料进行了对话行为标注和上下文语句关系标注;并针对交互式问答...

  • 面向文本聚类的实体—动作关联模型研究

    作者:刘作国; 陈笑蓉 刊期:2018年第05期

    该文提出面向文本聚类分析的实体—动作关联模型EARM,探讨汉语语义实体及其行为的描述方法。汉语属于非形态语言,语句没有时态及语态的变化,词类跟句法成分之间也不是简单的一一对应关系。该文提出一种句法成分识别机制,根据词汇类别特征及位置特征识别实体及动作。在句法成分识别的基础上展开句法分析,通过匹配句型特征建立实体—动作关联模型E...

  • 短语结构树库向句式结构树库的自动转换研究

    作者:张引兵; 宋继华; 彭炜明; 赵亚伟; 宋天宝 刊期:2018年第05期

    该文从短语结构和句式结构的区别与联系入手,设计了一种将短语结构自动转换为句式结构的算法。并以清华短语结构树库(TCT)为测试语料,实现了将大规模短语结构语料向句式结构语料的转换。最后,搭建了一套可扩展的可视化系统,用于不同句法结构语料的可视化查看。这一研究不仅实现了两种结构之间的初步转换,而且极大地丰富了汉语句本位图解树库的...

  • 第十五届全国自然语言处理青年学者研讨会在南京成功举行

    刊期:2018年第05期

    2018年5月4日至5日,第十五届全国自然语言处理青年学者研讨会(YSSNLP 2018会议)在南京召开。本次研讨会由中国中文信息学会主办,计算机软件新技术国家重点实验室(南京大学)承办。本次研讨会的主题为"关注学科交叉,增进产学交流",旨在促进自然语言处理领域国内外学者间的学术互动,加强学术研究和产业发展的交流对话,共同促进整个自然语言处...

  • 基于语义的政策血缘网络演化机理研究

    作者:刘刚; 傅玮萍; 马莺歌 刊期:2018年第05期

    该文将行业政策形式化为一个由微观、中观和宏观政策血缘网络构成的复杂网络体系。分别通过改进的基于语义的政策词语相似度计算方法、依存句分析和基于向量空间模型的方法构建了微观、中观及宏观的政策血缘网络。在此基础上,该文对政策血缘网络进行了层次结构演化和碎片清理,构建了政策血缘森林并提出基于政策血缘森林的政策碎片化预防的方法。...

  • 基于特征融合的产科多标记辅助诊断研究

    作者:马鸿超; 张坤丽; 赵悦淑; 昝红英; 庄雷 刊期:2018年第05期

    中文产科电子病历中蕴含着大量的医疗知识和健康信息,电子病历的信息抽取及辅助诊断对提高人口的生育健康水平具有重要意义。电子病历中,首次病程记录的入院诊断是根据主诉、辅助检查、查体等信息得出的。通常情况下诊断中包含正常诊断、病理诊断及并发症而非单一结果。因此,该文将辅助诊断问题转化为多标记分类任务。在对产科电子病历的首次病...

  • 试题知识点预测:一种教研知识强化的卷积神经网络模型

    作者:胡国平; 张丹; 苏喻; 刘青文; 李佳; 王瑞 刊期:2018年第05期

    在各类在线学习系统中,为了给学生提供优质的学习服务,一个基础性的任务是试题知识点预测,即预测一道试题所考察的知识概念、能力等。在这个任务中,已有方法通常基于人工专家标注或者传统机器学习方法。然而,这些传统方法要么耗时耗力,要么仅关注试题资源的浅层特征,忽略了试题文本和知识点之间的深层语义关联。因此,这两类方法在实际应用中均受...

  • 基于CNN词根形态选择模型的改进蒙汉机器翻译研究

    作者:乌尼尔; 苏依拉; 刘婉婉; 仁庆道尔吉 刊期:2018年第05期

    随着科学技术的发展,以循环神经网络为基础的机器翻译方法由于翻译质量更好而逐渐取代统计机器翻译方法,特别是在国际大语种之间的互译方面,RNN在对语料编码时能够提取更好的特征,这对翻译质量好坏至关重要。然而在蒙古语这类小语种的翻译方面,由于语料不足导致的数据稀疏和RNN模型训练梯度消失等问题,很难从语料中充分获取语义关系,因此该文提...

  • 基于循环神经网络的藏语语音识别声学模型

    作者:黄晓辉; 李京 刊期:2018年第05期

    探索将循环神经网络和连接时序分类算法应用于藏语语音识别声学建模,实现端到端的模型训练。同时根据声学模型输入与输出的关系,通过在隐含层输出序列上引入时域卷积操作来对网络隐含层时域展开步数进行约简,从而有效提升模型的训练与解码效率。实验结果显示,与传统基于隐马尔可夫模型的声学建模方法相比,循环神经网络模型在藏语拉萨话音素识别...

  • 基于栈式降噪自编码和词嵌入表示的维吾尔语零指代消解

    作者:秦越; 禹龙; 田生伟; 冯冠军; 吐尔根·依布拉音; 艾斯卡尔·艾木都拉; 赵建国 刊期:2018年第05期

    针对维吾尔语零指代现象,提出采用栈式降噪自编码的深度学习机制进行维吾尔语零指代消解。首先由大规模无标注维吾尔语语料训练得到富含语义和句法信息的词嵌入表示,将其作为候选先行语和缺省零代词的语义特征;其次根据维吾尔语语言特点,抽取14项针对零指代消解任务的手工设计特征;然后融合word embedding特征和14项hand-crafted特征作为栈式降...

  • 基于深度信念网络的维吾尔语事件伴随关系识别

    作者:胡伟; 禹龙; 田生伟; 吐尔根·依布拉音; 冯冠军; 艾斯卡尔·艾木都拉 刊期:2018年第05期

    维吾尔语事件伴随关系是维吾尔语语言中常见且重要的关系之一。结合对维吾尔语语言特点的研究,该文提出一种基于深度信念网络的维吾尔语事件伴随关系识别方法,根据维吾尔语语言特性和事件伴随关系的特点,抽取12项基于事件结构信息的特征;同时充分利用事件对所对应的两个触发词之间的语义信息,引入Word Embedding计算两个触发词之间的语义相似度...

  • 基于潜在语义分析的文本指纹提取方法

    作者:崔彤彤; 崔荣一 刊期:2018年第05期

    网络化大数据时代的到来丰富了网络空间中的信息资源,然而由于数据资源类型的多样性及其增长的快速性,给网络空间的存储和信息资源的有效利用带来了压力和挑战。该文提出了一种基于潜在语义分析的文本指纹提取方法,该方法是对数据信息的一种压缩表示,是针对目前指纹提取方法语义缺失的一种改进。该方法主要通过奇异值分解获取原始文档的潜在语义...

  • 基于信任关系和词相关关系的冷启动用户词特征重建

    作者:高亨德; 王智强; 李茹 刊期:2018年第05期

    文本是社交媒体用户的重要信息之一,从文本中获取用户的词特征是实现用户主题建模、兴趣挖掘及个性化推荐等任务的基础。然而社交媒体中存在许多用户(冷启动用户)只含有少量甚至缺乏文本信息,为此该文提出一种融合用户信任关系及词相关关系的词特征重建方法。该方法通过对用户信任关系矩阵、词相关关系矩阵和用户词特征矩阵进行联合概率矩阵分...

  • 基于共指消解的实体搜索模型研究

    作者:熊玲; 徐增壮; 王潇斌; 洪宇; 朱巧明 刊期:2018年第05期

    实体属性挖掘(slot filling,SF)旨在从大规模文档集中挖掘给定实体(称作查询)的特定属性信息。实体搜索是SF的重要组成部分,负责检索包含给定查询的文档(称为相关文档),供后续模块从中抽取属性信息。目前,SF领域关于实体搜索的研究较少,使用的基于布尔逻辑的检索模型忽略了实体查询的特点,仅使用查询的词形信息,受限于查询歧义性,检索结果...