中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 600.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 受控自然语言的应用和处理

    作者:薛平 刊期:2018年第10期

    自然语言是人类交流最自然的方式。但其复杂性和模糊性常常给有效的交流带来问题。现代社会尤其是当前信息时代面对大量的信息数据,不少工业场景和科研领域以及各种人机交互的应用要求清晰精准、标准化而又较为自然的表达和交流,受控自然语言随着这些需求应运而生。该文讨论受控自然语言及其性质、分类和应用,以及受控自然语言的计算处理方法。...

  • 地理社会网络数据可视化分析研究综述

    作者:李恒; 沈华伟; 黄蔚; 程学旗 刊期:2018年第10期

    随着移动互联网与社会网络的深度融合,基于位置服务(Location Based Service,LBS)的社交媒体应用更加流行,成为地理社会网络(Geo-Social Networks,GSN)的研究重点。基于位置信息的社会网络(Location Based Social Network,LBSN)由于具有时空特性,其海量数据可视化不同于传统信息可视化,必须结合其地理信息特征进行表达。该文以GSN中抽取出...

  • 第十三届中国中文信息学会暑期学校暨中国中文信息学会《前沿技术讲习班》在北京召开

    刊期:2018年第10期

    第十三届中国中文信息学会暑期学校暨中国中文信息学会《前沿技术讲习班》第八期和第九期(CIP-SATT 8&9)在北京语言大学召开。论坛由中国中文信息学会和中国中文信息学会学术工作委员会主办,北京语言大学承办。本次讲习班主题分别为:深度学习与文本分析.

  • 《现代汉语动词语义知识词典》的开发与应用

    作者:孙道功; 亢世勇 刊期:2018年第10期

    该文吸收已有动词研究的相关成果,提出了动词语义词典开发的相关原则和研制思路,界定并描写了词典中所涉及的相关属性信息,并对词典的总体文件结构及其各个库的信息进行了描写和说明。最终开发了融合词汇语义和句法语义,涵盖词形、词性、释义、义类、义场、句法范畴信息、语义范畴信息、语义句模等多种信息参数的开放性的动词语义知识词典。该词...

  • 适应多领域多来源文本的汉语依存句法数据标注规范

    作者:郭丽娟; 李正华; 彭雪; 张民 刊期:2018年第10期

    近十年来,依存句法分析由于具有表示形式简单、灵活、分析效率高等特点,得到了学术界广泛关注。为了支持汉语依存句法分析研究,国内同行分别标注了几个汉语依存句法树库。然而,目前还没有一个公开、完整、系统的汉语依存句法数据标注规范,并且已有的树库标注工作对网络文本中的特殊语言现象考虑较少。为此,该文充分参考了已有的数据标注工作,同...

  • 基于简单循环单元的深层神经网络机器翻译模型

    作者:张文; 冯洋; 刘群 刊期:2018年第10期

    基于注意力机制的神经网络机器翻译模型已经成为目前主流的翻译模型,在许多翻译方向上均超过了统计机器翻译模型,尤其是在训练语料规模比较大的情况下,优势更加明显。该模型使用编码器—解码器框架,将翻译任务建模成序列到序列的问题。然而,在基于门控循环单元(gated recurrent unit,GRU)的编码器—解码器模型中,随着模型层数的增加,梯度消失...

  • 藏文字同现网络的小世界效应和无标度特性

    作者:才智杰; 孙茂松; 才让卓玛 刊期:2018年第10期

    复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、聚类系数和度分布,实验数据显示97...

  • 一种新的朝鲜语词性标注方法

    作者:金国哲; 崔荣一 刊期:2018年第10期

    朝鲜语词性标注是朝鲜语信息处理的基础,其结果直接影响后续朝鲜语自然语言处理的效果。首先为了解决朝鲜语词性标注中遇到的形态素实际写法与原形不一致的问题,该文提出了一种在seq2seq模型的基础上融合朝鲜语字母信息的朝鲜语形态素原形恢复方法;其次,在恢复形态素原形的基础上,利用LSTM-CRF模型完成朝鲜语分写及词性标注。实验结果表明,该文...

  • 局部几何保持的Laplacian代价敏感支持向量机

    作者:周国华; 宋洁; 殷新春 刊期:2018年第10期

    不平衡数据广泛存在于现实生活中,代价敏感学习能有效解决这一问题。然而,当数据的标记信息有限或不足时,代价敏感学习分类器的分类精度大大下降,分类性能得不到保证。针对这一情况,该文提出了一种局部几何保持的Laplacian代价敏感支持向量机(LPCS-LapSVM),该模型基于半监督学习框架,将代价敏感学习和类内局部保持散度的思想引入其中,从考虑内...

  • 基于多模型的新闻标题分类

    作者:董孝政; 宋睿; 洪宇; 朱芬红; 朱巧明 刊期:2018年第10期

    该文研究中文新闻标题的领域分类方法(domain-oriented headline classification,DHC)。现有研究将DHC限定为一种短文本分类问题,并将传统分类模型和基于卷积神经网络的分类模型应用于这一问题的求解。然而,这类方法忽视了新闻标题的内在特点,即为"标题是建立在凝练全文且弱相关的词语之上的一种强迫性的语义表述"。目前,融合了序列化记忆的...

  • 基于密度及文本特征的新闻标题抽取算法

    作者:彭圳生; 巩青歌; 高志强; 段妍羽; 曾子贤 刊期:2018年第10期

    为从大量的复杂非规范网页结构中自动抽取出新闻标题,该文提出一种基于密度和文本特征的新闻标题抽取算法(title extraction with density and text-features,TEDT)。主要通过融合网页文本密度分布和语言特征的语料判定模型,将网页划分为语料区和标题候选区,选取语料后通过TextRank算法计算对应的key-value权重集合,最后采用改进的相似度计算...

  • 第三届语言与智能高峰论坛在北京隆重召开

    刊期:2018年第10期

    2018年7月28日,第三届语言与智能高峰论坛(The 3rd Language and Intelligence Summit)在北京北语礼堂隆重召开。论坛由中国中文信息学会和中国计算机学会共同发起并联合主办,北京语言大学承办,旨在向社会公众介绍国际自然语言理解及认知智能方向的发展趋势和创新成果.

  • 基于多特征融合的谐音广告语生成模型

    作者:徐琳宏; 林鸿飞; 祁瑞华; 杨亮 刊期:2018年第10期

    广告语是广告传播中不可或缺的一部分,凝练着品牌的核心价值。该文以古代诗词为基础,通过多特征融合的方式,提出谐音广告语群的生成及评估模型。在生成模型中,首先利用语音模板,获取候选广告语群。同时分别通过语音、形状、语义和情境四个维度,计算广告语的九大特征,得到候选广告语群的特征矩阵。最后采用基于主成分分析和权重的双序评估算法,筛...

  • 基于分形几何的甲骨文字形识别方法

    作者:顾绍通 刊期:2018年第10期

    甲骨文是流行于我国古代商朝的成熟文字系统,本质上是一种平面图形,笔画和结构不是非常稳定。很多字形具有图画性质,难以区分明显的结构,难写难记。已有的编码输入方法受众面小,效率很低,使用受限。该文分析了甲骨文字形的分形性质,在此基础上,通过字形的重心建立二维平面直角坐标系,将甲骨文字形的平面图形划分为四个象限。利用分形几何的原理,...

  • 基于网络小说热度预测的CDN内容分发策略研究

    作者:赵礼强; 姜崇; 靖可 刊期:2018年第10期

    内容分发网络(CDN)以推(Push)和拉(Pull)作为两种主要的内容分发策略。拉是服务器对用户请求给予回应的方式,在面对高并发请求时,以推方式预分发到服务器上的内容将有效辅助改善服务器过载的情况,并实现热度内容的主动推送。预分发内容的热度高低直接决定了内容的边缘命中率和用户的启动延迟,有效减少预分发内容替换的频率和对源服务器访...