中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 600.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 计算语义合成性综述

    作者:王超超; 熊德意 刊期:2016年第03期

    随着自然语言处理技术的飞速发展,单纯在语法层上的研究已经不能解决目前的问题,语义层的研究逐渐成为热点。计算语义合成性作为语义学的关键部分,受到了诸多研究人员的关注。计算语义合成性的研究方法可以分为两大类:语言学方法和分布式方法。该文详细介绍了它们各自具有代表性的工作,着重阐述了近年来使用广泛的深度学习方法在计算语义合成性...

  • 汉语篇章中零形式的识别与消解

    作者:武娟; 李茹; 王智强 刊期:2016年第03期

    传统的语义角色标注只能为句中显式表达的句法论元分配语义角色,但是忽略了一些隐式的语义成分,即零形式。该文基于汉语框架语义研究了零形式的识别及消解。在识别阶段,首先使用规则方法进行零形式检测,然后运用筛选过滤的策略去除部分错误识别的零形式;在消解阶段,将篇章中显式表达的框架元素填充项作为零形式的候选先行语,提出结合框架元素语...

  • 汉语冒号标注与自动识别方法研究

    作者:谷晶晶; 周国栋 刊期:2016年第03期

    随着对篇章分析研究的逐步加深,标点符号研究成为了篇章分析与消歧的一个重要切入点。有效识别标点符号在句子中的作用,将有助于句法分析、篇章分析以及其他自然语言处理技术的发展。该文主要任务是实现汉语冒号的人工标注与自动识别,其中自动识别采取了规则法和基于统计的最大熵法。基于规则的方法比较简单且易于实现,最大熵方法把规则融入到统...

  • 基于轻语义λ-演算的汉语陈述句灵活语序研究

    作者:刘冬宁; 邓春国; 滕少华; 张巍; 梁路 刊期:2016年第03期

    目前,自然语言处理已经从句法、语法层面走向轻语义层面。对于汉语陈述句的处理,传统的方法是采用Lambek演算来进行处理。但是传统的Lambek演算无法处理汉语中的灵活语序问题,而现有的方法,如加入模态词、新连接词等,又因为其进一步使得本已是NP-hard的Lambek演算时间复杂度变大,并不适合当前的计算机处理。基于此,该文提出了λ-Lambek演算,即采...

  • 汉语析句的形式化问题

    作者:彭炜明; 宋继华; 王宁 刊期:2016年第03期

    该文讨论了形式化析句的基本概念,从语言和言语、描写和解释、层次和线性、短语和句式、词法和句法等多个语言学视角梳理了汉语析句中的形式化问题,并介绍了在句本位语法图解析句形式化中总结的若干经验、原则和待解决问题。

  • 一种基于维基百科的中文词语相关度学习算法

    作者:黄岚; 杜友福 刊期:2016年第03期

    词语相关程度计算是语义计算的基础。维基百科是目前最大、更新最快的在线开放式百科全书,涵盖概念广,概念解释详细,蕴含了大量概念间关联关系,为语义计算提供了丰富的背景知识。然而,中文维基百科中存在严重的数据稀疏问题,降低了中文词语相关度计算方法的有效性。针对这一问题,该文利用机器学习技术,提出一种新的基于多种维基资源的词语相关度...

  • 基于子词的历史典籍术语对齐方法

    作者:车超; 郑晓军 刊期:2016年第03期

    由于历史典籍术语存在普遍的多义性且缺少古汉语分词算法,使用基于双语平行语料的对齐方法来自动获取典籍术语翻译对困难重重。针对上述问题,该文提出一种基于子词的最大熵模型来进行典籍术语对齐。该方法结合两种统计信息抽取频繁在一起出现的字作为子词,使用子词对典籍进行分词,解决了缺少古汉语分词算法的问题。针对典籍术语的多义性,根据典...

  • 基于熵模型的英汉人名对齐

    作者:刘颖; 曹项 刊期:2016年第03期

    该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语音匹配的音译相似度。实验结果表明,基于熵模型的中英文人名对齐在大规模语料库的实验中达到了较好的人名对齐正确率和召回率。我们分析了人名对齐存在的主要错误,并针对主...

  • 拉丁化维吾尔文字特征及其基于规则的正规化

    作者:赛牙热·依马木; 于斯音·于苏普; 阿不都萨拉木·达吾提 刊期:2016年第03期

    结合网络上流通的拉丁化维吾尔文字特征,以拉丁化维吾尔文单词作为研究单位,首先,通过大规模文本语料库建立了固定词库、词首字母序列库、词尾字母序列库以及特殊词库等正规化规则库。然后,利用维吾尔单词中的字母序列结构特征和相邻字母上下文信息进行了拉丁化维吾尔文的正规化,同时引用最小编辑距离的方法进一步提高了正规化正确率,并用Visual...

  • 哈萨克语IT领域术语识别研究与实现

    作者:木合亚提·尼亚孜别克; 古力沙吾利·塔里甫 刊期:2016年第03期

    该文阐述了基于统计方法进行哈萨克语IT领域术语识别的研究,并在已有的训练语料基础之上,采用最大熵模型进行标注识别和结合人工方式对错误识别结果进行后处理的分析实验,阐述了该平台的研究和设计思路,系统的总体框架、基本结构、功能模块以及实现方法等相关的问题。实验结果显示该方法识别哈萨克语IT领域术语是有效的,封闭测试结果达到了82.6%...

  • 热烈祝贺我学会推荐代表胡郁获“中国优秀青年科技人才”奖

    刊期:2016年第03期

    2016年6月2日,首届全国杰出科技人才奖和中国优秀青年科技人才奖在人民大会堂举行隆重颁奖仪式,"全国杰出科技人才"奖和"中国优秀青年科技人才"奖颁奖,10位高层次科技领军人才和10位优秀青年科学家分获奖项。我学会推荐的胡郁获"中国优秀青年科技人才"奖。2015年,经中共中央批准,中国科技协会在"全国优秀科技工作者"奖中增设"全国杰出...

  • 基于小字符集藏文拉丁转写系统的设计与实现

    作者:陈小莹; 艾金勇 刊期:2016年第03期

    随着藏语语言信息技术的迅速发展,藏文拉丁转写成为迫切需要解决的重要课题之一。该文在前人有关藏文拉丁转写研究的基础上,设计并实现了基于小字符集方案的藏文拉丁转写系统。文章通过对小字符集编码方案的特征分析,同时根据藏文正字法知识,提出了基于小字符集编码的藏文拉丁转写算法,并对具体算法策略进行了分析和说明,最后在Windows平台进行...

  • 说话人自适应技术在维吾尔语语音识别中的应用研究

    作者:努尔麦麦提·尤鲁瓦斯; 张力文; 吾守尔·斯拉木 刊期:2016年第03期

    该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基...

  • 热烈祝贺学会两位副理事长孙茂松、刘庆峰当选中国科协第九届全国委员会委员

    刊期:2016年第03期

    2016年6月2日,中国科协第九次全国代表大会闭幕。经中国科协九大代表资格审查委员会认真审查,本次大会产生正式代表1 300余名,九届全国委员会委员候选人380余名。九届常委会按照学科分布合理、老中青相结合、广泛代表性原则,注意吸收新兴科技领域杰出科技工作者代表,注意提高基层一线科技工作者比例,努力形成一个深化改革、团结奋进、开拓创新的...

  • 关于朝鲜文信息技术标准化

    作者:玄龙云; 崔荣一 刊期:2016年第03期

    信息技术标准是我国普及应用信息技术、弘扬民族文化、取得市场主动性的关键。该文分析了朝鲜语信息技术标准化国内外现状,论述了朝鲜语信息处理的必要性,并提出信息技术标准化工作的具体建议。该文认为统一的中国少数民族文字信息技术基础标准体系亟待完善,朝鲜语的信息技术标准化对我国朝鲜族文化的传承与发展具有深远意义,对形成系统、完整的...