中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 700.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 《现汉》与《语法信息词典》词类对应分析

    作者:邱立坤; 赵慧; 俞士汶; 朱学锋 刊期:2017年第05期

    词类标注问题历来受到中文信息处理、汉语语法和词汇学界的共同关注,学者们已提出多种词类标记体系,彼此间存在较大差异,但迄今尚无人对大规模词类标注工程进行系统比较。该文以《现代汉语词典》第5版和《现代汉语语法信息词典》两个大型词典词类标注工程为比较对象,基于所提出的词类对应算法,自动找出两部词典词类标注上的差异,进而对形成差异...

  • 词语序差的分布特点与文本间词汇异同

    作者:刘锐; 孙碧泽; 龙云飞; 王珊 刊期:2017年第05期

    该文在已有关于"频级""频序"研究的基础上,结合两种不同类型的语料,采用词汇计量分析方法,考察词语的"序差"所具有的分布特点。该研究发现,对于两种文本的共有词集,词的序差呈对称分布,且集中分布于中位数附近,存在离群值序差。这一特点在序差图上表现为"中段平直,双尾翘曲"的"双尾分布"形态。根据词语序差的分布规律,可以将文本共有...

  • 基于规则的汉语疑问词“什么”的语义识别模型构建

    作者:牛长伟; 程邦雄 刊期:2017年第05期

    汉语疑问词具有多义性,至少有三种通用解读:疑问解读、存在解读(虚指)和全称解读(任指)。该文从汉语疑问词的词义排歧角度出发,通过总结汉语疑问词三种解读所处的句法环境的共同特征,确立其在复杂句法环境中的强势解读,进而构建一个基于规则的汉语疑问词的语义识别模型,为制订词义排歧决策表提供依据。该文以词义最多的疑问词"什么"为例,...

  • 基于概念知识树的双宾短语分析

    作者:林子琦; 倪晚成; 赵美静; 杨一平 刊期:2017年第05期

    双宾短语是一种特殊的语言现象,为了使计算机能够理解并处理双宾短语,该文从语法和语义两个层面对双宾短语进行了分析,基于概念知识树知识表示模型建立了双宾短语的语义表达模型;并提出一种双宾短语分析算法,实现了从双宾短语到其语义表达模型的自动转换。双宾短语分析算法采用自顶向下和自底向上相结合的方法,自顶向下用于对双宾短语的语法成分...

  • 基于句本位图解树库的汉语句式实例获取

    作者:朱淑琴; 彭炜明; 宋继华; 郭冬冬 刊期:2017年第05期

    为了将中文树库更好地服务于国际汉语教学,考虑到语法教学中句式框架的整体性,该文引入基于句式结构的句本位图解树库,深入分析其结构特征,并基于句式结构的分层抽取思路,提取了蕴含在每个标注句中的句式实例,构建了汉语句式实例库,具体分为基础句式实例库和复杂句式实例库两部分。该项工作使得小规模标注树库可以获取较大规模的句式实例库,为句...

  • 基于CFN的汉语篇章连贯性研究

    作者:吕国英; 苏娜; 李茹; 王智强 刊期:2017年第05期

    篇章连贯性研究是篇章分析领域的重要课题之一。基于Chinese FrameNet(CFN),该文构建了汉语篇章连贯性描述体系,该描述体系研究了框架语义与篇章单元的关系,探讨了篇章如何通过框架与框架之间的语义关系实现篇章的连贯,为篇章连贯提供了合适的描写机制和计算基础。从《人民日报》选取了160篇文章进行标注实践,在篇章结构和篇章关系两方面均取...

  • 译文语序的领域性思考:一种融合主题信息的领域自适应调序模型

    作者:刘梦眙; 姚亮; 洪宇; 刘昊; 姚建民 刊期:2017年第05期

    领域自适应研究的目标是建立一种动态调整翻译模型,使翻译模型对目标领域的语言特征具备较强的学习和处理能力,借以保证翻译系统在不同领域获得平衡可靠的翻译能力。现有翻译模型的自适应研究已经取得显著进展,但调序过程的领域适应性研究相对较少。在该文前期工作中通过对大规模源语言和目标语言的真实互译样本统计发现,在语义等价的短语级互译...

  • 基于语料库的藏语语音合成单元选择算法

    作者:才让卓玛; 才智杰 刊期:2017年第05期

    在基于语料库的语音合成方法中,语音合成单元选择的优劣直接影响合成语音的自然度和流畅性。该文针对藏语言文字的特点,提出以基本构件、组合构件、字、词及句单元相融合的混合单元语音合成策略,并提出了藏语语音合成混合单元选择算法。主观评价与客观评测数据表明该策略与算法有效和合理,各类合成单元在开放语料上的覆盖率与语音合成效果均达到...

  • 基于字素分割的蒙古文手写识别研究

    作者:范道尔吉; 高光来; 武彗娟 刊期:2017年第05期

    隐马尔科夫模型(HMM)对序列数据有很强的建模能力,在语音和手写识别中都得到了广泛的应用。利用HMM研究蒙古文手写识别,首先需要解决的问题是手写文字的序列化。从蒙古文的构词和书写特点看,蒙古文由多个字素从上到下串联构成。选择字素集合和词的字素分割是手写识别的基础,也是影响识别效果的关键因素。该文根据蒙古文音节和编码知识确定了蒙...

  • 齐普夫定律对朝鲜语适用性的测定

    作者:崔荣一; 赵雪 刊期:2017年第05期

    该文目的在于验证齐普夫定律对朝鲜语的适用性。首先统计了朝鲜语大规模语料中的文字及字母两种语言单位的频率分布,然后利用最小二乘法对文字频率分布曲线进行了拟合,最后计算了文字字频齐普夫定律的参数估计值。实验结果表明,朝鲜语的文字和字母的频率与频级关系都近似符合齐普夫定律,验证了齐普夫定律对朝鲜语的适用性,这对朝鲜语的信息处理...

  • 蒙古语固定短语识别算法的设计与实现

    作者:斯·劳格劳 刊期:2017年第05期

    固定短语的自动识别和标注是进行蒙古语文本处理的基础和前提条件。词类标注、短语标注、句法分析、语义分类及语义角色标注等基础研究和机器翻译、文本校对等应用系统的开发均以正确标注固定短语的文本为处理对象。该文在"蒙古语固定短语语法信息词典"的基础上采用基于有限状态自动机和规则的方法设计实现了固定短语识别和标注算法。经实验,...

  • 维吾尔语名词短语待消解项识别

    作者:陶豆豆; 禹龙; 田生伟; 赵建国; 吐尔根·依布拉音; 艾斯卡尔·艾木都拉 刊期:2017年第05期

    针对维吾尔语名词短语待消解项识别任务,该文提出一种利用栈式非负约束自编码器(Stacked Nonnegative Constrained Autoencoder,SNCAE)完成基于语义特征的待消解项识别方法。为了提高自动编码器隐藏层激活度的稀疏性和重构数据的质量,利用NCAE非负约束算法,为连接权值施加非负性约束。通过分析维吾尔语名词短语语言指代现象,提取出15个特征,利...

  • 基于语义串特征提取及融合评价的维吾尔文文本聚类

    作者:吐尔地·托合提; 维尼拉·木沙江; 艾斯卡尔·艾木都拉 刊期:2017年第05期

    该文研究一种改进的n元递增算法来抽取文本中表达关键信息的语义串,然后用多特征融合的评价方法为每一个文本选取最重要的语义串,并用这些语义串作为特征表示文本。通过K_means聚类分析的实验结果表明,以语义串作为特征可以构造比单词特征集更紧凑的文本模型,不仅可以大大降低特征空间的维度,对于提高聚类算法性能也是非常有效的。

  • 维吾尔文初中数学教材词干分析研究

    作者:艾孜尔古丽; 艾孜海尔江; 玉素甫·艾白都拉; 祖力克尔江; 米尔夏提 刊期:2017年第05期

    该文将初中数学维吾尔文教材作为研究对象,根据维吾尔语的特点和统计学原理理论,从计算语言学角度调查初中数学维吾尔文教材用词干情况。该文主要研究维吾尔语词干、教材概貌、数据处理技术相关概念及其算法及现代维吾尔语语料处理工具,获取教材中词干基本情况、新增词干、初中数学教材高频词干,开展了初中数学维吾尔文教材词干调查,为维吾尔语...

  • 全国知识图谱与语义计算大会(CCKS 2017)在四川成都隆重召开

    刊期:2017年第05期

    2017年8月26-29日,全国知识图谱与语义计算大会(CCKS 2017)在四川成都隆重召开。本次会议由中国中文信息学会语言与知识计算专业委员会主办,西华大学承办。大会分为讲习班和主会两个主要环节,其中讲习班暨中国中文信息学会《前沿技术讲习班》ATT第七期的主题是知识图谱。本次大会吸引了来自全国学术界、产业界从事知识图谱相关研究的500多人参...