中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 600.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 借重于人工知识库的词和义项的向量表示:以HowNet为例

    作者:孙茂松; 陈新雄 刊期:2016年第06期

    该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无法获得。该文提出了融合HowNet和大规模语料库的义原向量学习神经网络模型,并以义原向量为桥梁,自动得到义项向...

  • 语义角色映射为句法成分的词汇语义制约规律及特点

    作者:亢世勇; 张晨 刊期:2016年第06期

    该文以联接理论、事件结构理论为指导,进行词汇语义类、语义角色、句法成分对应关系的研究。选择人教社中小学语文课文语料,标注语义角色、句法成分及中心词的词汇语义类。在标注语料库的基础上,统计分析了词汇语义类与语义角色的对应关系,重点分析各语义类语义角色映射为句法成分的规律,并进一步总结了各词汇语义类的语义角色与句法成分的对应...

  • 细粒度与可视化的“比”字句分析模型及计算应用

    作者:朴敏浚; 袁毓林 刊期:2016年第06期

    针对现有五元组比较句语义要素框架的缺陷,该文引进了提升语义分辨率的七元组语义要素分类模板。在此基础上建立了一个可视化的"比"字句结构分析模型,用以总结出比较对象之间的三种对应模式,并确立了判定"不对称比较"的形式标准。该文的可视化分析模型可以明确阐述"比"字句内部的多重述谓结构,有助于获取容易被忽略或认错的隐含成分及比较...

  • 汉语未登录词的词义知识表示及语义预测

    作者:田元贺; 刘扬 刊期:2016年第06期

    在此前的汉语未登录词语义预测中,构词相关的知识一直被当做预测的手段,而没有被视为一种有价值的知识表示方式,该文在"语素概念"基础上,深入考察汉语的语义构词知识,给出未登录词的"多层面"的词义知识表示方案。针对该方案,该文采用贝叶斯网络方法,构建面向汉语未登录词的自动语义构词分析模型,该模型能有效预测未登录词的"多层面"的词义...

  • 基于声调核参数及DNN建模的韵律边界检测研究

    作者:林举; 解焱陆; 张劲松; 张微 刊期:2016年第06期

    韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分的声学特征来计算边界检测相关参数。然后,利用深度神经网络进行建模。作为对比,实验中采用了以整个音节的声...

  • 面向深层语义表示的否定义表达规律探析

    作者:邱立坤; 黄焜; 何保荣; 亢世勇 刊期:2016年第06期

    否定义是深层语义表示中的一个重要组成部分。该文基于语料库的方法对现代汉语中的否定表达形式及其使用规律进行深入分析。首先,系统地收集否定表达形式,将之分为显性否定词、隐性否定词、否定结构三类,并讨论否定表达形式的非否定用法。其次,对否定表达形式的使用规律进行归纳与总结,涉及单动核结构、情态成分、述补结构、动词性并列结构、连...

  • 基于70年报刊语料的现代汉语历时稳态词抽取与考察

    作者:饶高琦; 李宇明 刊期:2016年第06期

    该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚词),平均词长约1.7字,前密后疏地分布于历时语料库总频序表的前7 609位,覆盖了总语料的近九成。该部分词语中...

  • CRFs融合语义信息的英语功能名词短语识别

    作者:马建军; 裴家欢; 黄德根 刊期:2016年第06期

    名词短语识别在句法分析中有着重要的作用,而英汉机器翻译的瓶颈之一就是名词短语的歧义消解问题。研究英语功能名词短语的自动识别,则将名词短语的结构消歧问题转化成名词短语的识别问题。基于名词短语在小句中的语法功能来确定名词短语的边界,选择商务领域语料,采用了细化词性标注集和条件随机域模型结合语义信息的方法,识别了名词短语的边界...

  • 限定领域口语对话系统中的商品属性抽取

    作者:叶大枢; 黄沛杰; 邓振鹏; 黄强 刊期:2016年第06期

    按功能或问题域划分,商品属性抽取(product feature mining)在限定领域的对话系统中属于口语语言理解(spoken language understanding,SLU)的范畴。商品属性抽取任务只关注自然文本中描述商品属性的特定部分,它是细粒度观点抽取(fine-grained opinion mining)的一个重要的子任务。现有的商品属性抽取技术主要建立在商品的评论语料上,该文...

  • 基于DNN的汉语框架识别研究

    作者:赵红燕; 李茹; 张晟; 张力文 刊期:2016年第06期

    框架识别是语义角色标注的基本任务,它是根据目标词激起的语义场景,为其分配一个合适的语义框架。目前框架识别的研究主要是基于统计机器学习方法,把它看作多分类问题,框架识别的性能主要依赖于人工选择的特征。然而,人工选择特征的有效性和完备性无法保证。深度神经网络自动学习特征的能力,为我们提供了新思路。该文探索了利用深度神经网络自动...

  • 基于分布式表示和多特征融合的知识库三元组分类

    作者:安波; 韩先培; 孙乐; 吴健 刊期:2016年第06期

    三元组分类是知识库补全及关系抽取的重要技术。当前主流的三元组分类方法通常基于TransE来构建知识库实体和关系的分布式表示。然而,TransE方法仅仅适用于处理1对1类型的关系,无法很好的处理1对多、多对1及多对多类型的关系。针对上述问题,该文在分布式表示的基础上,提出了一种特征融合的方法—TCSF,通过综合利用三元组的距离、关系的先验概率...

  • 基于认知属性库的原型范畴研究

    作者:李斌; 宋丽; 银思琪; 曲维光; 王萌 刊期:2016年第06期

    原型范畴是认知科学研究中的重要理论,使用属性来区分范畴中心成员及边缘成员有着较强的解释力,但该理论一直缺乏基于频率信息的属性数据支撑。该文借助认知属性库的23万条数据,对原型理论研究中经常讨论的"鸟"、"水果"、"交通工具"等范畴的典型成员和非典型成员进行分析验证。认知属性库的数据显示,在汉语中,"鸟"的典型成员是"麻雀"...

  • 中国英语学习者花园幽径句错位效应强度研究:计算语言学视角

    作者:杜家利; 于屏方 刊期:2016年第06期

    该文借助126名英语专业大二学生对100个花园幽径句和对照句的限时理解实验,讨论了中国英语学习者在解读花园幽径句过程中产生的错位效应,测算了效应强度,并与stanford parser的自动翻译进行了人机对比研究。花园幽径现象是一种有意识的受控行为。其编码和解码具有行进错位和认知过载现象,并能反映人类复杂的心理认知活动。实验证明:在划分的引...

  • 双语者加工汉语母语语义时对英语的ERP激活效应的研究

    作者:杨思琴; 江铭虎 刊期:2016年第06期

    本研究采用ERP实验,以被试的反应时间、错误率和脑电成分N400为参考因素,探索高级双语者在加工第一语言时是否自动检索第二语言。结果显示,内隐的英语首发音条件引起的效应没有体现在反应时间上。在ERP实验结果中,被试在判断语义相关的词语时,大脑语言区域的N400在词语英译首发音一致与否的情况下差异不显著;而判断语义无关的词语时,N400在该条...

  • 基于语义角色标注的汉语句子相似度算法

    作者:田堃; 柯永红; 穗志方 刊期:2016年第06期

    在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来...