中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 700.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 施事的语义分布考察与动词的语义特征

    作者:陈龙; 詹卫东 刊期:2019年第01期

    在自然语言处理中,语义角色标注是一个比较重要的任务。语义角色标注任务以语义角色理论为基础。语义角色标注任务和语言学的相关理论都要求同一个动词在不同语句中相应的语义角色成分保持一致。该文统计了北京大学973课题语义角色标注语料库及中文PropBank中'施事'的语义分布,进而根据该语义分布,加上人工筛选,共找出了85个在'施事'语义角色的...

  • 采用Stack-Tree LSTM的汉语一体化依存分析模型

    作者:刘航; 刘明童; 张玉洁; 徐金安; 陈钰枫 刊期:2019年第01期

    在汉语一体化依存分析中,如何利用分词、词性标注和句法分析的中间结果作为分析特征成为核心问题,也是三个任务相互制约协调、共同提高性能的关键所在。目前无论基于特征工程的方法还是基于深度学习的方法尚无法充分利用分析过程中依存子树的完整信息,而依存子树作为中间结果的主要成分对三个任务的后续分析具有重要的指导意义。该文在基于转移...

  • 基于Lattice-LSTM的多粒度中文分词

    作者:张文静; 张惠蒙; 杨麟儿; 荀恩东 刊期:2019年第01期

    中文分词是中文信息处理领域中的一项关键基础技术,而多粒度分词是中文分词领域较新的研究方向。针对多粒度中文分词任务,该文提出一种基于Lattice-LSTM的多粒度中文分词模型,在传统基于字的多粒度中文分词模型基础上,加入了多分词粒度的词典信息。与传统模型相比,所提出的模型在网格结构的辅助下,对不同粒度的分词标准都有较强的捕捉能力,且不...

  • 基于双向LSTM与CRF融合模型的否定聚焦点识别

    作者:沈龙骧; 邹博伟; 叶静; 周国栋; 朱巧明 刊期:2019年第01期

    否定表达作为自然语言文本中常见的语言现象,对自然语言处理上层应用,如情感分析、信息抽取等,具有十分重要的意义。否定聚焦点识别任务是更细粒度的否定语义分析,其旨在识别出句子中被否定词修饰和强调的文本片段。该文将该任务作为序列标注问题,提出了一种基于双向长短期记忆网络结合条件随机场(BiLSTMCRF)的否定聚焦点识别模型,其中,BiLSTM网...

  • 基于RNN的中文二分结构句法分析

    作者:谷波; 王瑞波; 李济洪; 李国臣 刊期:2019年第01期

    为了构建一个简单易扩展的中文句法分析器,我们依据熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个3万句的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构。该文将中文句法分析转换为迭代二分的序列标注问题,并根据该任务的特点,提出了在词的间隔上进行标记的序列标注模型(RNN-Interval,RNN-INT)...

  • 基于古汉语语料的新词发现方法

    作者:刘昱彤; 吴斌; 谢韬; 王柏 刊期:2019年第01期

    新词发现,作为自然语言处理的基本任务,是用计算方法研究中国古代文学必不可少的一步。该文提出一种基于古汉语料的新词识别方法,称为AP-LSTM-CRF算法。该算法分为三个步骤。第一步,基于Apache Spark分布式并行计算框架实现的并行化的Apriori改进算法,能够高效地从大规模原始语料中产生候选词集。第二步,用结合循环神经网络和条件随机场的切分概...

  • 基于可靠词汇语义约束的词语向量表达修正研究

    作者:梁泳诗; 黄沛杰; 黄培松; 杜泽峰 刊期:2019年第01期

    词语向量表达(word vector representation)是众多自然语言处理(natural language processing,NLP)下游应用的基础。已有研究采用各种词汇分类体系提供的词汇语义约束,对海量语料训练得到的词向量进行修正,改善了词向量的语义表达能力。然而,人工编制或者半自动构建的词汇分类体系普遍存在语义约束可靠性不稳定的问题。该文基于词汇分类体系与词...

  • 融合反问特征的卷积神经网络的中文反问句识别

    作者:文治; 李旸; 王素格; 廖健; 陈鑫 刊期:2019年第01期

    反问是一种带有强烈情感色彩的表达方式,对其进行自动识别将提升隐式情感分析的整体效率。针对汉语反问句识别问题,该文分析了反问句的句式特点,将反问句的句式结构融入到卷积神级网络的构建中,提出一种融合句式结构的卷积神经网络的反问句识别方法。首先利用置信度大于70%的反问句的特征词、序列模式,对大规模未被标注的微博语料进行初步筛选,...

  • 基于篇章修辞结构的自动文摘连贯性研究

    作者:刘凯; 王红玲 刊期:2019年第01期

    尽管抽取式自动文摘方法是目前自动文摘领域的主流方法,并且取得了长足的进步,但抽取式自动文摘形成的摘要由于缺乏句子之间的合理指代或篇章结构,使得文摘缺乏连贯性而影响可读性。为提高自动摘要的可读性,该文尝试将篇章修辞结构信息应用于中文自动文摘。首先,基于汉语篇章修辞结构抽取摘要,然后使用基于LSTM的方法对文本连贯性进行建模,并使...

  • 商务印书馆新书介绍

    刊期:2019年第01期

    邢福义著ISBN:978-7-100-157360-0定价:68.00出版时间:2018年4月本书收录邢福义教授自1955年至1991年寄给父亲的信件,时间跨度37年。其中也穿插进了作者妻子谭漱谷、儿子邢孔亮和女儿邢孔昭所写信件等相关材料。全书信件,按时间顺序排列,每年为一个部分。全书反映了作者及其家人37年间的人生历程和家庭变迁,展示了作者从语言学的入门迷茫,到研究...

  • 2019年全国知识图谱与语义计算大会(CCKS2019)征稿通知

    刊期:2019年第01期

    全国知识图谱与语义计算大会(CCKS:China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专业委员会组织和承办。全国知识图谱与语义计算大会是两个全国性会议的合并:中文知识图谱研讨会the Chinese Knowledge Graph Symposium(CKGS)和中国语义互联网与Web科学大会Chinese Semantic Web and Web Scien...

  • 中国中文信息学会关于推选2019年中国科学院和中国工程院院士候选人的通知

    刊期:2019年第01期

    根据《中国科协办公厅关于组织推选2019年中国科学院和中国工程院院士候选人的通知》(科协办发组字[2019]1号),中国中文信息学会2019年两院院士遴选工作正式启动。为做好2019年院士候选人推荐(提名)工作,根据《中国科协推荐(提名)院士候选人工作实施办法(试行)》(科协发组字[2014]98号),现将有关事项通知如下.

  • 欢迎订阅《中文信息学报》

    刊期:2019年第01期

    《中文信息学报》(Journal of Chinese Information Processing)是全国一级学会———社团法人中国中文信息学会和中国科学院软件研究所联合主办的学术性刊物,创刊于1986年10月,现为单月刊。由商务印书馆出版,为商务印书馆期刊方阵中的期刊之一,清华大学印刷厂印刷。《中文信息学报》是我国计算机、计算技术类中文核心期刊。

  • 子字粒度切分在蒙汉神经机器翻译中的应用

    作者:任众; 侯宏旭; 吉亚图; 武子玉; 白天罡; 雷颖 刊期:2019年第01期

    在蒙汉神经机器翻译任务中,由于语料稀少使得数据稀疏问题严重,极大影响了模型的翻译效果。该文对子字粒度切分技术在蒙汉神经机器翻译模型中的应用进行了研究。通过BPE算法将切分粒度控制在字符和词之间的子字粒度大小,将低频词切分成相对高频的子字片段,来缓解数据稀疏问题,从而在有限的数据和硬件资源条件下,更高效地提升模型的鲁棒性。实验...

  • 面向神经机器翻译的模型存储压缩方法分析

    作者:林野; 姜雨帆; 肖桐; 李恒雨 刊期:2019年第01期

    模型存储压缩,旨在在不改变模型性能的同时,大幅度降低神经网络中过多的模型参数带来的存储空间浪费。研究人员对于模型存储压缩方法的研究大多数在计算机视觉任务上,缺乏对机器翻译模型压缩方法的研究。该文在机器翻译任务上通过实验对比剪枝、量化、低精度三种模型压缩方法在Transformer和RNN(recurrent neural network)两种模型上的模型压缩...