中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 600.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 利用主语和谓语的句法关系识别谓语中心词

    作者:李国臣; 孟静 刊期:2005年第01期

    谓语口心词识别对于整个句子的句法分析起着重要的作用.目前已有的谓语中心词识别方法,利用谓语中心词候选项的静态语法特征和动态语法特征来确定谓语中心词.在此基础上,本文提出一种利用句子的主语和谓语之间的句法关系来识别谓语中心词的方法.该方法除了利用谓语中心词候选项的静态语法特征和动态语法特征外,还利用主谓语之间的句法关系识别谓...

  • 一种改进的基于记忆的自适应汉语语言模型

    作者:张俊林; 孙乐; 孙玉芳 刊期:2005年第01期

    基于记忆的自适应语言模型虽然在一定程度上增强了语言模型对不同领域的适应性,但其假设过于简单,即认为一个在文章的前面部分出现过的词往往会在后面重复出现.通过对一些文本的观察分析,我们认为作者在书写文章的时候,除了常常使用前文中出现过的词汇外,为了避免用词单调,还会在行文过程中使用前文出现过词汇的近义词或者同义词.另外,一篇文章...

  • 汉语中的零形回指及其在汉英机器翻译中的处理对策

    作者:侯敏; 孙建军 刊期:2005年第01期

    回指是语篇衔接的重要手段,零形回指是汉语中常见的一种回指形式.由于汉语、英语是不同类型的语言,因此零形回指对汉英机器翻译会产生一定的影响.本文详细分析了汉语零形回指的确认、类型、产生的原因及使用的条件,指出其对汉英机器翻译造成的主要障碍是生成的英语句子在结构上不合语法,并提出在句组层面上解决问题的算法.

  • 基于词类串的汉语句子结构相似度计算方法

    作者:王荣波; 池哲儒 刊期:2005年第01期

    句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容.对于基于实例的汉英机器翻译研究,汉语句子相似度衡量的准确性,直接影响到最后翻译结果的输出.本文提出了一种汉语句子结构相似性的计算方法.该方法比较两个句子的词类信息串,进行最优匹配,得到一个结构相似性的值.在小句子集上的初步实验结果表明,该方法可行,有效,符合人的直观判断.

  • 从搭配知识获取最优种子的词义消歧方法

    作者:全昌勤; 何婷婷; 姬东鸿; 刘辉 刊期:2005年第01期

    基于统计的词义消歧模型的一个关键问题是如何自动从语料库中获取指示词,虽然通过学习初始搭配实例能够在语料库中获取更多的搭配知识,但人工获取质量较好的初始搭配是比较困难的,并且无法保证有效的扩大搭配知识.针对该问题,提出了通过机器学习初始搭配实例获取最优种子,再由最优种子扩增更多指示词,最后利用这些指示词实现具有多个义项的多义...

  • 基于向量空间模型的文本分类系统的研究与实现

    作者:陈治纲; 何丕廉; 孙越恒; 郑小慎 刊期:2005年第01期

    文本分类是信息处理的一个重要的研究课题,它可以有效的解决信息杂乱的现象并有助于定位所需的信息.本文综合考虑了频度、分散度和集中度等几项测试指标,提出了一种新的特征抽取算法,克服了传统的从单一或片面的测试指标进行特征抽取所造成的特征"过度拟合"问题,并基于此实现了二级分类模式的文本分类系统.和类中心分类法相比,实验结果表明二级...

  • 信息检索策略性能的云模型评价方法

    作者:康海燕; 李彦芳; 林培光; 樊孝忠 刊期:2005年第01期

    在信息检索中,目前常见的评价方法仅能反映检索策略的平均性能,不能反映策略的稳定性、随机性等问题,因此对检索策略的评价不够全面.本研究提出了基于云模型的检索策略评价方法,该方法建立了定性评价和定量数据之间的自然转换,这种转换是通过严格的数学方法来实现的,用该方法评价检索策略,不仅能反映策略的平均性能,而且能反映策略的稳定性.实验...

  • 基于内容和合作模式的信息推荐机制

    作者:林鸿飞; 杨志豪; 赵晶 刊期:2005年第01期

    如何根据用户的兴趣向用户推荐相关信息成为目前研究的热点,本文提出了基于内容和合作模式的信息推荐机制.其基本思想是根据用户所关心的文本内容将用户划分为不同的内容类,同时按照用户的访问模式以及用户评注的一致性,将用户分成不同的合作类.综合考虑其内容类和合作类对于用户评注影响,利用Fisher判别分析,给出了信息推荐机制,将相关文本推送...

  • 自然语言文本水印

    作者:张宇; 刘挺; 恒; 赵世奇; 李生 刊期:2005年第01期

    本文主要介绍了基于自然语言处理的文本水印技术,也即自然语言文本水印技术.该技术是在不改变文本原意的前提下,将需要隐藏的文本信息(水印信息)插入到原始文本中的一种信息隐藏技术.这种技术对于确认信息来源和信息的秘密传送,以及版权维护等方面都有着很大的应用价值.本文首先给出了基于自然语言处理技术的文本水印的概念、特点及攻击模型,并...

  • 知网与同义词词林的信息融合研究

    作者:梅立军; ; 臧路; 陈祖舜 刊期:2005年第01期

    本文主要探讨了将知网(HowNet)和同义词词林进行信息融合的方法.我们针对知网对词的概念描述和同义词词林对词的语义分类的特点,提出了一种词典信息融合的方法:首先为词林的每个词集确定一个与知网中DEF类似的概念描述,在此基础上对两部词典中同时收录且均只有一个义项的词语进行双向意义联结,最后根据分类算法对两部词典中同时收录非单一义项的...

  • 现代藏字全集的属性统计研究

    作者:高定国; 龚育昌 刊期:2005年第01期

    藏文基本属性的研究是藏文信息处理技术的基础,现代藏字的研究是藏文信息处理的重点.藏字全集是有限集,为了更好地研究现代藏字,本文以现代藏字为研究对象,按照现代藏文文法的规律,对全部现代藏字用计算机辅助统计了藏字全集的个数、藏字的字长、藏字的结构方式、位置特征、字符频度以及所有现代藏字中的整基字丁,并且简要地分析了这些数据.这些...

  • 汉语口语对话系统中语义分析的消歧策略

    作者:刘蓓; 杜利民 刊期:2005年第01期

    框架语义分析是目前汉语口语对话系统中常用的语义解析方法,本文分析了语义分析过程中容易产生的两种典型歧义现象-结构歧义和语义关系歧义.并针对这两种歧义结构,分别提出基于语义PCFG模型的结构歧义消歧策略以及基于语义期待模型EM的语义关系歧义消歧策略,并给出了有效的消歧算法.实验结果表明综合运用本文提出的消歧策略后,基线系统理解模块...

  • 多项式回归的汉语时长预测模型

    作者:孙璐; 胡郁; 王仁华 刊期:2005年第01期

    时长信息是韵律的重要组成部分,对于语音合成的自然度和可懂度都有不可忽视的作用.时长预测是建立对时长有影响的韵律环境与自然语流中音段时长的对应关系.本文引入了统计学中eta squared的概念研究汉语中韵律环境因素对时长的影响,设计了残差算法定量分析属性之间的交互作用,由此建立了多项式回归的汉语时长预测模型.实验结果表明,使用5~6个韵...

  • 基于凸包像素比特征的粘连汉字切分

    作者:魏湘辉; 马少平 刊期:2005年第01期

  • 第六届汉语词汇语义学研讨会(CLSW6)

    刊期:2005年第01期