中文信息学报

中文信息学报杂志 北大期刊 CSCD期刊 统计源期刊

Journal of Chinese Information Processing

杂志简介:《中文信息学报》杂志经新闻出版总署批准,自1986年创刊,国内刊号为11-2325/N,是一本综合性较强的科学期刊。该刊是一份月刊,致力于发表科学领域的高质量原创研究成果、综述及快报。主要栏目:综述、语言资源建设、机器翻译、信息抽取与文本挖掘、情感分析与社会计算、自然语言理解与生成

主管单位:中国科学技术协会
主办单位:中国中文信息学会;中国科学院软件研究所
国际刊号:1003-0077
国内刊号:11-2325/N
全年订价:¥ 600.00
创刊时间:1986
所属类别:科学类
发行周期:月刊
发行地区:北京
出版语言:中文
预计审稿时间:1-3个月
综合影响因子:1.62
复合影响因子:0.84
总发文量:1895
总被引量:17085
H指数:55
引用半衰期:4.2826
立即指数:0.0496
期刊他引率:0.7957
平均引文率:13.8099
  • 汉语句法树库标注体系

    刊期:2004年第04期

    语料库的句法标注是语料库语言学研究的前沿课题.本文在研究和总结国内外句法树库标注实践的基础上,提出了一套汉语真实文本的句法树标注体系.它以完整的层次结构树为基础,对句法树上的每个非终结符节点都给出两个标记:成分标记和关系标记,形成双标记集的句法信息描述体系.目前,这两个标记集分别包含了16和27个标记,对汉语句子的不同句法组合的...

  • 《中文信息处理若干重要问题》

    作者:徐波; 孙茂松; 靳光瑾 刊期:2004年第04期

    2002年9月国家重大基础研究计划(“973”计划)项目“图像、语音、自然语言理解与知识挖掘”(项目编号:G19980305)专家组在京举行了“自然语言处理若干重要问题学术研讨会”。在此基础上编者邀请了中文信息处理领域的众多专家分别从中文信息处理的理论和方法、

  • 基于规则的自动分类在文本分类中的应用

    作者:李渝勤; 孙丽华 刊期:2004年第04期

    文本自动分类是指将文本按一定的策略归于一个或多个类别中的应用技术.本文首先介绍三种基于统计的自动分类技术(k近邻分类器、支持向量机分类器和朴素贝叶斯分类器),剖析了基于统计的自动分类的优势及不足.基于统计的自动分类的不足主要表现为:当类别之间分类特征的交叉变大时,分类精度呈下降趋势,在多层分类的情况下,此局限尤为突出.针对此局...

  • 半结构化中文信息检索中查询结果相关度算法的研究

    作者:曲卫民; 孙乐; 孙玉芳 刊期:2004年第04期

    本文研究了对富含文本信息的XML数据进行基于关键字的查询时,查询结果与查询条件之间相关度的计算问题,分析了利用传统信息检索技术解决该问题时存在的一些不足,提出了一种基于节点的动态的关键字权重计算法,以及综合考虑关键字在查询结果中的频率分布特征和结构分布特征的查询结果相关度计算法,有效解决了XML数据中的结构信息对相关度计算的影...

  • 基于转换的时间一事件关系映射

    作者:王昀; 苑春法 刊期:2004年第04期

    近些年来,中文时间信息抽取和处理已经变得越来越重要。然而,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法,本文采用了一种机器学习的方法一基于转换的错误驱动学习一来确定事件相应的时间表达,这种学习算法可以自动的获取和改...

  • 基于机器理解的汉语隐喻分类研究初步

    作者:杨芸; 周昌乐; 王雪梅; 戴帅湘 刊期:2004年第04期

    本文将汉语隐喻分类计算模型的研究引入汉语的机器理解当中,通过对大规模汉语隐喻语料的研究分析,结合汉语隐喻的认知特征,笔者构建了一套基于理解的汉语隐喻分类体系.分类主要以汉语隐喻句中本体和喻体的内在相似性作为切入点,从隐喻理解的方式、理解的难易程度以及理解所涉及的相关知识结构等方面进行综合分析,同时,辅以真实语料的统计分析,对...

  • 基于互连网的术语定义获取系统

    作者:许勇; 荀恩东; 贾爱平; 宋柔 刊期:2004年第04期

    文中介绍了一个实验性的基于互联网的术语定义获取系统,可以方便、迅速的从互连网上查找术语的定义以及与定义有关的内容,给用户迅速获得新生术语以及新技术词汇的定义方面的知识提供方便.系统采用一组术语定义的语言学模式,以多线程方式高效下载网页,并从中匹配符合术语定义模式的文本段落,再经一定后续处理,形成返回给用户的结果.系统中使用的...

  • 灰度图像中字符切分方法的研究

    作者:陈艳; 孙羽菲; 张玉志 刊期:2004年第04期

    字符切分目前已经成为限制OCR技术发展的瓶颈,对于图像质量较差、中英文混排和背景色变化的文本图像,传统切分方法造成的切分错误使得文字识别率大大降低.针对这些问题,本文提出了新型文字切分方法.该方法先将灰度图像的灰度值进行分级处理,再根据分级连通域的概念把整个图像构造成树状结构,然后确定主层次级别,根据一定的规则在部分节点上进行...

  • 基于规则库的汉字输入法自动评测系统的设计

    作者:张玉华; 周克兰 刊期:2004年第04期

    汉字编码输入法是汉字输入电脑的主要方式.对输入法进行科学评价,从而帮助软件开发人员和输入法用户进行自我改进或评估,有其十分积极的意义.本文在实际应用基础上,提出了通过汉字输入系统输入规则库的建立,在选定的输入法状态下,通过计算机自动模拟汉字输入得到输入法码本,并以码本为基础根据信息技术国家标准完成输入法性能自动评价的思路.

  • 一种计算汉字串之间相关程度的新方法

    作者:曹娟; 周经野 刊期:2004年第04期

    本文提出了一种能更准确的反映两个汉字串之间相关程度的新概念--黏结度,并给出了其计算方法.该方法把需要计算相关程度的汉字串放在一个大环境中进行讨论,通过加入上下文信息来提高分词的准确度;另外,该方法在引用汉字词频时,增加了对动态词频的考虑,可以自动识别未登陆的专业词汇.文中同时给出了黏结度在分词领域中的应用实例.通过与前人提出...

  • 《信息处理用GB13000.1字符集汉字部件规范》在输入法应用中的难点讨论

    作者:张小衡 刊期:2004年第04期

  • 自然言语的韵律组织中的不确定性及其在语音合成中的应用

    作者:初敏 刊期:2004年第04期

    本文对自然言语的韵律组织中的不确定性及其对合成语音自然度的影响进行了初步探讨,并在此基础上,提出在韵律预测中用最小错误概率准则代替传统的最大生成概率准则,从而在预测结果中保留多种等价的韵律实现.本文还进一步提出一种将基于最小错误准则的韵律预测与单元选择结合的算法,首先根据最小错误准则在所有候选单元中筛选出最不可能造成韵律...

  • 盲人用计算机软件系统中的语音和自然语言处理技术

    作者:庄丽; 包塔; 朱小燕 刊期:2004年第04期

    本文介绍了智能技术与系统国家重点实验室开发的"北极光"盲人用计算机软件系统中涉及的语音和语言处理技术.该系统能够获取和分析需要反馈的屏幕信息,通过语音合成平台将其内容朗读出来,对用户进行语音提示;与汉语自动分词、语言模型等自然语言处理技术的结合,使系统能够进行汉字和盲文的转换,反馈信息可以通过盲文点显器输出,使用户能够摸读盲...

  • 多模式汉语连续语音识别中视觉特征的提取和应用

    作者:刘鹏; 王作英 刊期:2004年第04期

    本文对在汉语多模式汉语语音识别系统中利用视觉特征进行了研究,给出了基于多流隐马尔科夫模型 (Multi-stream HMM, MSHMM)的听视觉融合方案,并对有关视觉特征的两项关键技术:嘴唇定位和视觉特征提取进行了详细讨论.首先,我们研究了基于模板匹配的嘴唇跟踪方法;然后研究了基于线性变换的低级视觉特征,并与基于动态形状模型的特征作了比较;实...