首页 期刊 工程科学与技术 基于统计的中文文本主题自动提取研究 【正文】

基于统计的中文文本主题自动提取研究

作者:张清军; 朱才连 中国科学院测量与地球物理研究所,湖北武汉430077
主题自动提取   特征词   加权函数  

摘要:文本主题自动提取是一种很有实用价值的技术,它可以有效地浓缩整个web页面,解决无线网络终端由于显示屏太小而无法显示整个网页的难题.总结了目前有关文本主题提取方面的研究成果,设计了一个特征词加权函数,在此函数中考虑了词所跨的段落数因子,同时采用非线性函数描述词长因子和词所跨的段落数因子的作用,并将加权函数应用于主题自动提取.实现了一个中文主题自动提取系统原型,通过对文本集的测试验证了加权函数的有效性.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅