首页 期刊 情报科学 基于潜在语义索引和遗传算法的文本特征提取方法 【正文】

基于潜在语义索引和遗传算法的文本特征提取方法

作者:郝占刚; 王正欧 天津大学系统工程研究所; 天津300072
特征提取   潜在语义索引   遗传算法   kohonen网络  

摘要:本文采用潜在语义索引(LSI)和遗传算法(GA)进行文本特征提取。在采用潜在语义索引将语义关系体现在VSM(Vector Space Model)中,通过奇异值分解(SVD,Singular Value Deccvaposition)可以有效地降低向量空间的维数,但通过维数约简后的文本特征仍要保持在数百维左右,因此本文采用遗传算法在此基础上继续降维。实验结果表明,这两种方法结合可以极大的降低文本向量空间的雏数,并能提高分类准确率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅