首页 期刊 计算机科学 利用prefix—hash—tree实现从中文文本到事务数据的转换 【正文】

利用prefix—hash—tree实现从中文文本到事务数据的转换

作者:钱铁云; 王元珍; 冯小年 华中科技大学计算机学院数据库与多媒体技术研究所; 武汉; 430074; 中国电力财务有限公司华中分公司; 武汉; 430077
中文文本   hash   事务   自动文本分类   电子文档  

摘要:电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战.在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法.为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix-hsh-tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法都具有较好的效率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅