摘要:基于文本等数据在计算机中是以二进制的形式存储而易于获取大量实验数据的情况,提出了一种基于神经网络的对二进制文本进行特征提取的模型。对获取到的二进制文本数据先使用合适大小及步长的滑动窗口进行取词处理,再使用Word2vec生成相应的词向量嵌入CNN,然后对生成的向量做降维处理,之后在池化层将其作为最后的特征进行输出,最后使用分类算法进行特征好坏的验证。相比于同领域内文本分类方法,所提方法大大提升了处理效率,且在精度和准确度上相差无几。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社