首页 期刊 计算机科学 基于LSTM和多特征组合的电影评论专业程度分类 【正文】

基于LSTM和多特征组合的电影评论专业程度分类

作者:吴璠; 李寿山; 周国栋 苏州大学计算机科学与技术学院; 江苏苏州215006
多特征组合   评论专业程度分类   神经网络   lstm   svm  

摘要:社交网络上的电影评论通常既有专业评论家写的专业评论,也有普通观众写的非专业评论,区分网络电影评论是否为专业评论对于电影质量评估有着重要的价值。由于电影评论属于短文本,用词不规范,特征稀疏,因此传统的文本特征选择方法以及传统的分类模型并不能完全适用于电影评论专业程度的分类。为此,文中主要研究基于神经网络模型电影评论的专业程度分类,即判断其是专业评论还是非专业评论。首先通过基于神经网络的LSTM模型学习不同特征的表示,包括基于词的表示、基于词性的表示,以及基于依存关系的表示,然后通过融合不同特征表示来学习和捕捉有效的文本特征,从而帮助评论专业程度分类。该方法在美国著名的影评网站烂番茄网(Rotten Tomatoes)数据集上进行实验,实验结果表明,在融合了词性和依存关系特征的模型的分类正确率达到了88.30%,比仅使用词特征的基准模型提高了3.66%。这说明在模型中引入词性特征、依存关系特征能够有效提升评论专业程度分类的效果。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅