首页 期刊 计算机工程与设计 结合语义相似度改进LDA的文本主题分析 【正文】

结合语义相似度改进LDA的文本主题分析

作者:赵林静 中国民航飞行学院计算机学院; 四川广汉618307
评论短文本   主题分析   hownet语义相似度   lda模型  

摘要:为对评论文本进行准确的主题分类,提出一种结合HowNet语义相似度和隐含狄利克雷分配(LDA)模型的主题聚类方法。不同于传统LDA模型,该方法通过HowNet常识知识库计算输入单词与当前主题聚类中单词间的语义相似度,以此调整LDA模型中的超参数β。为不同的单词分配不同的β值,以此监督聚类过程,在主题分析中实现从语法到语义的转变。实验结果表明,该方法能够有效提高主题聚类的准确性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅