首页 期刊 现代图书情报技术 基于LDA挖掘计算机科学文献的研究主题 【正文】

基于LDA挖掘计算机科学文献的研究主题

作者:杨海霞; 高宝俊; 孙含林 武汉大学经济与管理学院; 武汉430072
计算机科学   lda   主题提取   主题强度   文档聚类  

摘要:【目的】运用文本挖掘技术自动从海量科技文献中提取研究主题并探测其研究趋势。【方法】以《中文核心期刊要目总览(2014年版))-“TP自动化技术、计算机技术”栏目前10种期刊刊载的计算机科学类(ComputerScience)文献为研究对象,借助LDA主题模型,考虑科技文献的发表时间信息,挖掘出典型话题,并根据主题强度分析主题的演化趋势。【结果】18个研究话题中有7个主题强度上升的主题和6个主题强度下降的主题。【局限】仅分析了国内计算机领域的前10种期刊,期刊范围不够大,也未考虑国外计算机领域的期刊文献。【结论】该方法能够深入挖掘计算机领域期刊文献的话题,帮助从事该领域研究的学者了解主题的演化趋势并寻找新兴研究主题。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社