首页 期刊 计算机应用研究 有判别力的话题字典动态生成方法 【正文】

有判别力的话题字典动态生成方法

作者:吴树芳; 朱杰; 徐建民 河北大学管理学院; 河北保定071000; 河北大学计算机科学与技术学院; 河北保定071000; 天津大学管理与经济学部; 天津300072; 中央司法警官学院信息管理系; 河北保定071000
话题字典   互信息   动态更新   目标函数  

摘要:话题字典是话题的描述特征子集,有判别力的话题字典可以在降低特征维数的同时提高对话题描述的准确性,进而提高话题识别与追踪的综合性能。以互信息为研究基础,提出了确定话题初始字典规模的目标函数,并采用坐标下降法对其求解,考虑到新闻话题是随时间动态变化、发展的,给出了融合时间信息的话题字典动态更新方法,最终得到有辨别力的话题字典。实验在TDT语料上,以漏报率、误报率为评价标准,比较了增量式TF—IDF方法与提出的话题字典生成方法的性能。实验结果显示,提出的话题字典生成方法的性能较优。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅