首页 期刊 计算机应用研究 基于条件熵和上下文邻近度的句子排序研究 【正文】

基于条件熵和上下文邻近度的句子排序研究

作者:薛涛; 王恒 西安工程大学计算机科学学院; 西安710048
条件熵邻近度   上下文邻近度   最大权值删减排序   多文档摘要  

摘要:句子排序是多文档摘要系统中重要的任务之一,排序的质量将直接影响摘要的连贯性与可读性。当前基于时间的句子排序算法过度依赖文档的时间标签,通用性较差;基于大型语料库的句子排序算法训练过于复杂,排序质量不高。对此,提出一种基于主题文档集合的排序算法,其目的是解决不含时间标签的摘要句子排序问题。算法利用条件熵和上下文邻近度算法从源文档集合中学习句子对的关联程度与承接关系,并利用最大权值删减排序算法形成最终的排序结果。该方法只依赖于摘要句子的源文档集合,具有较强的领域通用性。实验结果表明,在现有的句子排序策略中,此方法较优。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅