首页 期刊 国家图书馆学刊 基于聚类分析的自然语言叙词表的自动构建 【正文】

基于聚类分析的自然语言叙词表的自动构建

作者:杜慧平; 何琳; 侯汉清 南京农业大学信息科技学院情报学在读硕士; 南京农业大学人文学院农业科技史信息组织专业在读博士; 南京农业大学信息管理系
叙词表   自然语言   信息检索   自动构建   概念空间  

摘要:叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系。手工编制词表费事费时,智力要求高,难以克服认知瓶颈。词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联。构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等。其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析三个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义。参考文献19。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅