首页 期刊 数据分析与知识发现 朴素贝叶斯算法与Bootstrapping方法相结合的中文物种描述文本语义标注研究 【正文】

朴素贝叶斯算法与Bootstrapping方法相结合的中文物种描述文本语义标注研究

作者:段宇锋; 朱雯晶; 陈巧; 崔红 华东师范大学商学院; 上海200241; 上海图书馆上海科学技术情报研究所; 上海200031; 美国亚利桑那大学信息资源与图书馆学学院; 图森85719
bootstrapping方法   朴素贝叶斯   物种描述文本   语义标注  

摘要:【目的】降低中文物种描述文本语义标注的学习成本。【方法】设计基于Bootstrapping的弱监督学习方法,以少量数据为基础,迭代执行学习和标注过程。在迭代过程中,利用置信度最高的标注数据扩充知识库,提升标注能力。【结果】运用15041条数据测试算法效率,F-value的平均值达到0.9112。【局限】对过于稀疏的数据,标注效率相对较低。【结论】本研究设计的方法不仅有效降低系统学习对训练数据规模的要求,而且可提高标注效率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅