首页 期刊 现代图书情报技术 朴素贝叶斯算法与Bootstrapping方法相结合的中文物种描述文本语义标注研究 【正文】

朴素贝叶斯算法与Bootstrapping方法相结合的中文物种描述文本语义标注研究

作者:段宇锋 朱雯晶 陈巧 崔红 华东师范大学商学院 上海200241 上海图书馆上海科学技术情报研究所 上海200031 美国亚利桑那大学信息资源与图书馆学学院 图森85719
bootstrapping方法   朴素贝叶斯   物种描述文本   语义标注  

摘要:【目的】降低中文物种描述文本语义标注的学习成本。【方法】设计基于Bootstrapping的弱监督学习方法,以少量数据为基础,迭代执行学习和标注过程。在迭代过程中,利用置信度最高的标注数据扩充知识库,提升标注能力。【结果】运用15041条数据测试算法效率,F-value的平均值达到0.9112。【局限】对过于稀疏的数据,标注效率相对较低。【结论】本研究设计的方法不仅有效降低系统学习对训练数据规模的要求,而且可提高标注效率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社