【免费】一种基于双向LSTM的联合学习的中文分词方法-发表之家

一种基于双向LSTM的联合学习的中文分词方法

作者：章登义; 胡思; 徐爱萍武汉大学计算机学院; 武汉430072

中文分词大规模语料库联合学习双向长短时记忆模型

摘要：针对现有的基于深度学习的神经网络模型通常都是对单一的语料库进行训练学习,提出了一种大规模的多语料库联合学习的中文分词方法。语料库分别为简体中文数据集(PKU、MSRA、CTB6)和繁体中文数据集(CITYU、AS),每一个数据集输入语句的句首和句尾分别添加一对标志符。应用BLSTM(双向长短时记忆模型)和CRF(条件随机场模型)对数据集进行单独训练和多语料库共同训练的实验,结果表明大规模的多语料库共同学习训练能取得良好的分词效果。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

中兽医医药中华转移性肿瘤中华医学遗传学中医中国仪器仪表中国疫苗和免疫中国翻译四川中医湖南中医中医研究河北中医云南中医

计算机应用研究

影响因子：0.93

期刊级别：北大期刊

发行周期：月刊

服务介绍

一种基于双向LSTM的联合学习的中文分词方法

计算机应用研究

期刊咨询

订阅杂志

期刊推荐