首页 期刊 中文信息学报 MHW蒙古文脱机手写数据库及其应用 【正文】

MHW蒙古文脱机手写数据库及其应用

作者:范道尔吉; 高光来; 武慧娟 内蒙古大学计算机学院; 内蒙古呼和浩特010021; 内蒙古大学电子信息工程学院; 内蒙古呼和浩特010021
蒙古文   手写识别   字库   hmm   lstm  

摘要:建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5 000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5 000样本,测试集Ⅱ包含14 085样本。该文利用蒙古文文字长度可变特征研究了自动错误检测算法,提高了字库的可靠性。在三种常用手写识别模型上评估了字库的性能,其中基于循环神经网络的模型表现出最佳性能,在字典受限条件下测试集Ⅰ的词错误率达到2.20%,测试集Ⅱ达到了5.55%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅