首页 期刊 微电子学与计算机 一种GIS的中文分词算法研究 【正文】

一种GIS的中文分词算法研究

作者:杨晓军 王一莉 南京工业大学信息科学与工程学院 江苏南京210009
地理信息系统   中文分词   trie树   哈希结构   分词词典  

摘要:提出了一种应用于GIS领域的中文分词算法.采用将首字和尾种类词用哈希表管理,其余中间字串用Trie树来实现的"首位Hash-Trie树"结构作为词典载体来实现地学词典的高效率存取操作,简化了Trie树的深度,并基于一种改进的正向最大匹配的算法,很好的解决了切分歧义和未登录词的问题.实验结果表明,该算法为GIS中文查询语句的正确理解提供了有效的语义信息.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅